-
Python - wordcloud 만들기IT 인터넷/Python 2020. 10. 4. 13:10SMALL
처음부터 여담을 이야기 하자면,
Python을 시작한 게 워드클라우드를 만들어 보려고 했었던 것이다
그동안은 인터넷에서 기자들이 사용하는 사이트이던가?!
무료로 해주는 데가 있었는데, 직접 만들어 보겠단 의지?! 업무 상 필요성?!이 있었더랬다
그래서 짬짬이 자료를 찾아두고는 있었지만,
작업하는 오늘! 구글링 첫 클릭 자료가 좋아서 바로 시작했다 (https://imworld.tistory.com/59)
처음부터 여담을 이야기한 건, 처음해 보니까 참고 사이트 데로 안되길래,
열심히 구글링하며 자료조사하고 내 상황과 맞추다 보니까, 어느 정도 이해를 했고,
결국 참고 사이트로 다시 돌아와 시도하니 잘 되어 마무리하였던 것이다
(처음엔 왜 안되었지 ㅠㅠ) 아뭏든 공부(?!) 엄청 되었다
그래서 이번 글에서 코드 언급은 하지 않으련다 (참고 사이트 보면 되니까)
다만, 시행착오 겪었던 것을 기록하여 공유하고자 한다
1. 아! 참고 사이트에서는 환경설정은 설명 않으셨다. 그래서 다음을 찾아 설치했다
pip install wordcloud
pip install matplotlib (<< 참고 : https://khann.tistory.com/60)2. 데이터를 직접 만드셨다, 무려
가. 2010-2018년간 일기를 텍스트화
나. 텍스트화된 데이터를 긍정 vs 부정으로 분류
> 저는 테스트가 목적이라 일단 아이디어 메모장을 사용했습니다
3. 클라우드로 만들 텍스트 파일 불러오기
> 동일한 코드를 사용했었는데, 저는 첫 줄만 읽는 오류 발생;;
파이썬 파일 불러오기를 찾아보고 이것저것 적용해 봤는데,
내용 다 불러오더니 무한 읽어오기 반복하는 루프 ㅠㅠ
> 솔직히 에러가 어떻게 해결되었는지 모르겠음;;
> 이것저것 적용하다가 참고 사이트의 초기 코드를 사용했더니 그냥 됨;;;
4. 형태소 나누기
가. 이 코드 실행하면, 실행은 되는데,
Twitter(twitter) 명령어가 바뀌었다고 나옵니다
(아무래도 글 쓰신 날 이후 저는 최신본을 사용하니까요)
나. 출력된 정보란을 참고해, Twitter(twitter)를 Okt(okt)로 변경해 사용했습니다
(안바꿔도 메시지만 출력되고 실행은 됩니다!)
5. 명사, 형용사, 부사만 골라내기, 6. 빈도수대로 정렬하기 그리고 7. 워드 클라우드 만들기 - 디스플레이 설정
가. 복붙의 힘, 이 부분은 잘 되었다
8. 워드 클라우드 만들기 - 워드클라우드 최종 코드 (2가지 문제 발생하여 처리)
가. 폰트가 문제였다.
나는 없는 폰트였는지 인식 안되어, 삭제하니, 글자가 네모 박스로만 뜨고,
대충 C안에 폰트 안에 국문 폰트 하나를 골라 입력하니 인식이 안되더라;;
그래서 네이버무료폰트를 다운받아 설정하니, 완료 (https://hangeul.naver.com/2017/nanum)
나. 그런데 SyntaxError가 뜬다;; 그래서 경로 표시를 \ 가 아닌 / 으로 처리해서 해결했다
다. 참고로 마지막 괄호에 words 넣어주라고 써 놓으셨는데, 난 이걸 처음에 못 읽어서 시간 엄청 걸렸다;;
마지막에 내가 넣은 데이터로 워드클라우드를 띄우니 감회가 새록하더라
그리고 엄청난 허기짐을 느껴서 밥을 2번 먹었다는;;
이렇게 하루 반나절 동안 블로그 2개 쓸 정도로 작업을 했습니다
LIST'IT 인터넷 > Python' 카테고리의 다른 글
Anaconda에 koNLpy 설치하기 (0) 2020.10.03