이 글은 워드 클라우드란 무엇인지, Python을 이용해 워드 클라우드를 어떻게 쓰는지 실습과 응용이 포함되어 있습니다.
🤔워드 클라우드란?
- 빅데이터 시각화 기술 중 하나
- 수집된 단어들을 기반으로 단어마다 가중치를 부여하고 중요도를 표현
- 중요도 높은 단어는 중요도 낮은 단어보다 굵고 가운데로 표현
- 태그 클라우드라고도 부름
👩🏻💻워드 클라우드 실습 - 외부 라이브러리 설치
- 파이썬 개발 툴
- PyCharm Community Edition 사용
- 외부 라이브러리 설치 방법
- PyCharm Community Edition의 터미널을 통해 설치
워드 클라우드 실습하기 위한 외부 라이브러리 설치
외부 라이브러리 설치
파이썬은 기본적으로 제공하는 라이브러리는 워드 클라우드 등 시각화 기술을 제공하고 있지 않다.
따라서 워드 클라우드를 사용하기 위해서는 반드시 외부 라이브러리를 설치해야한다.
설치할 외부 라이브러리
wordcloud 라이브러리 : 워드 클라우드 처리를 위한 라이브러리
matplotlib 라이브러리 : 그래프 등 시각화하기 위한 라이브러리
한국어 폰트 설치
파이썬에서 외부 라이브러리를 사용할 때, 한국어 인식이 잘 안되는 경우가 많기 때문에 한국어 폰트를 설치해야한다.
나는 네이버 나눔폰트를 설치했다.
1. wordcloud 라이브러리 설치
설치 명령어 : pip install wordcloud
여기서, pip 명령어가 실행되지 않고 interpreter 부분이 python으로 되어 있지않다면 python을 설치해주어야한다.(3.8)
python을 설치하고 Pycharm을 다시 키면 자동으로 연결된다.
2. matplotlib 라이브러리 설치
설치 명령어 : pip install matplotlib
👨🏻💻워드 클라우드 실습 - 프로그래밍
-
워드 클라우드 프로그래밍
#font를 나눔체로 다운 받았으면 그 다운받은 경로를 font_path뒤에 적어줘야 한다.
#여기서 background_color는 white로 하는 것이 좋다.(그 이유는 후에 나올 예정이다.)
실행결과
-
알아두기
- Imshow 옵션
🧐워드 클라우드 응용 - STOPWORDS