Python으로 워드클라우딩(1/2)

박하늘·2020년 8월 30일
0

Python

목록 보기
1/1
post-thumbnail

  이 글은 워드 클라우드란 무엇인지, Python을 이용해 워드 클라우드를 어떻게 쓰는지 실습과 응용이 포함되어 있습니다.

🤔워드 클라우드란?

  • 빅데이터 시각화 기술 중 하나
  • 수집된 단어들을 기반으로 단어마다 가중치를 부여하고 중요도를 표현
  • 중요도 높은 단어는 중요도 낮은 단어보다 굵고 가운데로 표현
  • 태그 클라우드라고도 부름

👩🏻‍💻워드 클라우드 실습 - 외부 라이브러리 설치

  • 파이썬 개발 툴
    • PyCharm Community Edition 사용
  • 외부 라이브러리 설치 방법
    • PyCharm Community Edition의 터미널을 통해 설치

워드 클라우드 실습하기 위한 외부 라이브러리 설치

외부 라이브러리 설치
  • 파이썬은 기본적으로 제공하는 라이브러리는 워드 클라우드 등 시각화 기술을 제공하고 있지 않다.
  • 따라서 워드 클라우드를 사용하기 위해서는 반드시 외부 라이브러리를 설치해야한다.

  • 설치할 외부 라이브러리
        
  • wordcloud 라이브러리 : 워드 클라우드 처리를 위한 라이브러리
  • matplotlib 라이브러리 : 그래프 등 시각화하기 위한 라이브러리

  • 한국어 폰트 설치
        
  • 파이썬에서 외부 라이브러리를 사용할 때, 한국어 인식이 잘 안되는 경우가 많기 때문에 한국어 폰트를 설치해야한다.
  • 나는 네이버 나눔폰트를 설치했다.

  • 1. wordcloud 라이브러리 설치
  • 설치 명령어 : pip install wordcloud
  •  여기서, pip 명령어가 실행되지 않고 interpreter 부분이 python으로 되어 있지않다면 python을 설치해주어야한다.(3.8)
    python을 설치하고 Pycharm을 다시 키면 자동으로 연결된다.

    2. matplotlib 라이브러리 설치
  • 설치 명령어 : pip install matplotlib

  • 👨🏻‍💻워드 클라우드 실습 - 프로그래밍

    1. 워드 클라우드 프로그래밍

      #font를 나눔체로 다운 받았으면 그 다운받은 경로를 font_path뒤에 적어줘야 한다.
      #여기서 background_color는 white로 하는 것이 좋다.(그 이유는 후에 나올 예정이다.)

      실행결과

    2. 알아두기

    3. Imshow 옵션

    🧐워드 클라우드 응용 - STOPWORDS

    • 원하지 않는 단어들 제외하는 기능 추가

    • wordcloud 외부라이브러리의 STOPWORDS 기능 사용
    • 원하지 않는 단어들 정의하는 로직 추가

    • 워드 클라우드 생성할 때 원하지 않는 단어들 정의한 변수 값 넣고 실행

      실행결과

    profile
    공부중인 학생

    0개의 댓글