!conda update conda
!pip install --upgrade pip
!pip install konlpy
!pip install tweepy==3.10.0
!conda install -y -c conda-forge jpype1==1.0.2
!conda install -y -c conda-forge wordcloud
!conda install -y nltk
!conda install -y scikit-learn
import nltk
nltk.download()

-> puntk, stopwords 다운로드
from konlpy.tag import Kkma
from konlpy.tag import Hannanum
from konlpy.tag import Okt
한글을 쉽게 분석할 수 있게 해주는 패키지


-> 어절과 음절 사이의 것
-> 언어의 최소 의미 단위
from wordcloud import WordCloud, STOPWORDS
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
from matplotlib import font_manager, rc
text = open(r"E:\zerobase\data\nltk\06_alice.txt").read()
print(text)
alice_mask = np.array(Image.open(r"E:\zerobase\data\nltk\06_alice_mask.png"))

-> 출력 형태가 넘파이임을 확인!
stopwords = set(STOPWORDS)
stopwords
-> 불용사전인듯
출력

wc.generate(text) 부분에서 폰트 관련 오류가 나는 문제가 있다. (ValueError: Only supported for TrueType fonts)