개요
WordCloud
- 핵심 단어를 시각화하는 기법
- 문서에서 키워드, 개념 등을 직관적으로 파악 가능
실습
msg='''
cherry 제리톰은 cherry 월요일 leurto adslfj 가을 cherry 월요일 bigdata
일요일 sld 제리는 jfldf 월요일 leurto monday 봄 여름 가을 겨울으로 톰톰
일요일 803 ldfjlqwewtry upu fdgjld
cherry 일요일 sld cherry bigdata 월요일 leurto bigdata
monday weoripti cherry 제리와톰 bigdata
monday 제리와톰톰은 가을 koetiet 9734 234 월요일 톰 제리톰 adslfj cherry 월요일
bc 월요일 하늘 bigdata 월요일 eirp cherry weoripti 월요일
월요일 upu 우박 우박 천둥번개
cherry cherry bigdata 톰과제리리 천둥번개 원숭이
우박이 내리면서 천둥번개 가 치네
월요일 우박이 내리네
'''
mystop = ['의','가','이','은','들','는','좀','잘','걍','과','도','를','으로','자','에','와','한','하다', '그','너','나','테','니','뇨',]
stopwords = set(STOPWORDS)
for i in mystop:
stopwords.add(i)
wc = WordCloud(stopwords=stopwords, width = 800, height = 800 ,font_path='c:/windows/Fonts/malgun.ttf', colormap= 'Accent_r',background_color='black')
wc.generate(msg)
plt.imshow(wc)
plt.axis('off')
plt.show

- 앨리스.txt를 이용한 wordcloude
- 마스크는 구름 모양 이용
path = './data/alice.txt'
wcmask = np.array(Image.open('./data/cloud.png'))
all_words = []
text = open(path, 'r', encoding= 'utf-8').read()
wc = WordCloud(font_path='malgun.ttf', background_color='white', width=800, height=400, mask=wcmask)
wc.generate(text)
plt.imshow(wc)
plt.axis('off')
plt.show
