WordCloud

Doya·2025년 4월 14일

ESTSOFT_AI개발7기

목록 보기
31/43

개요

  • WordCloud

WordCloud

  • 핵심 단어를 시각화하는 기법
  • 문서에서 키워드, 개념 등을 직관적으로 파악 가능

실습

msg='''  
cherry 제리톰은 cherry 월요일 leurto  adslfj 가을 cherry 월요일  bigdata
일요일 sld 제리는 jfldf 월요일 leurto  monday  봄 여름 가을 겨울으로 톰톰
일요일 803 ldfjlqwewtry upu fdgjld
cherry 일요일 sld cherry bigdata 월요일 leurto  bigdata 
monday  weoripti cherry 제리와톰  bigdata
monday 제리와톰톰은 가을 koetiet 9734 234 월요일 톰 제리톰 adslfj cherry 월요일
bc  월요일 하늘 bigdata 월요일 eirp cherry weoripti 월요일 
월요일  upu 우박 우박 천둥번개 
cherry  cherry  bigdata 톰과제리리 천둥번개 원숭이 
우박이 내리면서 천둥번개 가 치네 
월요일   우박이 내리네 
'''
# 불용어 정의 
mystop = ['의','가','이','은','들','는','좀','잘','걍','과','도','를','으로','자','에','와','한','하다', '그','너','나','테','니','뇨',]
stopwords = set(STOPWORDS)
for i in mystop:
    stopwords.add(i)
    
wc = WordCloud(stopwords=stopwords, width = 800, height = 800 ,font_path='c:/windows/Fonts/malgun.ttf', colormap= 'Accent_r',background_color='black')
wc.generate(msg)
plt.imshow(wc)
plt.axis('off')
plt.show

  • 앨리스.txt를 이용한 wordcloude
  • 마스크는 구름 모양 이용
path = './data/alice.txt'
wcmask = np.array(Image.open('./data/cloud.png'))
all_words = []
text = open(path, 'r', encoding= 'utf-8').read()

wc = WordCloud(font_path='malgun.ttf', background_color='white', width=800, height=400, mask=wcmask)
wc.generate(text)


plt.imshow(wc)
plt.axis('off')
plt.show

profile
안녕하세요. 도야입니다

0개의 댓글