스파르타코딩클럽 파이썬 혼자놀기 패키지 3

NameError·2021년 9월 13일
0

카톡 텍스트로 워드클라우드 만들기

from wordcloud import WordCloud
from PIL import Image
import numpy as np

text = ""
# 파일 이름은 맞게 바꿔주세요!
with open("kakaotalk.txt", "r", encoding="utf-8") as f:
    lines = f.readlines()


    for line in lines:
        if '] [' in line:
            text += line.split('] ')[2].replace('ㅋ','').replace('ㅠ','').replace('ㅜ','').replace('사진\n','').replace('이모티콘\n','').replace('삭제된 메시지입니다','')\
                .replace('저는','').replace('저도','').replace('전','').replace('제 ','').replace('혹시','').replace('그냥','').replace('그거','').replace('사실','').replace('다들','')\
                .replace('어서오세요', '').replace('반갑습니다','').replace('감사합니다','')\
                .replace('아','').replace('네','').replace('ㅎㅎ','').replace('근데','').replace('너무','').replace('진짜','').replace('와 ','')\
                .replace('샵검색', '').replace('네','').replace('제가','').replace('오 ','').replace('좀 ','').replace('다 ','').replace('저 ','').replace('그럼 ','')\
                .replace('오 ', '').replace('좀 ','').replace('저 ','').replace('다 ','').replace('그럼 ','')\
                .replace('이거', '').replace('왜','').replace('많이','').replace('일단','').replace('오늘','').replace('요즘','').replace('룰루님','').replace('오리님','')\
                .replace('하 ', '').replace('ㅎ ','').replace('지금','').replace('넹','').replace('더 ','').replace('그 ','').replace('뭐 ','').replace('넵','').replace('더 ','').replace('맞요','').replace('그래서','').replace('어떻게','').replace('그래도','').replace('하고','').replace('음 ','')





#font_path = 'C:/Windows/Fonts/CoreGTM3.otf'
font_path = 'C:/Windows/Fonts/malgunbd.ttf'
mask = np.array(Image.open('cloud.png'))
wc = WordCloud(font_path=font_path, background_color="white", mask=mask)
wc.generate(text)
wc.to_file("result.png")

예전에 눈팅하던 정보처리기사 단톡방 텍스트로 해봤는데 정보값 없는 무의미한 말들 ('삭제된 메시지입니다', '넹', 'ㅋㅋ' 등)을 제거하는 작업은 해도해도 계속 비슷한 말만 나와서 하다가 포기함 ㅋㅋㅋ 아마도 대화하는 내용이 거기서 거기라서 그런가봄 ㅋㅋㅋ

profile
매일 공부하며 살고 있구나

0개의 댓글

관련 채용 정보