Natural Language Processing
conda install -y jupyter ipython
설정 > 정보 > 고급 시스템 설정 > 환경변수
java 경로 추가
시스템 변수 새로 만들기
컴퓨터 재부팅 해야함
!conda update conda
!pip install --upgrade pip
!pip install konlpy # 자연어 처리
!pip install tweepy==3.10.0
!conda install -y -c conda-forge jpype1==1.0.2
!conda install -y -c conda-forge wordcloud
!conda install -y nltk
!conda install -y scikit-learn
import nltk
nltk.download()
from konlpy.tag import Kkma
kkma = Kkma()
kkma.sentences('한국어 분석을 시작합니다 재미있어요~~')
마침표를 찍지 않았는데 두 문장을 잘 분리함
kkma.nouns('한국어 분석을 시작합니다 재미있어요~~')
kkma.pos('한국어 분석을 시작합니다 재미있어요~~')
from konlpy.tag import Hannanum
hannanum = Hannanum()
hannanum.nouns('한국어 분석을 시작합니다 재미있어요~~')
hannanum.morphs('한국어 분석을 시작합니다 재미있어요~~')
hannanum.pos('한국어 분석을 시작합니다 재미있어요~~')
from konlpy.tag import Twitter
t = Twitter()
t.nouns('한국어 분석을 시작합니다 재미있어요~~')
t.morphs('한국어 분석을 시작합니다 재미있어요~~')
t.pos('한국어 분석을 시작합니다 재미있어요~~')
[출처](: http://hclt.kr/symp/?intpg=2&lnb=conference)
형태소 - 언어의 최소 의미 단위
"이 글은 제로베이스 데이터 취업 스쿨 강의를 듣고 작성한 내용으로 제로베이스 데이터 취업 스쿨 강의 자료 일부를 발췌한 내용이 포함되어 있습니다."