Natural Language Processing
conda install -y jupyter ipython
설정 > 정보 > 고급 시스템 설정 > 환경변수

java 경로 추가

시스템 변수 새로 만들기


컴퓨터 재부팅 해야함
!conda update conda
!pip install --upgrade pip
!pip install konlpy # 자연어 처리
!pip install tweepy==3.10.0
!conda install -y -c conda-forge jpype1==1.0.2
!conda install -y -c conda-forge wordcloud
!conda install -y nltk
!conda install -y scikit-learn
import nltk
nltk.download()



from konlpy.tag import Kkma
kkma = Kkma()
kkma.sentences('한국어 분석을 시작합니다 재미있어요~~')

마침표를 찍지 않았는데 두 문장을 잘 분리함
kkma.nouns('한국어 분석을 시작합니다 재미있어요~~')

kkma.pos('한국어 분석을 시작합니다 재미있어요~~')

from konlpy.tag import Hannanum
hannanum = Hannanum()
hannanum.nouns('한국어 분석을 시작합니다 재미있어요~~')

hannanum.morphs('한국어 분석을 시작합니다 재미있어요~~')

hannanum.pos('한국어 분석을 시작합니다 재미있어요~~')

from konlpy.tag import Twitter
t = Twitter()
t.nouns('한국어 분석을 시작합니다 재미있어요~~')

t.morphs('한국어 분석을 시작합니다 재미있어요~~')

t.pos('한국어 분석을 시작합니다 재미있어요~~')


[출처](: http://hclt.kr/symp/?intpg=2&lnb=conference)







형태소 - 언어의 최소 의미 단위
"이 글은 제로베이스 데이터 취업 스쿨 강의를 듣고 작성한 내용으로 제로베이스 데이터 취업 스쿨 강의 자료 일부를 발췌한 내용이 포함되어 있습니다."