konlpy
한글 데이터에 대한 형태소 분석 라이브러리 사용
형태소(단어로서 의미를 가지는 최소값) 분석 : 품사 분류를 통해 언어적 속성을 파악
from konlpy.tag import Kkma, Okt, Komoran
kkma = Kkma()
print(kkma.sentences('한글 데이터 형태소 분석을 위한 라이브러리 설치를 합니다. 파이썬 만세'))
>> ['한글 데이터 형태소 분석을 위한 라이브러리 설치를 합니다.', '파이 썬 만세']
print(kkma.nouns('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '설치', '데이터', '형태소', '라이브러리', '형태소분석', '분석']
print(kkma.pos('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> [('한글', 'NNG'), ('데이터', 'NNG'), ('형태소', 'NNG'),...]
print(kkma.morphs('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '데이터', '형태소', '분석', '을',...]
okt = Okt()
print(okt.nouns('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '데이터', '형태소', '분석', '위', '라이브러리', '설치']
print(okt.pos('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ...,('합니다', 'Verb')]
print(okt.pos('한글데이터형태소분석을위한라이브러리설치를합니다', stem=True))
>> ...,('하다', 'Verb')]
print(okt.morphs('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '데이터', '형태소', '분석', '을', '위', '한',...]
print(okt.phrases('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글데이터형태소분석', '위한라이브러리설치', '한글', '데이터',..]
komo = Komoran()
print(komo.nouns('한글데이터형태소분석을위한라이브러리설치를합니다'))
print(komo.pos('한글데이터형태소분석을위한라이브러리설치를합니다'))
print(komo.morphs('한글데이터형태소분석을위한라이브러리설치를합니다'))