자연어 처리(형태소 분석)

yeoni·2023년 6월 16일
0

머신러닝

목록 보기
22/40

형태소 분석

1. Kkma

  • import는 __init__.py를 참고함
from konlpy.tag import Kkma
kkma = Kkma()
kkma.sentences('한국어 분석을 시작합니다 재미있어요~') # ['한국어 분석을 시작합니다', '재미있어요~']
kkma.nouns('한국어 분석을 시작합니다 재미있어요~') # ['한국어', '분석']
kkma.pos('한국어 분석을 시작합니다 재미있어요~')
'''
[('한국어', 'NNG'),
 ('분석', 'NNG'),
 ('을', 'JKO'),
 ('시작하', 'VV'),
 ('ㅂ니다', 'EFN'),
 ('재미있', 'VA'),
 ('어요', 'EFN'),
 ('~', 'SO')]
'''

2. Hannanum

from konlpy.tag import Hannanum
hannanum = Hannanum()
hannanum.nouns('한국어 분석을 시작합니다 재미있어요~') # ['한국어', '분석', '시작']
hannanum.morphs('한국어 분석을 시작합니다 재미있어요~') # ['한국어', '분석', '을', '시작', '하', 'ㅂ니다', '재미있', '어요', '~']
hannanum.pos('한국어 분석을 시작합니다 재미있어요~')
'''
[('한국어', 'N'),
 ('분석', 'N'),
 ('을', 'J'),
 ('시작', 'N'),
 ('하', 'X'),
 ('ㅂ니다', 'E'),
 ('재미있', 'P'),
 ('어요', 'E'),
 ('~', 'S')]
'''

3. Okt

from konlpy.tag import Okt
t= Okt()
t.nouns('한국어 분석을 시작합니다 재미있어요~') # ['한국어', '분석', '시작']
t.morphs('한국어 분석을 시작합니다 재미있어요~') # ['한국어', '분석', '을', '시작', '합니다', '재미있어요', '~']
t.pos('한국어 분석을 시작합니다 재미있어요~')
'''
[('한국어', 'Noun'),
 ('분석', 'Noun'),
 ('을', 'Josa'),
 ('시작', 'Noun'),
 ('합니다', 'Verb'),
 ('재미있어요', 'Adjective'),
 ('~', 'Punctuation')]
 '''

Rerference
1) 제로베이스 데이터스쿨 강의자료

profile
데이터 사이언스 / just do it

0개의 댓글