TIL 191128_3

김상훈·2019년 11월 28일
0

Konlpy Okt 사용해보기

text = "원하는 문장을 입력하세요. 형태소 분석기를 비교해봅시다!"

Khaiii (원래 쓰던 것)

from khaiii import KhaiiiApi
api = KhaiiiApi()

union = ""
for word in api.analyze(text):
  for x in word.morphs:
    if x.tag in ['NNG', 'NNP', 'NNB', 'NP', 'NR', 'VV', 'VA', 'VX', 'VCP', 'VCN', 'MM', 'MAG', 'MAJ', 'IC']:
      union += x.lex
      union += " "
print(union)

▷ 원하 문장 입력 형태소 분석기 비교 보

Konlpy Okt (새로 도입해본 것)

from konlpy.tag import Okt
okt = Okt()

union = ""
for word_tag in okt.pos(text, norm=True, stem=True):
  if word_tag[1] in ['Noun', 'Verb', 'VerbPrefix', 'Adjective', 'Determiner', 'Adverb', 'Exclamation', 'KoreanParticle']:
    union += word_tag[0]
    union += " "
print(union)

▷ 원하다 문장 입력 하다 형태소 분석 기르다 비교 해보다

흠??? norm, stem 기능 때문에 Okt가 더 좋을거라 생각했는데,
형태소 뽑아내보니 막상 그렇지도 않은 느낌이네?
그래도 문장이 많을 때, 비슷한 형태가 되는건 Okt가 아닐까?

profile
남과 비교하지 말자.

0개의 댓글