[python] konlpy(코넬파이)

GROOTY·2023년 5월 3일
0

konlpy

한글 데이터에 대한 형태소 분석 라이브러리 사용

형태소(단어로서 의미를 가지는 최소값) 분석 : 품사 분류를 통해 언어적 속성을 파악

from konlpy.tag import Kkma, Okt, Komoran

kkma = Kkma()
# 문장 단위로 분류 반환값은 list 이다.
print(kkma.sentences('한글 데이터 형태소 분석을 위한 라이브러리 설치를 합니다. 파이썬 만세'))
>> ['한글 데이터 형태소 분석을 위한 라이브러리 설치를 합니다.', '파이 썬 만세']

# 품사별로 나누어준다. nouns 는 명사만 추출
print(kkma.nouns('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '설치', '데이터', '형태소', '라이브러리', '형태소분석', '분석']

# pos() : 품사 태깅 해준다.
print(kkma.pos('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> [('한글', 'NNG'), ('데이터', 'NNG'), ('형태소', 'NNG'),...]

# morphs() : 모든 품사를 추출
print(kkma.morphs('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '데이터', '형태소', '분석', '을',...]

okt = Okt()
print(okt.nouns('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '데이터', '형태소', '분석', '위', '라이브러리', '설치']

print(okt.pos('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ...,('합니다', 'Verb')]

# stem=True : 원형(어근)으로 출력, ('하다', 'Verb')
print(okt.pos('한글데이터형태소분석을위한라이브러리설치를합니다', stem=True))
>> ...,('하다', 'Verb')]

print(okt.morphs('한글데이터형태소분석을위한라이브러리설치를합니다'))
>> ['한글', '데이터', '형태소', '분석', '을', '위', '한',...]

print(okt.phrases('한글데이터형태소분석을위한라이브러리설치를합니다'))  # 어절 추출
>> ['한글데이터형태소분석', '위한라이브러리설치', '한글', '데이터',..]

komo = Komoran()
print(komo.nouns('한글데이터형태소분석을위한라이브러리설치를합니다'))
print(komo.pos('한글데이터형태소분석을위한라이브러리설치를합니다'))
print(komo.morphs('한글데이터형태소분석을위한라이브러리설치를합니다'))
profile
개발 시작

0개의 댓글

관련 채용 정보