POS Tagging

leegahee·2025년 2월 12일

개념정리

목록 보기
15/17

POS (part of speech) Tagging

주어진 문장에서 각 단어에 적절한 품사를 붙여주는것

  • POS
    단어, 구를 문법에 따라 구분하는 것

  • 예시코드

import nltk
from nltk.tokenize import word_tokenize

# punkt 다운로드
nltk.download('punkt_tab')  
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger_eng')

text = "I love natural language processing."
print(word_tokenize(text))
print(nltk.pos_tag(word_tokenize(text)))

# 결과
['I', 'love', 'natural', 'language', 'processing', '.']
[('I', 'PRP'), ('love', 'VBP'), ('natural', 'JJ'), ('language', 'NN'), ('processing', 'NN'), ('.', '.')]
  • 한국어 예시코드
from konlpy.tag import Okt

okt = Okt()
text = "자연어 처리는 정말 재미있는 분야입니다."

pos_tags = okt.pos(text)  # 품사 태깅 수행
print(pos_tags)

# 결과
[('자연어', 'Noun'), ('처리', 'Noun'), ('는', 'Josa'), ('정말', 'Noun'), ('재미있는', 'Adjective'), ('분야', 'Noun'), ('입니다', 'Adjective'), ('.', 'Punctuation')]

왜 사용하는가?

자연어 처리를 수행할때 문장의 의미를 정확하게 분석할 수 있다

0개의 댓글