텍스트 전처리 챕터에서는 전처리를 위한 이론에 대해서 학습하고, 그 이론을 바탕으로 실습을 진행하게 됩니다.
자연어처리에 필요한 기본적인 자연어 패키지들을 소개합니다.
NLTK는 자연어 처리를 위한 파이썬 패키지입니다. 아나콘다를 설치하였다면 NLTK는 기본적으로 설치가 되어져 있다. 아나콘다를 설치하지 않았다면 별도로 설치해야한다.
pip install nltk
ipython -> 확인하는 방법
NLTK의 기능을 제대로 사용하기 위해서는 NLTK Data라는 여러 데이터를추가적으로 설치해야 합니다. 이를 위해서는 파이썬 코드 내에서 import nltk 이후에 nltk.download()라는 코드를 수행하여 설치합니다.
nltk.download()
pip install konlpy