[ML] NLP 환경 설정, 형태소

박미영·2023년 5월 25일
0

DataSchool StudyNote - ML

목록 보기
18/19

📌NLP

Natural Language Processing



- NLP 설치

  1. jdk download
conda install -y jupyter ipython
  1. 환경설정 변경

설정 > 정보 > 고급 시스템 설정 > 환경변수

java 경로 추가

시스템 변수 새로 만들기

컴퓨터 재부팅 해야함

!conda update conda
!pip install --upgrade pip
!pip install konlpy # 자연어 처리
!pip install tweepy==3.10.0
!conda install -y -c conda-forge jpype1==1.0.2
!conda install -y -c conda-forge wordcloud
!conda install -y nltk
!conda install -y scikit-learn



import nltk
nltk.download()





- NLP 실습

- Kkma

from konlpy.tag import Kkma
kkma = Kkma()
  • 문장 분석
kkma.sentences('한국어 분석을 시작합니다 재미있어요~~')

마침표를 찍지 않았는데 두 문장을 잘 분리함


  • 명사 분석
kkma.nouns('한국어 분석을 시작합니다 재미있어요~~')


  • 형태소 분석
kkma.pos('한국어 분석을 시작합니다 재미있어요~~')



- Hannanum

from konlpy.tag import Hannanum
hannanum = Hannanum()
  • 명사 분석
hannanum.nouns('한국어 분석을 시작합니다 재미있어요~~')


hannanum.morphs('한국어 분석을 시작합니다 재미있어요~~')


  • 형태소 분석
hannanum.pos('한국어 분석을 시작합니다 재미있어요~~')



- Twitter

from konlpy.tag import Twitter
t = Twitter()
  • 명사 분석
t.nouns('한국어 분석을 시작합니다 재미있어요~~')


t.morphs('한국어 분석을 시작합니다 재미있어요~~')


  • 형태소 분석
t.pos('한국어 분석을 시작합니다 재미있어요~~')




[출처](: http://hclt.kr/symp/?intpg=2&lnb=conference)






형태소 - 언어의 최소 의미 단위




"이 글은 제로베이스 데이터 취업 스쿨 강의를 듣고 작성한 내용으로 제로베이스 데이터 취업 스쿨 강의 자료 일부를 발췌한 내용이 포함되어 있습니다."

0개의 댓글