[NLP] Konlpy, Mecab-ko 설치(윈도우 기준)

DeadKim·2022년 4월 7일
0

NLP

목록 보기
1/1
post-thumbnail

NLP 한국어를 함에 있어서 형태소 분석기인 konlpy와 Mecab이 필요함으로 windows 환경에서 사용할 수 있게 설치과정이다.

JPype 설치

우선 konly는 Java로 구현된 모듈이고 이것을 파이썬에서 사용할 수 있게 java와 Jpype가 필요하다.
java jdk 설치는 다른 (openJDK1.8설치)👈포스트에 써놓음.

https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype
위의 링크를 통해서 자신이 사용하고 있는 파이썬 버전에 맞는 파일을 받으시면 됩니다.
저는 3.7버전을 사용하고 있기에 아래와 캡처에 파일을 받았습니다.




windows 터미널 또는 cmd창을 열어서 받은 설치 파일 경로로 이동 뒤에 python 라이브러리를 설치해줍니다.(conda를 사용중이면 conda에)

pip install .\JPype1-1.3.0-cp37-cp37m-win_amd64.whl
설치가 완료되면 위와 같이 보인다.



konlpy 설치

위에서 konlpy를 python에서 사용할 준비를 했다면 이제 설치하면 된다.

제 기준으로는 conda 가상환경에 설치.

pip install konlpy

konlpy 테스트

from konlpy.tag import Okt
tok = Okt()
tok.pos("테스트입니다.")




Mecab-ko 설치

mecab-ko-msvc 설치

윈도우에서 Mecab을 설치할수 있게 지원되고 있는게 공식으로 github에 공유 되고 있다.

mecab-ko-msvc releases 👈 이 링크로 들어가면 최신의 release 버전을 받을 수 있다.

위의 캡처처럼 zip파일을(자신의 bit환경에 맞게) 받으면 됩니다.


해당 압축 파일은 다른경로가 아닌(다른 경로에도 지정하여 할수 있지만 복잡 👉참고) C드라이브 바로 하위에 mecab폴더를 생성

mkdir C:/mecab

위에서 받은 zip파일을 생성한 mecab 폴더로 이동시켜 폴더를 생성하지 않고 바로 압축을 해제한다.



mecab-ko-dic-msvc 설치

위의 msvc 말고 dic-msvc도 필요 함으로 함께 받는다.
mecab-ko-dic-msvc releases 👈 이 링크로 들어가면 위와 마찬 가지라고 releases를 확인하여 최신 버전으로 받는다.

위와 마찬가지로 해당 zip파일이 받아지면 C:/mecab 폴더로 파일을 이동시켜 폴더를 생성하지 않고 압축을 해제한다.



python whl 설치

이제 python에서 사용하기 위해 해당 (mecab-python-msvc releases) 👈링크로 이동하려 자신에 환경에 따라 whl 파일을 받아서 설치해줍니다.

저는 python 3.7을 사용중이므로 3.7 기준 64bit용 버전을 받았습니다.

다운 받은 whl파일 설치

받은 파일을 Jpype와 같이 python 라이브러리로 설치해 줍니다.



Mecab 테스트

import MeCab
m = MeCab.Tagger()
m.parse("안녕하세요. 테스트 입니다요.")

💡Konlpy Mecab

from konlpy.tag import Mecab 
mecab_tokenizer = Mecab(dicpath=r"C:\mecab\mecab-ko-dic").morphs
print('mecab check :', mecab_tokenizer('어릴때보고 지금다시봐도 재밌어요ㅋㅋ'))





참조 : https://hong-yp-ml-records.tistory.com/91
참조 : https://lsjsj92.tistory.com/612
참조 : https://uwgdqo.tistory.com/363

추후 참조 할 링크 : https://github.com/yeontaek/BERT-MECAB-Korean-Model

profile
내가 보려고 만든 velog

0개의 댓글