[데이터] 감성분석을 위한 준비 - 라이브러리 설치

오찬주·2024년 10월 27일
post-thumbnail

저번 글에서는 데이터를 모으는 것까지 해보았다.
이번에는 모은 데이터로 감성 분석을 진행해보겠다.
이번 글에서는 그 전에 필요한 것들을 설치해보자!!

감성사전은 이미 구축되어 있는 감성어 사전에 기반하거나, 기계학습을 이용해 사전을 구축한 후 해당 사전을 이용하는 방법이 있다.

다만, 학습을 시키는 것은 아직 나의 역량이 부족하기도 하고 한국어는 특히 그 형태가 방대하기에 이미 구축되어 있는 감성어 사전을 활용하는 것이 훨씬 효율적이라고 판단했다.

감성분석은 주로 영어 데이터가 많아 ... 한국어 분석을 할 수 있는 것은 데이터 양으로 인해 사실 제한적이다.

많은 시행착오가 있었다 .... (사실 뻘짓이었을지도 ..?)

처음에 시도한 것은 바로 "koBERT"다.
skt에서 만든 것으로 해당 깃허브를 들어가면 리드미에 설명이 잘 적혀져있다.

https://github.com/SKTBrain/KoBERT

나에게 난 에러는 ... requirement.tst의 의존성 문제였다.

여러가지의 것을 설치해야 했고, requirement.tst에 정리되어있어 그걸 install만 하면 되는데 그 당시와 버전도 달라지고, 지원하지 않는 것도 있고 그래서 의존성 문제가 엄청나게 뜨게 되었다 ..

겨우겨우 찾아서 맞는 버전 정리되어있는 것으로 시도했으나 실패 ..


KNU 한국어 감성 사전으로 다시 도전하다

그래서 다른 것으로 도전한 것이 knu 한국어 감성 사전이다.

군산대학교에서 구축했고, 표준국어 대사전 뿐만 아니라 여기서 추출되지 않은 이모티콘, 축약어 등까지 모두 포함되어있다.
(어케.. 어케 하셨을까... 대단티비..)

이런식으로!! 넘무 신기하다..

감성 분석을 위한 준비를 해보자

감성 분석을 위해 설치해야 하는 것들이 있다.

konlpy와 mecab이다.

konlpy: 한글 자연어 처리기
mecab: 형태소 분리를 위해 필요한 konlpy 모듈

mecab을 설치하고 import하니 에러가 엄청 나서 .. 제대로 설치하는 과정을 소개해보겠다.

3가지 설치과정을 통해 에러를 해결할 수 있다.

1. mecab-ko 설치
2. mecab-dic 설치
3. mecab-python 설치

mecab-ko 설치

  1. 우선 홈페이지에서 다운로드를 받는다.
    https://bitbucket.org/eunjeon/mecab-ko/downloads/
wget https://bitbucket.org/eunjeon/mecab-ko/downloads/mecab-0.996-ko-0.9.2.tar.gz
  1. 압축 해제를 한다. 수동으로 해도 된다.
tar xvfz mecab-0.996-ko-0.9.2.tar.gz
  1. 터미널에서 해당 위치까지 들어간 후 설치한다.
>> cd mecab-0.996-ko-0.9.2
>> ./configure
>> make
>> make check
>> sudo make install

mecab-dic 설치

똑같은 절차다.
다운로드 -> 압축 해제 -> 해당 위치로 이동 후 설치

  1. 다운로드
>>> wget https://bitbucket.org/eunjeon/mecab-ko-dic/downloads/mecab-ko-dic-2.1.1-20180720.tar.gz
  1. 압축 해제 후 설치
>>> tar xvfz mecab-ko-dic-2.1.1-20180720.tar.gz
cd mecab-ko-dic-2.1.1-20180720

>>> ./configure

>>> make

>>> sudo make install

mecab-python 설치

  1. 다운로드
>>> git clone https://bitbucket.org/eunjeon/mecab-python-0.996.git
  1. 해당 위치로 이동 후 설치
>>> cd mecab-python-0.996

>>> python setup.py build

>>> python setup.py install

이렇게 했는데도 에러가 난다면 pip를 이용해 mecab-python3를 설치해준다!

NameError: name 'Tagger' is not defined

pip3 install mecab-python3

제대로 설치됐다면?

from konlpy.tag import Mecab
tokenizer = Mecab()
print(tokenizer.morphs('메캡 설치 완료'))

이렇게 뜬다 ㅎ
다음편에는 감성 분석 가보자고!!

참고 글

profile
프론트엔드 엔지니어를 희망합니다 :-)

0개의 댓글