실습 중에 Mecab을 코랩에 설치하는 과정이 있었는데, 설치 후에 mecab = Mecab() 실행 시에 Trigger 에러가 발생하여 Mecab을 사용할 수 없었다.
런타임을 종료 후에 다시 시작해 보라는 말이 있어서 해 보았지만 계속 에러가 날 뿐 실행되지 않았다.
터미널의 설치 과정을 살펴보니 mecab-dic과 mecab-ko가 파일 저장소에서 404 에러로 인해 다운로드 되지 않는 사실을 인지하였다.
여러모로 검색 결과 두 개의 블로그에서 도움을 받았는데 아래와 같다.
https://sosomemo.tistory.com/30
덕분에 실습을 할 수 있었습니다. 감사합니다.
사용자 사전을 등록하기 위해서는 첫번째 링크의 블로그에 나온 방법을 사용해야 했다. 그러나 이 솔루션에 나온 스크립트의 파일에서도 사용자 사전은 missing 상태로 설치가 안 되었으므로, 직접 파일을 다운로드 받아서 다시 코랩에 올리는 방법으로 진행하게 되었다.
https://drive.google.com/drive/folders/1STH9WUG7_flOjFuGIKqnmebhSfQaHbzM
이 곳에 가장 최신 사용자 사전이 있고, 그 중 가장 최신인
mecab-ko-dic-2.1.1-20180720.tar.gz
를 다운로드 받은 뒤 수동으로 코랩의 mecab 폴더에 업로드 한 뒤에 아래의 명령어를 실행했다.
tar zxvf mecab-ko-dic-2.1.1-20180720.tar.gz
cd /tmp/mecab-ko-dic-2.1.1-20180720
./autogen.sh
./configure
make
make install
git clone http://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git
cd Mecab-ko-for-Google-Colab
bash install_mecab-ko_on_colab_light_220429.sh
아래의 구글 드라이브에서 가장 최신 파일 다운로드
https://drive.google.com/drive/folders/1STH9WUG7_flOjFuGIKqnmebhSfQaHbzM
코랩의 content 폴더 아래 Mecab-ko-for-Google-Colab 폴더에 업로드 (꼭 업로드가 완료 된 것을 확인 후 아래 실행)
tar zxvf mecab-ko-dic-2.1.1-20180720.tar.gz
cd /mecab-ko-dic-2.1.1-20180720
./autogen.sh
./configure
make
make install
이후에
mecab = Mecab()
코드가 실행이 잘 되는지 확인
코랩:
https://colab.research.google.com/drive/1N9OAzT0G5E4-UPaCVIek2A2-2vV7oxiO?usp=sharing