요즘 정치외교학전공 논문을 작성하기 위해
데이터를 돌려야 할 일들이 생겼다 ...
웹/앱 개발만 해왔기에 데이터를 다루는건 거의 처음이다..
완전 초초초초초보다...
그래도 어쩌겠어 해내야지
웹에서 코드를 작성하고 실행할 수 있는 오픈소스 웹 어플리케이션이다.
아나콘다를 설치하면 자동으로 설치된다.
https://www.anaconda.com/download
해당 링크에서 free download로 다운로드를 진행한다.
만약 아나콘다를 설치하지 않았다면
pip install jupyter
로 설치할 수 있다.
주피터 노트북을 실행하기 위해서는 터미널에
jupyter notebook
를 치면 웹 브라우저가 자동으로 열리면서 주피터 노트북이 실행된다!
여기서
new > notebook을 클릭해 커널을 선택하면 된다!
확장자는 .ipynb
가 될 것이다.
해당 셀에 작성하면서 코드를 실행하고 확인할 수 있다!
만약 [ ] 안에 [ * ] 이렇게 되어있다면 코드가 돌아가는 중이라는 것이다! 숫자가 나와야지 실행됐다는 뜻!
NLTK 설치
NLTK는 자연어 처리를 위한 파이썬 패키지다!
아나콘다를 설치하였다면 NLTK는 기본적으로 설치가 되어있지만 직접 설치해줄 수도 있다.
pip install nltk
버전을 확인하고 싶다면 jupyter notebook에 다음과 같이 입력한다.
import nltk
nltk.__version__
(아 실행을 빠르게 하고 싶다면 command + enter
를 하면 된다!)
NLTK의 기능을 제대로 사용하기 위해서는 NLTK Data라는 여러 데이터를 추가적으로 설치해야 한다.
파이썬 코드 내에서 import nltk 이후에
nltk.download()
이렇게 입력하면 된다.
KoNLPy 설치
KoNLPy는 한국어 자연어 처리를 위한 형태소 분석기 패키지다.
터미널에서 pip install konlpy
이렇게 설치한다.
마찬가지로 이렇게 버전을 확인할 수 있다!
데이터 분석을 위해 반드시 필요한 3가지 패키지가 있다.
pandas Numpy Matplotlib
세가지 모두 아나콘다를 설치했다면 자동으로 설치되어있다!
이제 어느정도 데이터 분석을 위한 패키지 설치는 끝난 것 같다!!
다음에는 이론 or 실제 데이터 돌리는 코드를 소개해보겠다 !!!