[데이터] Jupyter Notebook 사용

오찬주·2024년 10월 13일
0

Study Log

목록 보기
4/6
post-thumbnail

요즘 정치외교학전공 논문을 작성하기 위해
데이터를 돌려야 할 일들이 생겼다 ...
웹/앱 개발만 해왔기에 데이터를 다루는건 거의 처음이다..
완전 초초초초초보다...
그래도 어쩌겠어 해내야지

Jupyter Notebook

웹에서 코드를 작성하고 실행할 수 있는 오픈소스 웹 어플리케이션이다.
아나콘다를 설치하면 자동으로 설치된다.

https://www.anaconda.com/download

해당 링크에서 free download로 다운로드를 진행한다.

만약 아나콘다를 설치하지 않았다면

pip install jupyter 로 설치할 수 있다.

주피터 노트북을 실행하기 위해서는 터미널에

jupyter notebook 를 치면 웹 브라우저가 자동으로 열리면서 주피터 노트북이 실행된다!

여기서

new > notebook을 클릭해 커널을 선택하면 된다!
확장자는 .ipynb가 될 것이다.

해당 셀에 작성하면서 코드를 실행하고 확인할 수 있다!

만약 [ ] 안에 [ * ] 이렇게 되어있다면 코드가 돌아가는 중이라는 것이다! 숫자가 나와야지 실행됐다는 뜻!


자연어처리를 위한 라이브러리 설치

NLTK 설치

NLTK는 자연어 처리를 위한 파이썬 패키지다!
아나콘다를 설치하였다면 NLTK는 기본적으로 설치가 되어있지만 직접 설치해줄 수도 있다.

pip install nltk

버전을 확인하고 싶다면 jupyter notebook에 다음과 같이 입력한다.

import nltk
nltk.__version__

(아 실행을 빠르게 하고 싶다면 command + enter를 하면 된다!)

NLTK의 기능을 제대로 사용하기 위해서는 NLTK Data라는 여러 데이터를 추가적으로 설치해야 한다.

파이썬 코드 내에서 import nltk 이후에

nltk.download() 이렇게 입력하면 된다.

KoNLPy 설치

KoNLPy는 한국어 자연어 처리를 위한 형태소 분석기 패키지다.
터미널에서 pip install konlpy 이렇게 설치한다.

마찬가지로 이렇게 버전을 확인할 수 있다!


데이터 분석을 위해 반드시 필요한 3가지 패키지가 있다.

pandas Numpy Matplotlib

세가지 모두 아나콘다를 설치했다면 자동으로 설치되어있다!


이제 어느정도 데이터 분석을 위한 패키지 설치는 끝난 것 같다!!

다음에는 이론 or 실제 데이터 돌리는 코드를 소개해보겠다 !!!

profile
프론트엔드 엔지니어를 희망합니다 :-)

0개의 댓글

관련 채용 정보