[제로베이스] CH4. EDA - 주피터 개발환경 구축

정해성·2023년 6월 27일
0

제로베이스

목록 보기
20/36
post-thumbnail

EDA란

EDA(Exploratory Data Analysis, 탐색적 데이터 분석)는 벨연구소의 수학자 ‘존 튜키’가 개발한 데이터분석 과정에 대한 개념으로, 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 ‘탐색과 이해’를 기본으로 가져야 한다는 것을 의미한다.

중요한 역량

  1. raw data 의 description, dictionary 를 통해 데이터의 각 column들과 row의 의미를 이해하는 기술.
  2. 결측치 처리 및 데이터필터링 기술.
  3. 누구나 이해하기 쉬운 시각화를 하는 기술.

기본 셋팅.

EDA 프로젝트를 시작하기 위한 기본 셋팅

1. 미니콘다 설치

• 구글(www.google.com)에서 “미니콘다” 또는 “miniconda” 검색
• 검색 결과에서 “Miniconda - Conda documentation” 접속!
• 운영체제에 맞는 파일 다운로드

• Windows: Add Miniconda3 to my PATH enviroment variable 체크 한 다음 install!

2. miniconda 정상 작동 확인

conda --version(23년 6월 기준 23.5.0)
conda 버전이 다르다면?
conda update conda 으로 버전 업데이트 권장

3. env(가상환경) 생성

• conda create -n ds_study python=3.8
• Proceed ([y] / n) ? y 입력 후 엔터
env 활성화
• conda activate ds_study 또는 source activate ds_study
• env 활성화: (base)에서 (ds_study)로 변환된 것을 볼 수 있다.
• env 비활성화: conda deactivate

4. 패키지 설치

설치 전 ds_study가 활성화 되어 있는 상태인지 반드시 확인!

• conda install jupyter
• conda install ipython
• conda install matplotlib
• conda install seaborn
• conda install pandas
• conda install scikit-learn
• conda install xlrd

5. 주피터 준비

>>conda activate ds_study
>>jupyter notebook

입력 하면 주피터 창이 열린다. (크롬을 인터넷 브라우저 기본으로 설정해야함)

profile
코린이 공부중

0개의 댓글