EDA(Exploratory Data Analysis, 탐색적 데이터 분석)는 벨연구소의 수학자 ‘존 튜키’가 개발한 데이터분석 과정에 대한 개념으로, 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 ‘탐색과 이해’를 기본으로 가져야 한다는 것을 의미한다.
EDA 프로젝트를 시작하기 위한 기본 셋팅
• 구글(www.google.com)에서 “미니콘다” 또는 “miniconda” 검색
• 검색 결과에서 “Miniconda - Conda documentation” 접속!
• 운영체제에 맞는 파일 다운로드
• Windows: Add Miniconda3 to my PATH enviroment variable 체크 한 다음 install!
conda --version(23년 6월 기준 23.5.0)
conda 버전이 다르다면?
conda update conda 으로 버전 업데이트 권장
• conda create -n ds_study python=3.8
• Proceed ([y] / n) ? y 입력 후 엔터
env 활성화
• conda activate ds_study 또는 source activate ds_study
• env 활성화: (base)에서 (ds_study)로 변환된 것을 볼 수 있다.
• env 비활성화: conda deactivate
설치 전 ds_study가 활성화 되어 있는 상태인지 반드시 확인!
• conda install jupyter
• conda install ipython
• conda install matplotlib
• conda install seaborn
• conda install pandas
• conda install scikit-learn
• conda install xlrd
>>conda activate ds_study
>>jupyter notebook
입력 하면 주피터 창이 열린다. (크롬을 인터넷 브라우저 기본으로 설정해야함)