EDA orientation

YJ·2023년 3월 27일
0

▷ 오늘 학습 계획: EDA 강의(오리엔테이션)

01_파이썬 환경 설정

miniconda 설치 후 prompt에서 conda evn(가상환경) 설정하기

env 목록: conda env list
conda --version(버전이 다를 경우 conda update conda)
conda create -n ds_study python=3.8
env 활성화: conda activate ds_study 또는 source activate ds_study
env 비활성화: conda deactivate
env 삭제: conda env remove -n name

Jupyter Notebook

ds_study 활성화 후에 conda install jupyter

  • 패키지 설치: conda install -y ipython ipykernel xlrd openpyxl scipy pandas matplotlib seaborn scikit-learn
  • cd Documents 실행: change directory 라는 명령어
    Documnets(문서) 폴더로 이동
  • mkdir ds_study: make directory 라는 명령어
    ds_study 라는 이름의 새 폴더를 만든 것
  • Jupyter Notebook 실행
    prompt에서 Jupyter notebook 입력 후 엔터
    Jupyter notebook에서 입력 후에는 shift + Enter로 실행
  • File → Close and Halt 를 눌러서 종료

matplotlib 한글 설정

matplotlib은 기본적으로 한글 미지원
matplotlib의 폰트를 한글을 지원하는 폰트로 변경하는 작업이 필요함

 import matplotlib.pyplot as plt
 from matplotlib import rc
 %matplotlib inline
 rc("font", family="Malgun Gothic")

02_VScode 환경 설정

파이썬 환경 설정

  • prompt → ds_study 폴더에서 code . 입력 후 실행
    code 는 visual studio code 프로그램을 실행시키는 명령어
    . 은 현재 폴더 위치
  • File - Open Folder로 해당 폴더(ds_study) 오픈
    Extensions → python install
    New file 생성
    Ctrl+Shift+p → 'Python: Select Interpreter' → 해당 이름(ds_study) 선택
    코드 실행(Shift+Enter)해서 정상 작동되는지 확인

03_Colab 환경 설정

구글 코랩 접속
새 노트 생성: File - 새노트
코드가 입력된 셀 실행: shift + Enter 또는 플레이 버튼

런타임 메뉴

  • 모두 실행: 긴 노트의 코드를 한번에 실행
  • 실행 중단: 응답이 없거나 긴 시간 실행중인 경우에 코드 중단
  • 런타임 다시 시작: 메모리에 저장된 변수나 실행 결과를 모두 초기화하고 다시 코드를 실행
  • 도구 - 명령 팔레트(Ctrl+Shif+P)에서 모든 출력 지우기 선택: 코드 실행 출력값 삭제

matplotlib: 파이썬에서 대표적으로 사용하는 시각화 패키지
Colab 환경에서 matplotlib은 기본적으로 한글 폰트 미지원

  # 실행 후, 런타임 다시 시작 해야 설정이 적용됨

    !sudo apt-get install -y fonts-nanum
    !sudo fc-cache -fv
    !rm ~/.cache/matplotlib -rf     

    import matplotlib.pyplot as plt 
    %matplotlib inline

    plt.rcParams["font.family"] = 'NanumGothic'

    plt.title('데이터 취업 스쿨')
    plt.show()

Colaboratory 문서화 작업

  • 마크다운 편집창에서 문서화 작업
  • 코드와 함께 문서처럼 글을 정리할 수 있음
  • 코딩에 대한 설명뿐만 아니라, 실험이나 시도 자체를 문서화 가능
  • 코드의 결과 화면까지 저장해서 이후 읽을 때는 실행하지 않아도 코드의 결과를 확인할 수 있음(메모리의 상황은 저장되지 않음)
  • 런타임에 업로드 하면 시간이 지나거나 다시 런타임 시작하면 삭제됨
  • 일시적인 학습이나 작은 크기의 데이터는 사용 가능
  • 영구적인 접근을 위해 구글 드라이브와 연동이 필요함
  • !ls: 파일 목록 조회

▷ 내일 학습 계획: EDA 강의(CCTV 1~2)

[이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다.]

0개의 댓글