1.1.1_EDA

chang·2021년 1월 1일
0

부트캠프

목록 보기
1/28

[키워드]

  • 깃허브
  • colab
  • dataset import
  • EDA with pandas 🐼

[학습내용]

  • git과 github의 대략적 개념과 과정에 필요한 github 사용법

    - git = 버전관리 <소프트웨어>
    - github = git 내용들 저장되는 공간 제공 <서비스>
    - github의 repository를 fork하고 pull request 제출하는 법

  • 데이터를 불러와 읽는 법

    기존 주피터 노트북과 로컬에 있는 데이터를 불러오는 법이 달랐다.

  • 데이터 EDA에 필요한 개념들

    dimension 확인, 결측치 확인 및 대체 등
    추가 공부 필요!

[찾아볼 내용]👀

[O] colab 단축키
[O] colab에서 dataset 읽어 오는 법 여기
[O] 노트북 어딘가 저장된 pandas cheatsheet 여기
[O] EDA와 데이터 전처리의 구분(같은 거라 생각했는데 조금 다른 것 같다) 여기

[후기]

- 깃허브는 부트캠프 참가를 위해 처음 가입했고 이전에는 ds관련 책을 공부할 때 필요한 데이터와 소스코드를 다운받을 때 들어간 경험 빼고는 사용한 적이 없었다. 조금 더 공부해서 hwp파일에 저장해놓은 내용들을 옮기거나 해봐야겠다
- colab 단축키를 바꿀 수 있을지 찾아봐야겠다.. M키 하나를 더 누르는게 손에 익지 않았다.
- 매번 판다스 공부는 조금씩 시도해봤지만 파이썬을 이용해 데이터 분석까지는 공부하지 않았기 때문에 그저 R만 사용해왔다.. 그 결과 단순히 데이터프레임에서 원하는 행과 열을 뽑아오는 것도 힘들었다.

이번 기회에 파이썬을 제대로 사용해봐야겠다🔥

0개의 댓글