데이터 분석 : 계획과 무계획

olxtar·2022년 2월 15일
0

데이터를 처음 받고
분석을 시작하려 할 때
어떻게 시작하는 것이 가장 효율적일까?

계획

데이터셋에 대한 기본적인 정보를 알고 있고 어떤 분석을 진행할지 어느정도의 계획이 잡혀있을때

계획이 없을 때

데이터셋에 대한 기본적인 정보가 없고 어떤 분석을 진행할지에 대하여 계획이 없을때


  • 데이터셋의 범위 및 분할여부 체크

  • 데이터 불러오기

  • 컬럼의 정의 및 각 데이터값 살펴보기

  • 컬럼별 데이터타입 및 메모리 사용량 체크

  • 수치데이터 컬럼의 기초통계값 살펴보기

  • 명목데이터 컬럼의 유니크값 및 유니크값 개수 살펴보기

  • 새로운 컬럼 생성 생각하기

  • 집계 순서 및 방법 생각하기

  • 다른 데이터셋과의 조인 생각하기

  • 중간 데이터셋 백업 생각하기

  • 데이터셋의 컬럼순서 및 컬럼명 정리하기

  • 변수, 백업 데이터셋, 작업코드 네이밍 잘 정하기

profile
예술과 기술

0개의 댓글