데이터를 처음 받고
분석을 시작하려 할 때
어떻게 시작하는 것이 가장 효율적일까?
데이터셋에 대한 기본적인 정보를 알고 있고 어떤 분석을 진행할지 어느정도의 계획이 잡혀있을때
데이터셋에 대한 기본적인 정보가 없고 어떤 분석을 진행할지에 대하여 계획이 없을때
데이터셋의 범위 및 분할여부 체크
데이터 불러오기
컬럼의 정의 및 각 데이터값 살펴보기
컬럼별 데이터타입 및 메모리 사용량 체크
수치데이터 컬럼의 기초통계값 살펴보기
명목데이터 컬럼의 유니크값 및 유니크값 개수 살펴보기
새로운 컬럼 생성 생각하기
집계 순서 및 방법 생각하기
다른 데이터셋과의 조인 생각하기
중간 데이터셋 백업 생각하기
데이터셋의 컬럼순서 및 컬럼명 정리하기
변수, 백업 데이터셋, 작업코드 네이밍 잘 정하기