raw data에 대해 데이터를 이용하기전에 탐색하는 과정필요
시각화로 패턴발견
데이터 특이성 확인
가설검정
EDA 방법
1) 그래픽 : 차트혹은 그림
2) 논그래픽 : 숫자형태
EDA 타겟 (데이터)
1) 변수 1개(데이터의 분포)
2) 변수 여러개 (데이터의 관계)
데이터 cleaning : 노이즈, 에러 없앰
데이터 integration : 데이터를 하나로 합침
데이터 transfromation : 모델링하기 쉽게 변화
데이터 reduction : 핵심 데이터만 사용