이미지 출처: https://www.insilicogen.com/blog/361
확증적 데이터분석
으로 번역된다.탐색적 데이터 분석
으로 번역되며, 벨연구소의 수학자 ‘John Tukey’가 개발한 데이터분석 과정에 대한 개념이다.데이터에 대한 탐색과 이해
를 의미한다.Goals of EDA
1. approach to understanding data using visualization and statiscal tools
2. access and validate assumptions. In which future inferences will be based.
3. understand data before performing and intelligent hypothesis
1. 시각화 및 통계 도구를 활용한 데이터 이해
2. 도출하고자 하는 결과의 기본이 되는 가정에 접근하고 가정을 검증
3. 가설을 세우기 전에 데이터를 이해
출처: https://velog.io/@yuns_u/EDA-Exploratory-Data-Analysis
결측치 조치
, 범주형 데이터에 대해 category로 타입 변경
다중공선성 문제
)단변량 분석하면서 진행
boxplot은 결측치가 있으면 그려지지 않는다.
t-test 등 가설검정도구들은 결측치가 있으면 계산이 안 된다.
결측치 조치 후 boxplot
category로 타입 변경
이 선행되어야함.