탐색적 데이터 분석

dkdiek·2024년 11월 2일

데이터분석

목록 보기
14/14

탐색적 데이터 분석은 가설을 미리 설정하고 맞는 데이터 수집과 통계 분석하는 것이 아닌, 수집하고 시각화하여 패턴을 도출한 후 결론 혹은 현상을 발견하는 분석법이다.

탐색적 데이터 분석의 대표적인 방법 중 하나가 바로 시각화이다.

확증적 데이터 분석

전통적인 분석 방법, 가설을 미리 설정하고 가설을 검증하기 위해 데이터를 수집하는 것. 수집 데이터를 토대로 가설의 옳고 그름을 검증.

탐색적 데이터 분석과 확증적 데이터 분석의 차이

화창한 날이 흐린날보다 여성을 유혹하기 쉽다(번호 얻기 쉽다)는 연구 결과

  • 탐색적 데이터 분석 : 수집한 데이터를 토대로 자료를 분석하였을 때 일부 남성들이 다른 남서에 비해 더 쉽게 유혹한다는 현상을 발견하였고 이때의 차이는 날씨가 흐린 날과 화창한 날의 차이였다. 이로 인해, '여성을 유혹할 때 날씨가 고나계 있다.'라는 인사이트를 도출.

  • 확증적 데이터 분석 : '여성을 유혹할 때 날씨가 관계가 있다.'는 가설을 세우고 이 가설이 맞는지 확인하기 위해 무작위 테스트 진행. 결과에 따라 가설이 참인지 거짓인지 결정된다.

차트

막대차트 : 순위 비교, 여러 데이터 간의 순위 와 정도 비교 시 유용.

분산형 차트(산점도) : 여러 데이터 간 속성 관계 파악에 용이.

꺽은선형 차트 : 시간 흐름에 따른 변화 파악

데이터 값의 속성의 다양함으 표현하기에 한계가 있어 영역형 차트 또는 막대형 차트 함께 활용하기도 함.

지도 차트 : 지리적 위치에 따른 비교

원형 차트 : 차지 비중 파악이 용이

트리맵 차트 : 사각형 크기로 표현

많은 계층 구조(트리)의 데이터 표시에 적합

0개의 댓글