
2개 이상의 변수로 구성된 데이터의 관계를 시각화 기반으로 파악하는 데이터 탐색 유형
주어진 변수간의 패턴과 트랜드 등 인사이트를 시각화를 통해 전체적으로 파악하는 것을 목적으로 한다.
일변량 시각화처럼 시각화하는 방안이므로, 데이터의 조합간의 형상을 개략적으로 파악하여 분석에 활용한다.
| 데이터 조합 | 시각화 방안 | 목적 |
|---|---|---|
| 범주형 - 범주형 | 모자이크 플롯 | 두개의 범주형 변수 내 볌주 별 조합의 빈도 크기를 개략적으로 파악 |
| 범주형 - 연속형 | 박스 플롯, 평행좌표 | 범주 별 연속형 변수의 기술통계량 및 경향성을 개략적으로 파악 |
| 연속형 - 연속형 | 산점도 | 연속형 변수 간 관계성을 개략적으로 파악 (선형/비선형 및 음양 방향 등) |
범주형 - 범주형 변수 조합 내 그룹(SubGroup) 크기 비교
범주 그룹 간 비중의 차이를 전체적으로 파악 가능
범주 수가 많고, 각 조합별 비중 차이가 크지 않을 경우, 전체적인 파악이 어려울 수 있음
각 조합별 구성의 빈도 크기의 우위를 표현한 것으로 빈도표를 시각화한 것을 보면 된다.

일변량 시각화 탐색에서도 언급했듯, 범주형 - 연속형 변수 조합 간 전반적인 요약 통계량 파악에 용이하다.
하나의 그래프 안에 다양한 정보를 쉽게 표현 (일변량 시각화 탐색 참고)
많은 데이터를 눈으로 직접 확인하기 어렵고, 대표적 통계 값만으로 파악하기 어려울 때 용이함
범주 그룹(범주형 변수)간 수치(연속형 변수)의 집합 범위와 중앙값, 이상치 등을 빠르게 확인할 수 있다.
기존의 비시각화 기반의 단순 수치값 비교(범주 별 요약 통계량 도출)보다 데이터가 설명하는 많은 정보 획득 가능

범주형-연속형 변수 조합 간 경향성 파악
연속형 데이터를 기반으로 데이터의 각 행을 선으로 연결하는 형태의 다변량 시각화 방안이다.
연속형 변수간 단위 표준화가 이루어지기 전의 데이터로 시각화할 경우, 파악이 어려울 수 있다.
주어진 데이터 내의 해당 범주 간 경향성을 파악하기 위해 사용하며, 여러개의 연속형 변수의 흐름을 하나의 그래프 안에서 파악하기 위한 시각화 방안이다.

연속형-연속형 변수 간 상관도를 파악하는데 사용되는 방안이다.
산점도는 다변량 연속형 변수를 시각화하는 가장 기본적인 방안이다.
연속형 데이터 간의 관계를 그래프 상으로 어떠한 관계가 있는지 파악하기 위해 사용한다.
변수 간 분포를 통해 선형 혹은 비선형 관계 및 음양의 방향 등을 빠르게 파악할 수 있다.
범주 Label 간 비교가 필요한 경우, 해당 부분의 그룹 정보를 표시하면, 변수 간 관계 및 범주 그룹 간 관계를 함계 파악 가능하다.

,