두 개 이상의 변수 동시에 고려하여 빈도 정리
우리가 제일 많이 보는 표 생각하면 됨
가로, 세로의 총합 구함
도수분포표
-> 도수 : 자료의 빈도수
-> 상대도수 : 도수 / 전체도수(0과 1 범위 안의 값으로 나타냄)
A : 3
B : 5
C : 6
D : 6
합계 : 20 이라고 했을 때
도수는 3, 5, 6, 6을 가리킨다.
상대 도수는
3/20 * 100 = 0.15
5/20 * 100 = 0.25
6/20 * 100 = 0.3
6/20 * 100 = 0.3
이런 식으로 구하면 됨!
상대도수의 합은 1이 되어야 한다!
표로 되어 있는 도수 분포를 정보 그림으로 나타낸 것
가로축이 계급, 세로축이 도수
데이터의 중심 알 수 있음
좌우 대칭분포 알 수 있음
데이터가 몰린 것을 통해 그룹의 여부 알 수 있음
-> 양측으로 데이터가 나뉘면 두 개의 그룹을 가지고 있는 것!
이상치 유무 알 수 있음
데이터를 사분위수로 쪼개는 것
상자그림의 수가 그룹의 수
-> 일변량 차트라서 박스 하나만 사용
데이터의 분포(대칭 / 비대칭) 알 수 있음
최소값과 최대값 알 수 있음
이상치 유무 확인 가능
데이터의 값이 모두 같을 경우 주황색 선 하나만 나타남
변수가 2개 이상
박스 플롯의 경우 박스 여러 개 나타남
수치형 & 범주형 데이터 : 박스 플롯, 바차트
범주형 & 범주형 데이터 : 모자이크 플롯
범주형 & 범주형 & 수치형 데이터 : 스택 차트
데이터를 점으로 표현한 것
혼자 동 떨어진 점 있을 경우 이상치임
그룹의 여부 알 수 있음
데이터 간의 관계성을 가지고 있는지 알 수 있음
-> 선형, 비선형, 곡선의 모양에 따라
인과관계 알 수 없음