[proDS] 자료의 이해 - 시각화

Gammi·2022년 11월 22일
0

proDS

목록 보기
3/13

📚 자료의 정리 방법


  • 통계표, 도수분포표, 상대도수 히스토그램 등

📕 분할표


  • 두 개 이상의 변수 동시에 고려하여 빈도 정리

  • 우리가 제일 많이 보는 표 생각하면 됨

  • 가로, 세로의 총합 구함


📕 질적자료의 해석


  • 도수분포표

    -> 도수 : 자료의 빈도수

    -> 상대도수 : 도수 / 전체도수(0과 1 범위 안의 값으로 나타냄)

    A : 3
    B : 5
    C : 6
    D : 6
    합계 : 20 이라고 했을 때
    도수는 3, 5, 6, 6을 가리킨다.
    상대 도수는 
    3/20 * 100 =  0.15
    5/20 * 100 = 0.25
    6/20 * 100 = 0.3
    6/20 * 100 = 0.3
    이런 식으로 구하면 됨!
    상대도수의 합은 1이 되어야 한다!

📕 일변량 차트


  • 변수가 하나

📗 히스토그램(수치형)


  • 표로 되어 있는 도수 분포를 정보 그림으로 나타낸 것

  • 가로축이 계급, 세로축이 도수

  • 데이터의 중심 알 수 있음

  • 좌우 대칭분포 알 수 있음

  • 데이터가 몰린 것을 통해 그룹의 여부 알 수 있음

    -> 양측으로 데이터가 나뉘면 두 개의 그룹을 가지고 있는 것!

  • 이상치 유무 알 수 있음


📗 박스 플롯(수치형)


  • 데이터를 사분위수로 쪼개는 것

  • 상자그림의 수가 그룹의 수

    -> 일변량 차트라서 박스 하나만 사용

  • 데이터의 분포(대칭 / 비대칭) 알 수 있음

  • 최소값과 최대값 알 수 있음

  • 이상치 유무 확인 가능

  • 데이터의 값이 모두 같을 경우 주황색 선 하나만 나타남


📕 다변량 차트


  • 변수가 2개 이상

  • 박스 플롯의 경우 박스 여러 개 나타남

  • 수치형 & 범주형 데이터 : 박스 플롯, 바차트

  • 범주형 & 범주형 데이터 : 모자이크 플롯

  • 범주형 & 범주형 & 수치형 데이터 : 스택 차트


📗 산점도(수치형 & 수치형 데이터)


  • 데이터를 점으로 표현한 것

  • 혼자 동 떨어진 점 있을 경우 이상치임

  • 그룹의 여부 알 수 있음

  • 데이터 간의 관계성을 가지고 있는지 알 수 있음

    -> 선형, 비선형, 곡선의 모양에 따라

  • 인과관계 알 수 없음

profile
개발자가 되었어요⭐️

0개의 댓글