요약 : 정략적 경험 데이터를 기술 통계와 추론 통계를 통해 분석하고 시각화 하는 법
주요 포인트
수집된 데이터의 특성을 파악하기 위해 기술 통계를 활용하고, 샘플을 통해 모집단을 추론하거나
가설을 검정하기 위해 추론 통계를 활용한다.
기술 통계는 범주형, 수치형, 방사형 등의 데이터 종류가 있으며,
범주형 데이터의 경우 ‘파이 차트와 누적 막대 그래프’를 통해 시각화한다.
수치형 데이터의 경우 ‘막대 그래프와 선 그래프’를 통해 시각화한다.
방사형 그래프와 산점도
추론 통계에는 t 검정과 분산분석, 상관 분석과 회귀 분석을 할 수 있다.
t 검정과 분산 분석
상관 분석과 회귀 분석
현업에서 활용하는 법
핵심개념 : 데이터 분석은 정량적 데이터를 통해 특정 행동 등이 발생한 횟수를 확인할 수 있고, 정성적 데이터를 통해 특정 행동이 일어난 이유를 알 수 있다.
용어 정리
1) 기술 통계
- 빈도나 평균과 같은 수집된 데이터의 특성을 파악하는데 활용
(1) 범주형 데이터(파이 차트와 누적 막대 그래프)
- 파이 차트 : 전체 참가자의 특정한 행동이 차지하는 비율을 직관적
- 누적 막대 그래프 : 전체 참가자의 특정 행동이 차지하는 비율 + 연속된 데이터
(2) 수치형 데이터(막대 그래프와 선 그래프)
- 막대그래프 : 분리된 카테고리에 대한 연속적인 값을 표현할 때 효과적
- 선그래프 : 카테고리가 연속적인 속성을 가진다면 선그래프가 효과적
(3) 방사형 그래프와 산점도
- 방사형 그래프 : 특정 대상에 대해 여려 평가 항목들로 비교하여 전체적인 경향 유추
- 산점도 : 서로 다른 두 척도를 비교 + 두 변수 간의 관계를 확인
2) 추론 통계
- 표본을 통해 모집단을 추론하거나 가설을 검정하기 위한 방법
- 정규 분포 : 전체 사용자와 같이 많은 수의 사용자의 특성을 분포로 나타내어 평균을 중심으로 좌우대칭의 분포
(1) t 검정과 분산분석
- t 검정 : 두 집단의 평균 차이를 비교
- 분산분석: 비교 대상이 2개를 초과한다면 분산분석
(2) 상관 분석과 회귀 분석
- 상관 분석 : 2개 이상의 변수들의 선형적인 관계를 살펴보기 위한 분석 방법
- 회귀 분석 : 하나의 종속 변수에 대해 다수의 독립변수들이 어떻게 영향을 미치는지에 대한 인과 관계를 분석