- 수집된 데이터를 이용하여 유용한 정보를 도출하는 분석을 말한다.
크게 기술 통계(Descriptive Statistics)와 추론 통계(Inferential statistics)로 나뉜다.
- 모집단의 특성을 한 눈에 파악할 수 있도록 데이터를 요약, 정리해서 표현하는 방법
# 파이썬을 통해서 기술 통계치를 나타내는 방법
import pandas as pd
df = dp.DataFrame({'a' : [1,2,3,4,5],
'b' : [2,4,6,8,10]}
df.describe()
- 모집단에 대한 조사가 불가능하거나 비효율적일 때, 모집단 일부(표본)만을 관측하여 모집단의 특성을 추측하는 분석이다.
- 추론통계 분석은 모집단에 대한 가설을 통계적으로 검정하거나, 모집단의 통계치를 추정한다.
예를 들어 여론조사, 정당의 지지도 조사를 할 때, 모든 유권자에게 의견을 묻는 것은 비용이 상당하므로, 일정 수의 유권자에게만 의견을 물어 전체 유권자의 지지도를 추측한다. (출구조사)
모집단에서 표본을 샘플링 하는 방법 중 대표적인 4가지는 다음과 같다.