통계학에서 관심의 대상이 되는 모든 개체 값의 집합
e.g. “대한민국 고등학생의 평균 키를 알고싶다.”
이때 모집단 : 대한민국의 ‘모든’ 고등학생들의 키 값
모집단의 특성을 나타내는 통계적인 특성치
e.g. 모집단이 정규분포를 따른다고 할 때,
모집단의 분포 특성을 나타내는 모수는 μ(평균)과 σ2(표준편차)
통계적 추론 : 모집단에서 추출한 표본들의 특성을 분석하여, 모수에 대해 추론하는 과정
모수는 모집단을 모두 조사 해야 얻을 수 있는 값이지만, 전수검사가 어렵기 때문에 ‘통계적 추론’을 한다.
전체 모집단에 대해서 샘플링을 통해 뽑히는 값.
e.g. 대한민국 전체 고등학생 중 100명을 뽑아 키를 조사!
100개의 sample에서 얻은 통계량을 이용해 모수를 추론
전반적인 프로세스 : 모집단이 갖는 분포를 가정
모집단의 모수를 잘 추정하기 위해서는 표본을 ‘잘 ’ 추출하는 것이 중요!
독립적? : sample들이 추출될 때 서로 영향을 미치면 안됨
동일한 분포? : sample들이 동일한 모집단으로 부터 추출되어야 함.
sample들의 통계량은 추출할 때 마다 달라지지만,
여러번의 추출을 통해 얻어진 여러 통계량 값의 발생 분포를 그려보면
통계량을 확률 변수로 하는 확률 분포를 얻을 수 있다.
- 결국, 통계량의 확률 함수와 확률 분포를 이용하여 모수를 추정할 수 있게 된다.