모집단

통계학에서 관심의 대상이 되는 모든 개체 값의 집합

e.g. “대한민국 고등학생의 평균 키를 알고싶다.”
이때 모집단 : 대한민국의 ‘모든’ 고등학생들의 키 값

모수

모집단의 특성을 나타내는 통계적인 특성치

e.g. 모집단이 정규분포를 따른다고 할 때,
모집단의 분포 특성을 나타내는 모수는 μ(평균)과 σ2(표준편차)

통계적 추론

통계적 추론 : 모집단에서 추출한 표본들의 특성을 분석하여, 모수에 대해 추론하는 과정

모수는 모집단을 모두 조사 해야 얻을 수 있는 값이지만, 전수검사가 어렵기 때문에 ‘통계적 추론’을 한다.

표본

전체 모집단에 대해서 샘플링을 통해 뽑히는 값.

e.g. 대한민국 전체 고등학생 중 100명을 뽑아 키를 조사!
100개의 sample에서 얻은 통계량을 이용해 모수를 추론


**모집단,모수,표본 추출**

  • 전반적인 프로세스 : 모집단이 갖는 분포를 가정

    • sample들을 추출
    • 뽑힌 sample들을 통해 얻어진 통계량이 지닌 성질을 이용해 모수를 추정할 수 있다.
  • 모집단의 모수를 잘 추정하기 위해서는 표본을 ‘잘 ’ 추출하는 것이 중요!

    • 모집단은 무작위 추출을 해야 된다.
      • 무작위 추출(i.i.d) : 서로 독립적이야된다. 또한 동일한 분포를 갖고 있어야 된다.
  • 독립적? : sample들이 추출될 때 서로 영향을 미치면 안됨

    • 친구라는 sample을 추출할 때 자매의 개념이 있으면 안됨.
  • 동일한 분포? : sample들이 동일한 모집단으로 부터 추출되어야 함.

    • 대한민국의 고등학생 키를 조사하려는데 미국 학생 데이터를 가져오면 안됨.
  • sample들의 통계량은 추출할 때 마다 달라지지만,
    여러번의 추출을 통해 얻어진 여러 통계량 값의 발생 분포를 그려보면
    통계량을 확률 변수로 하는 확률 분포를 얻을 수 있다.
    - 결국, 통계량의 확률 함수와 확률 분포를 이용하여 모수를 추정할 수 있게 된다.

0개의 댓글