[세상에서 가장 쉬운 통계학 입문] 을 읽고 -표본평균 1-2
표본평균 1
: 여러 데이터의 평균값은 한 데이터의 평균값보다
모평균에 가깝다.표본평균을 구하는 이유
- 표본평균
모집단에서 발생한 표본 데이터를 모두 합하고,
데이터 총 개수로 나누어 평균을 구하는 것
(모평균과는 다르다)
- 관측 데이터를 증가시키면 증가시킬수록 표본평균이 모평균에 가까울 가능성이 높아진다.
- 표본평균은 엑스바로 읽는다.
표본평균=(관측된 데이터 합계) (관측 데이터 총 개수)
※ 대수의 법칙
하나의 모집단에서 n개의 데이터를 관측하고,
그 표본평균 를 만든다.
이때, n이 크면 클수록 표본평균은 모평균 에 가까운 수치를 구현할 가능성이 커진다.※ 모평균과 표본평균의 차이
- 모평균
모집단의 전체 데이터의 평균을 나타냅니다.
하지만, 모든 데이터를 수집하는 것은 어렵기 때문에,
흔히 모집단의 특정 부분을 대표하는 표본을 추출하여 분석
- 표본평균
전체 모집단에서 뽑아낸 일부 데이터 집합의 평균입니다. 표본평균은 실제 모평균을 추정하는 데 사용되며,
모집단의 특성을 대표하는 데 도움이 됩니다.=> 표본평균이라는 기술은 모평균을 더 정확하게 맞추는 추정을 하기 위한 방법
표본평균 2
: 관측 데이터가 늘어날수록 예언 구간은 좁아진다
1.정규분포에서 보이는 표본평균의 성질
- 정규모집단
모집단이 정규분포 하고 있는것
- 정규모집단에서의 표본평균의 성질
정규모집단의 모평균을 ,모표준편차를 라고 할 때,
여기에서 예측된 데이터 x의 n개에 대한 표본평균 의 분포는 역시 정규분포한다.
의 분포 평균값은 그대로지만,
표준편차는 가 되어서 모집단에 비해 분의 1로 줄어든다.2.정규모집단에서의 표본평균에 대한 95% 예언적중구간
- 일반정규분포의 95% 예언적중구간
평균값이 이고,표준편차가 인 정규분포의 95% 예언적중구간은
( -1.96)이상 ( +1.96) 이하
=> 이것을 정규모집단으로 바꾸어,
모평균 에서 모표준편차 인 1.96배의 범위 내에 있는 데이터가 관측된다고 예언하면,
이것은 95%의 확률로 적중한다는 말이 된다.
- 정규모집단에서 표본평균의 95% 예언적중구간
모평균이 이고,모표준편차가 인 정규모집단에서 데이터 n개의 표본평균에 대한 95% 예언적중구간은 ( -1.96) 이상 ( +1.96)