정의
🚨 왜 값이 아닌 구간일까?
우리가 알고 싶은건 모집단의 평균(μ)이지만, 실제로 알 수 없으니 표본의 평균(𝑥ˉ)울 구해서 추정
그러나 표본의 평균은 매번 달라지므로 μ가 들어 있을 법한 범위를 예측하는 것
계산
[표준정규분포]
[t분포]
특징
예시
학생 키 평균 추정:
학생 키 개별값 예측:
👉 신뢰구간과 예측구간 모두 “불확실성을 고려해서” 범위를 잡는데, 개별 값은 더 불확실해서 구간이 더 넓음
🚨 [주의] 95%의 신뢰 구간이란?
“이번 신뢰구간이 μ를 95% 확률로 담는다” ❌
“이러한 신뢰구간을 100번 만들면, 95번은 μ를 포함한다” ✅
정의
계산
예시
동전 던지기(동전을 100번 던졌을 때 앞면의 개수의 분포가 정규분포를 이룸)
시험 점수
- 현실에서는 정확한 모집단의 데이터를 구할수 없어 표준편차(σ)를 알 수 없음
- 따라서 σ대신 표본의 표준편차 s로 대신 추정
- 표본으로 구한 s는 매번 오차가 있기에 매번 달라져 불확실성이 있음
- 불확실성을 해소하고자 정규분포 대신 t-분포 사용
| 구분 | 신뢰구간 | 예측구간 |
|---|---|---|
| 정의 | 모집단의 모수(예: 모평균)를 추정 | 새로운 개별 데이터 값을 예측 |
| 특징 | - 범위가 좁음 - 모집단 평균과 같이 한정된 값을 추정 - 예: 1억 마리의 개 중 푸들 찾기 | - 범위가 넓음 - 개별 데이터 값은 분산이 크므로 예측 어려움 - 예: 1억 마리의 개 중 뽀삐 한 마리 찾기 |