2.5 신뢰구간
1. 용어정리
- 신뢰수준(confidence level): 같은 모집단으로부터 같은 방식으로 얻은, 관심 통계량을 포함할 것으로 예상되는, 신뢰구간의 백분율
- 구간끝점(interval endpoint): 신뢰구간의 최상위, 최하위 끝점
2. 부트스트랩 신뢰구간 구하는 법
- 데이터에서 복원추출 발식으로 크기 n인 표본을 뽑는다.(재표본추출)
- 재표본추출한 표본에 대해 원하는 통계량을 기록한다.
- 1~2단계를 R번 반복한다.
- x% 신뢰구간을 구하기 위해, R개의 재표본 결과의 분포 양쪽 끝에서 [(100 - x) / 2]% 만큼 잘라낸다.
- 절단한 점들은 x% 부트스트랩 신뢰구간의 양 끝점이다.
3. 신뢰구간
- '참값이 일정 구간안에 있을 확률은 얼마인가?' = 답은 신뢰구간
- '표본 경과각 주어졌을 때 (모집단에 대해 어떤 것이 참일) 확률은 무엇인가?' = 답은 신뢰구간
[출처: 데이터 과학을 위한 통계]
피터 브루스, 앤드루 브루스의 <데이터 과학을 위한 통계(2판): 데이터 분석에서 머신러닝까지 50가지 핵심 개념> 을 읽고 정리한 내용입니다.