- 모집단에서 표본을 임의로 추출하는 것이다.
- 샘플링을 하는 이유는 모집단을 전부 조사하는 것이 불가능하기 때문이다.
- 신뢰구간, standard error, 오버피팅, 분산 등과 밀접한 관련이 있다.
- 표본이 과연 모집단을 얼마나 대표한다고 볼 수 있을까?"라는 질문에 대한 대답을 내놓기 위해 샘플링을 다시 수행하는 것이다.
- 샘플의 부분집합을 뽑아서 통계량의 변동성을 확인하기 위해 리샘플링을 수행한다.
- 리샘플링의 예로는 KFold교차검증, 부트스트랩핑이 있다.
부트스트래핑 : 주어진 데이터로부터 복원추출을 통해 샘플을 반복적으로 뽑아서 통계적 추정치를 계산하고 그 신뢰 구간을 평가하는 방법