샘플링과 리샘플링

까만호랭·2023년 11월 21일

샘플링(Sampling)

  • 모집단에서 표본을 임의로 추출하는 것이다.
  • 샘플링을 하는 이유는 모집단을 전부 조사하는 것이 불가능하기 때문이다.
  • 신뢰구간, standard error, 오버피팅, 분산 등과 밀접한 관련이 있다.

리샘플링(Resampling)

  • 표본이 과연 모집단을 얼마나 대표한다고 볼 수 있을까?"라는 질문에 대한 대답을 내놓기 위해 샘플링을 다시 수행하는 것이다.
  • 샘플의 부분집합을 뽑아서 통계량의 변동성을 확인하기 위해 리샘플링을 수행한다.
  • 리샘플링의 예로는 KFold교차검증, 부트스트랩핑이 있다.

KFold교차검증 : 비복원 추출로 전체 데이터를 k개로 나누어, k번 확인 하는 방법

부트스트래핑 : 주어진 데이터로부터 복원추출을 통해 샘플을 반복적으로 뽑아서 통계적 추정치를 계산하고 그 신뢰 구간을 평가하는 방법

profile
남들과 함께 발자국을 남기는 까만호랭

0개의 댓글