Biostatistics 통계 분석- Bootstrapping (부트스트랩)

Hoya Jaeho Lee·2022년 2월 25일
0

Biostatistics

목록 보기
5/20


통계학에서의 bootstrap은 비모수 추정 방법으로
가설 검증을 하기 전에 random sampling을 적용하는 방법을 말합니다.
예시를 들어보면 어떤 집단에서 값을 측정할 때, 임의로 100개를 뽑아 평균을 구하는 예가 있을 수 있습니다.
측정된 n개의 표본 데이터 중에서 중복을 허용하여 (replacement) m개를 뽑아서 그들의 평균을 구하고 이를 여러번 반복합니다. 이 방법으로 평균의 분포를 구할 수 있고, 95%의 신뢰구간을 계산하여 각 부트 스트랩 샘플의 평균으로 모집단 평균에 대한 신뢰구간을 구할 수 있습니다. 굳이 분포가 아니더라도 모델의 통계량을 추정하거나 알고 싶을때도 쓰일 수 있습니다.

본 방법은 원래의 분포를 모르거나 표본 데이터의 수가 적을 때 본 방법을 적용할 수 있습니다.

부트스랩을 이용한 R 실습 코드는 아래 제 깃허브에서 확인 가능합니다:)
https://github.com/hoyajhl/R_stat/blob/main/bootstrapping.R

References
https://medium.com/@vighneshtiwari16377/a-gentle-guide-to-bootstrap-method-in-ensemble-algorithms-ff08c2719657
https://m.blog.naver.com/pmw9440/221863270023
https://www.rdocumentation.org/packages/simpleboot/versions/1.1-7/topics/one.boot
https://ichi.pro/ko/r-yejegaissneun-buteu-seuteulaeb-e-daehan-sil-yongjeog-in-gaideu-208457827802346
https://www.youtube.com/watch?v=r8dhU6YShuQ

profile
Biostatistics researcher Github: https://github.com/hoyajhl

0개의 댓글