[통계] 선택편향

hyun·2022년 8월 12일
0

통계

목록 보기
4/37

선택편향

선택 편향(영어: selection bias) 또는 선택적 보고(영어: selective reporting)는 표본을 사전 또는 사후 선택함에 따라 통계 분석을 왜곡하는 오류
출처 : 위키백과

추출한 데이터를 가지고, 혹은 잘못된 표본을 추출하여 편향된 Output을 내게 되는 현상.
📚 데이터 스누핑 (data snooping) : 흥미로운 것이 나올 때까지 데이터를 뒤지는 것

📚 방대한 검색효과 (vast search effect) : 중복 데이터 모델링이나 너무 많은 예측변수를 고려하는 모델에서 비롯되는 편향 혹은 비재현성

📚 이외에도 비임의표본추출, 데이터 체리피킹(골라먹기), 특정 통계적 효과를 강조하는 시간 선택, 흥미로운 결과가 나오고 실험 중단하기 등이 선택편향을 발생시킨다.


따라서 데이터를 확대해석하지 말고, 많은 변수를 처리하는 모델을 만들 때 신중해야 한다.

0개의 댓글