1종오류, 2종오류

HanJu Han·2024년 8월 17일

1종 오류와 2종 오류는 통계적 가설 검정에서 중요한 개념입니다.

1종 오류 (Type I Error)

정의: 귀무가설이 실제로 참일 때, 이를 잘못 기각하는 오류

일반적으로 'α' (알파)로 표시됩니다.
"거짓 양성" (False Positive)이라고도 합니다.

예시:

상황: 새로운 약물 테스트
귀무가설: "이 약물은 효과가 없다"
1종 오류: 실제로는 효과가 없는 약물을 효과가 있다고 잘못 결론 내리는 것

특징:

유의수준(α)을 설정하여 1종 오류의 최대 허용 확률을 제한합니다.
일반적으로 α = 0.05 또는 0.01을 사용합니다.

2종 오류 (Type II Error)

정의: 귀무가설이 실제로 거짓일 때, 이를 기각하지 못하는 오류

일반적으로 'β' (베타)로 표시됩니다.
"거짓 음성" (False Negative)이라고도 합니다.

예시:

상황: 동일한 약물 테스트
귀무가설: "이 약물은 효과가 없다"
2종 오류: 실제로는 효과가 있는 약물을 효과가 없다고 잘못 결론 내리는 것

특징:

검정력(Power) = 1 - β: 귀무가설이 거짓일 때 이를 올바르게 기각할 확률
표본 크기를 늘리면 2종 오류를 줄일 수 있습니다.

1종 오류와 2종 오류의 관계:

상충관계 (Trade-off):
- 1종 오류를 줄이면 2종 오류가 증가하는 경향이 있습니다.
- 반대로 2종 오류를 줄이면 1종 오류가 증가할 수 있습니다.
균형 잡기:
- 연구자는 두 오류 사이의 균형을 고려해야 합니다.
- 상황에 따라 어떤 오류가 더 심각한 결과를 초래할지 판단해야 합니다.
영향 요소:
- 표본 크기
- 효과 크기
- 유의수준(α)
- 검정력(1 - β)

실제 예시를 통한 설명:

상황: 코로나19 진단 검사

1종 오류 (거짓 양성):
- 실제로는 코로나19에 감염되지 않은 사람을 감염되었다고 잘못 진단
- 결과: 불필요한 격리, 심리적 스트레스, 의료 자원 낭비
2종 오류 (거짓 음성):
- 실제로는 코로나19에 감염된 사람을 감염되지 않았다고 잘못 진단
- 결과: 감염 확산, 적절한 치료 지연

이 경우, 2종 오류(거짓 음성)가 더 심각한 결과를 초래할 수 있습니다. 따라서 검사의 민감도를 높여 2종 오류를 줄이는 것이 중요할 수 있습니다.

오류 최소화 전략:

표본 크기 증가
더 정확한 측정 도구 사용
효과 크기 증대
적절한 유의수준 선택

결론:
1종 오류와 2종 오류를 이해하고 관리하는 것은 과학적 연구와 의사결정에서 매우 중요합니다. 이를 통해 연구 결과의 신뢰성을 평가하고, 적절한 결론을 도출할 수 있습니다. 또한, 이러한 오류의 가능성을 인식함으로써, 연구 설계를 개선하고 결과 해석에 더욱 신중을 기할 수 있습니다.

1종 오류와 2종 오류 사이의 상충관계(Trade-off)

예시: 코로나19 진단 테스트

상황:
새로운 코로나19 진단 테스트를 개발했다고 가정해봅시다. 이 테스트의 정확도를 평가하고 있습니다.

귀무가설(H₀): "이 사람은 코로나19에 감염되지 않았다"

1종 오류 (거짓 양성): 실제로 감염되지 않은 사람을 감염되었다고 잘못 진단
2종 오류 (거짓 음성): 실제로 감염된 사람을 감염되지 않았다고 잘못 진단

이제 테스트의 민감도(sensitivity)를 조절하면서 어떤 일이 발생하는지 살펴보겠습니다:

케이스 1: 높은 민감도 (낮은 기준점)

설정: 테스트에서 아주 작은 바이러스 흔적만 발견되어도 양성으로 판정

결과:

1종 오류 (거짓 양성) 증가: 많은 비감염자가 양성으로 잘못 판정됨
2종 오류 (거짓 음성) 감소: 대부분의 감염자가 정확히 식별됨

영향:

장점: 거의 모든 감염자를 찾아낼 수 있음
단점: 많은 비감염자가 불필요하게 격리되고 의료 자원이 낭비됨

케이스 2: 낮은 민감도 (높은 기준점)

설정: 테스트에서 상당한 양의 바이러스가 발견되어야만 양성으로 판정

결과:

1종 오류 (거짓 양성) 감소: 비감염자가 양성으로 잘못 판정될 확률이 낮아짐
2종 오류 (거짓 음성) 증가: 일부 감염자가 음성으로 잘못 판정될 수 있음

영향:

장점: 비감염자가 불필요하게 격리되는 경우가 줄어듦
단점: 일부 감염자를 놓칠 수 있어 바이러스 확산 위험이 증가함

실제 적용:

공중 보건 정책:
- 팬데믹 초기: 높은 민감도를 선택하여 2종 오류를 최소화할 수 있습니다. 일부 거짓 양성을 감수하더라도 모든 가능한 감염자를 식별하는 것이 중요할 수 있습니다.
- 팬데믹 후기: 낮은 민감도를 선택하여 1종 오류를 줄일 수 있습니다. 의료 시스템의 부담을 줄이고 불필요한 격리를 방지할 수 있습니다.
법적 시스템:
- "무죄추정의 원칙"은 1종 오류(무고한 사람을 유죄로 판단)를 최소화하는 접근 방식입니다.
- 이는 2종 오류(유죄인 사람을 무죄로 풀어주는 것)의 가능성을 높이는 대가로 이루어집니다.
품질 관리:
- 매우 중요한 안전 부품: 높은 민감도를 선택하여 2종 오류를 최소화합니다. 일부 양품을 불량품으로 잘못 분류하더라도 모든 가능한 불량품을 찾아내는 것이 중요합니다.
- 일반 소비재: 낮은 민감도를 선택하여 1종 오류를 줄입니다. 불필요한 폐기를 방지하고 생산 효율성을 높일 수 있습니다.

결론:
1종 오류와 2종 오류 사이의 상충관계는 피할 수 없는 통계적 현실입니다. 연구자나 정책 입안자는 상황에 따라 어떤 오류를 더 중요하게 고려해야 할지 신중히 판단해야 합니다. 이는 단순히 통계적 결정이 아니라 윤리적, 경제적, 사회적 영향을 모두 고려해야 하는 복잡한 의사결정 과정입니다.

HanJu Han

시리즈를 기반으로 작성하였습니다.

이전 포스트

표준오차

다음 포스트

1종오류, 2종오류

표준오차

A/B test 샘플 사이즈 구하기

0개의 댓글