1종오류, 2종오류

HanJu Han·2024년 8월 17일

1종 오류와 2종 오류는 통계적 가설 검정에서 중요한 개념입니다.

  1. 1종 오류 (Type I Error)

정의: 귀무가설이 실제로 참일 때, 이를 잘못 기각하는 오류

  • 일반적으로 'α' (알파)로 표시됩니다.
  • "거짓 양성" (False Positive)이라고도 합니다.

예시:

  • 상황: 새로운 약물 테스트
  • 귀무가설: "이 약물은 효과가 없다"
  • 1종 오류: 실제로는 효과가 없는 약물을 효과가 있다고 잘못 결론 내리는 것

특징:

  • 유의수준(α)을 설정하여 1종 오류의 최대 허용 확률을 제한합니다.
  • 일반적으로 α = 0.05 또는 0.01을 사용합니다.
  1. 2종 오류 (Type II Error)

정의: 귀무가설이 실제로 거짓일 때, 이를 기각하지 못하는 오류

  • 일반적으로 'β' (베타)로 표시됩니다.
  • "거짓 음성" (False Negative)이라고도 합니다.

예시:

  • 상황: 동일한 약물 테스트
  • 귀무가설: "이 약물은 효과가 없다"
  • 2종 오류: 실제로는 효과가 있는 약물을 효과가 없다고 잘못 결론 내리는 것

특징:

  • 검정력(Power) = 1 - β: 귀무가설이 거짓일 때 이를 올바르게 기각할 확률
  • 표본 크기를 늘리면 2종 오류를 줄일 수 있습니다.

1종 오류와 2종 오류의 관계:

  1. 상충관계 (Trade-off):

    • 1종 오류를 줄이면 2종 오류가 증가하는 경향이 있습니다.
    • 반대로 2종 오류를 줄이면 1종 오류가 증가할 수 있습니다.
  2. 균형 잡기:

    • 연구자는 두 오류 사이의 균형을 고려해야 합니다.
    • 상황에 따라 어떤 오류가 더 심각한 결과를 초래할지 판단해야 합니다.
  3. 영향 요소:

    • 표본 크기
    • 효과 크기
    • 유의수준(α)
    • 검정력(1 - β)

실제 예시를 통한 설명:

상황: 코로나19 진단 검사

  1. 1종 오류 (거짓 양성):

    • 실제로는 코로나19에 감염되지 않은 사람을 감염되었다고 잘못 진단
    • 결과: 불필요한 격리, 심리적 스트레스, 의료 자원 낭비
  2. 2종 오류 (거짓 음성):

    • 실제로는 코로나19에 감염된 사람을 감염되지 않았다고 잘못 진단
    • 결과: 감염 확산, 적절한 치료 지연

이 경우, 2종 오류(거짓 음성)가 더 심각한 결과를 초래할 수 있습니다. 따라서 검사의 민감도를 높여 2종 오류를 줄이는 것이 중요할 수 있습니다.

오류 최소화 전략:

  1. 표본 크기 증가
  2. 더 정확한 측정 도구 사용
  3. 효과 크기 증대
  4. 적절한 유의수준 선택

결론:
1종 오류와 2종 오류를 이해하고 관리하는 것은 과학적 연구와 의사결정에서 매우 중요합니다. 이를 통해 연구 결과의 신뢰성을 평가하고, 적절한 결론을 도출할 수 있습니다. 또한, 이러한 오류의 가능성을 인식함으로써, 연구 설계를 개선하고 결과 해석에 더욱 신중을 기할 수 있습니다.


1종 오류와 2종 오류 사이의 상충관계(Trade-off)

예시: 코로나19 진단 테스트

상황:
새로운 코로나19 진단 테스트를 개발했다고 가정해봅시다. 이 테스트의 정확도를 평가하고 있습니다.

귀무가설(H₀): "이 사람은 코로나19에 감염되지 않았다"

  1. 1종 오류 (거짓 양성): 실제로 감염되지 않은 사람을 감염되었다고 잘못 진단
  2. 2종 오류 (거짓 음성): 실제로 감염된 사람을 감염되지 않았다고 잘못 진단

이제 테스트의 민감도(sensitivity)를 조절하면서 어떤 일이 발생하는지 살펴보겠습니다:

케이스 1: 높은 민감도 (낮은 기준점)

설정: 테스트에서 아주 작은 바이러스 흔적만 발견되어도 양성으로 판정

결과:

  • 1종 오류 (거짓 양성) 증가: 많은 비감염자가 양성으로 잘못 판정됨
  • 2종 오류 (거짓 음성) 감소: 대부분의 감염자가 정확히 식별됨

영향:

  • 장점: 거의 모든 감염자를 찾아낼 수 있음
  • 단점: 많은 비감염자가 불필요하게 격리되고 의료 자원이 낭비됨

케이스 2: 낮은 민감도 (높은 기준점)

설정: 테스트에서 상당한 양의 바이러스가 발견되어야만 양성으로 판정

결과:

  • 1종 오류 (거짓 양성) 감소: 비감염자가 양성으로 잘못 판정될 확률이 낮아짐
  • 2종 오류 (거짓 음성) 증가: 일부 감염자가 음성으로 잘못 판정될 수 있음

영향:

  • 장점: 비감염자가 불필요하게 격리되는 경우가 줄어듦
  • 단점: 일부 감염자를 놓칠 수 있어 바이러스 확산 위험이 증가함

실제 적용:

  1. 공중 보건 정책:

    • 팬데믹 초기: 높은 민감도를 선택하여 2종 오류를 최소화할 수 있습니다. 일부 거짓 양성을 감수하더라도 모든 가능한 감염자를 식별하는 것이 중요할 수 있습니다.
    • 팬데믹 후기: 낮은 민감도를 선택하여 1종 오류를 줄일 수 있습니다. 의료 시스템의 부담을 줄이고 불필요한 격리를 방지할 수 있습니다.
  2. 법적 시스템:

    • "무죄추정의 원칙"은 1종 오류(무고한 사람을 유죄로 판단)를 최소화하는 접근 방식입니다.
    • 이는 2종 오류(유죄인 사람을 무죄로 풀어주는 것)의 가능성을 높이는 대가로 이루어집니다.
  3. 품질 관리:

    • 매우 중요한 안전 부품: 높은 민감도를 선택하여 2종 오류를 최소화합니다. 일부 양품을 불량품으로 잘못 분류하더라도 모든 가능한 불량품을 찾아내는 것이 중요합니다.
    • 일반 소비재: 낮은 민감도를 선택하여 1종 오류를 줄입니다. 불필요한 폐기를 방지하고 생산 효율성을 높일 수 있습니다.

결론:
1종 오류와 2종 오류 사이의 상충관계는 피할 수 없는 통계적 현실입니다. 연구자나 정책 입안자는 상황에 따라 어떤 오류를 더 중요하게 고려해야 할지 신중히 판단해야 합니다. 이는 단순히 통계적 결정이 아니라 윤리적, 경제적, 사회적 영향을 모두 고려해야 하는 복잡한 의사결정 과정입니다.

profile
시리즈를 기반으로 작성하였습니다.

0개의 댓글