[통계] 비모수통계

happiyoung_·2024년 9월 6일

intro

인공지능 모델 관련 논문을 읽던 중에 모수 통계학과 비모수 통계라는 용어가 나와 정리해보려 한다.

기본 용어 정리

모수를 알기 전에 모집단에 대해 알아야한다.

모집단, Population : 통계학에서 관심의 대상, 조사의 대상이 되는 모든 개체 값의 집합

쉽게 말해 모집단은 통계치를 내려고하는 대상의 전체 집단이다.

모수, Population Parameter : 모집단을 조사하여 얻을 수 있는 통계적인 특성치

쉽게 말해 모수는 모집단 분포의 특성을 규정짓는 척도이며, 모 평균 모 분산 모 비율 모 표준편차가 있다.
모수는 알려져 있지 않은 미지의 상수이며 통계적 추론을 통해 얻어낼 수 있는 값이라는 특징을 가진다.

통계적 추론 : 모집단에서 추출한 표본 특성을 분석하여, 모수에 대해 추측/추론을 하는 과정

표본 특성을 분석한다고 하는데 그렇다면 표본은 무엇이길래 특성을 분석하여 모수를 추론할 수 있을까

표본, sample : 조사 대상이 되는 전체 모집단에 대하여 샘플링을 통해 얻어지는 결과 값 (모집단의 부분집합)

대상이 되는 모든 부분을 조사하긴 힘드니, 무작위 추출을 통해 검사를 진행하는 샘플링을 활용한다.

비모수 통계

모수에 대한 가정을 전제로 하지 않고 모집단의 형태에 관계없이 주어진 데이터에서 직접 확률을 계산하여 통계학적 검정을 하는 분석법

비모수 통계 사용 이유

  • 자료가 나타내는 모집단의 현상이 정규분포가 아닐때
  • 자료가 나타내는 모집단의 현상이 정규분포로 적절히 변환되지 못할때
  • 자료의 표본 (sample) 수가 적을 때
  • 자료들이 서로 독립적일 때
  • 변인의 척도가 명명척도나 서열척도일 때

비모수 통계의 특징

  • 가정을 만족시키지 못한 상태에서 모수 통계분석을 하는경우 발생할 수 있는 오류를 줄일 수 있다.
  • 질적 척도로 측정된 자료도 분석이 가능
  • 비교적 신속하고 쉽게 통계량을 구할 수 있으며 결과에 대한 해석 및 이해 또한 용이
  • 많은 표본을 추출하기 어려운 경우에 사용하기 적합

비모수 통계를 활용한 검정법

  • 부호검정
  • 윌콕슨 부호순위 검정
  • 만-휘트니 U 검정
  • 크러스컬-윌리스 검정

outro

데이터의 양이 많지않거나 모집단을 대표할만한 특징을 가지지 않을때 비모수 통계 방식을 사용할 수 있다.
또한, 논문에서는 데이터가 불확실하거나 노이즈가 많을 경우 비모수 통계 방식을 사용한다고 한다.

profile
해삐한 다영의 컴퓨터와 친해지기 프로젝트 🥰

0개의 댓글