인공지능 모델 관련 논문을 읽던 중에 모수 통계학과 비모수 통계라는 용어가 나와 정리해보려 한다.
모수를 알기 전에 모집단에 대해 알아야한다.
모집단, Population : 통계학에서 관심의 대상, 조사의 대상이 되는 모든 개체 값의 집합
쉽게 말해 모집단은 통계치를 내려고하는 대상의 전체 집단이다.
모수, Population Parameter : 모집단을 조사하여 얻을 수 있는 통계적인 특성치
쉽게 말해 모수는 모집단 분포의 특성을 규정짓는 척도이며, 모 평균 모 분산 모 비율 모 표준편차가 있다.
모수는 알려져 있지 않은 미지의 상수이며 통계적 추론을 통해 얻어낼 수 있는 값이라는 특징을 가진다.
통계적 추론 : 모집단에서 추출한 표본 특성을 분석하여, 모수에 대해 추측/추론을 하는 과정
표본 특성을 분석한다고 하는데 그렇다면 표본은 무엇이길래 특성을 분석하여 모수를 추론할 수 있을까
표본, sample : 조사 대상이 되는 전체 모집단에 대하여 샘플링을 통해 얻어지는 결과 값 (모집단의 부분집합)
대상이 되는 모든 부분을 조사하긴 힘드니, 무작위 추출을 통해 검사를 진행하는 샘플링을 활용한다.
모수에 대한 가정을 전제로 하지 않고 모집단의 형태에 관계없이 주어진 데이터에서 직접 확률을 계산하여 통계학적 검정을 하는 분석법
데이터의 양이 많지않거나 모집단을 대표할만한 특징을 가지지 않을때 비모수 통계 방식을 사용할 수 있다.
또한, 논문에서는 데이터가 불확실하거나 노이즈가 많을 경우 비모수 통계 방식을 사용한다고 한다.