데이터의 확률분포로 가정했다면 모추 추정 가능
정규분포의 모수는 평균 와 분산 으로 이를 추정하는 통계량은 다음과 같음
즉, 표본평균과 표본분산의 확률분포를 표집분포(sampling distribution)라 부르며, 특히 표본평균의 표집분포는 N이 커질수록 정규분포 (를 따름
이를 중심극한 정리라고 하며, 모집단의 분포가 정규분포를 따르지 않더라도 표본평균의 표집분포는 정규분포를 따름
단, 모집단이 정규분포를 따르지 않을 때 표본분포는 데이터가 무수히 많아도 정규분포를 따를 수 없음
확률분포마다 사용하는 모수가 다르므로 다른 통계량 선택
이론적으로 가장 가능성이 높은 모수를 추정하는 방법중 하나인 최대가능도함수 추정법(MLE, Maxinum Likehood Estimation, MLE)
모수 를 따르는 분포가 데이터 를 관찰할 가능성을 뜻함
가능도함수는 확률밀도함수와 수식은 같지만 다른 것을 주의
정규분포의 확률밀도함수, 모수가 상수이며 x가 변수
가능도함수, 모수가 변수이며 X가 상수
정규분포인 확률밀도함수와 같은 공식이지만, 전체 범위를 적분 시 1이 되는 개념이 아니기에, 에 대한 확률이 아닌, 에 따른 대소비교가 가능한 값으로 판단해야 함
데이터 집합가 독립적으로 추출되었을 경우 로그가능도를 최적화
정규분포를 따르는 확률분포 로부터 독립적인 표본{}을 얻을때 최대가능도 추정법을 이용하여 모수를 추정하면?
분산의 최대가능도추정에 들어가는 는 위에서 구한 를 사용해도 무방
카테고리 분포 Multinoulli를 따르는 확률변수 로부터 독립적인 표본 을 얻었을 때 최대가능도 추정법을 이용하여 모수를 추정하면?