통계를 다시 복습하고 있습니다.
TIL
1. 확률 분포
- 데이터 변동의 특징을 파악하기 위한 첫 단계로 어떤 확률 분포가 존재한다고 가정하고, 실제 데이터는 이 확률분포로부터 확률적으로 얻어졌다고 생각하는 것
- 실제 데이터가 확률적으로 얻어졌다고 가정하고, 배후에 있는 확률 분포(z-distribution, t-distribution)를 조사하면 우연오차에 대한 정보(평균으로부터 얼마나 떨어져있는지)를 얻을 수 있음
2. 중심극한정리
- 모집단에 대해 sampling을 반복할 수록, sample의 평균은 정규분포에 근사한 형태가 됨
- 모집단이 어떤 형태인지 모르더라도 모집단을 추정할 수 있는 근거가 됨
3. 큰 수의 법칙
- sampling 규모가 커질 수록 sample의 통계치는 모집단의 모수와 같아진다.