1.정규분포
-연속확률변수를 기술하는 가장 중요한 확률분포
-정규분포는 평균을 중심으로 좌우대칭 평균=중앙값=최빈값/종모양
-정규분포의 형태와 위치는 평균과 표준편차가 결정(가우스 분포)
2.중심극한정리
-표본의 크기가 커질수록 표본 평균들이 이루는 분포가 모집단의 평균 μ, 표준편차가 ∂ / √n 인 정규분포에 가까워진다는 정리
*일반적으로 N>=30
3.표준정규분포
-확률변수 Z가 평균=0, 분산=1인 정규분포
-Z분포라고 부르며 Z~N(0,1)로 표현 / -1.96~1.96 안에 95%데이터가 있음
-서로 다른 평균과 분산을 가진 분포 사이의 비교가 가능
*표준오차: 표본 분포의 표준 편차
4.T분포
-N<30일 때, 모집단의 분산을 모를경우 가설검정과 회귀분석시/선형회귀 계수 추론시 활용
-표본을 보고 모집단의 평균을 추론하고 싶을 때 사용
-정규분포와 유사하게 좌우 대칭 종모양으로 중심은 0
-자유도에 따라 형태가 달라짐
-표본의 수가 충분히 크면 표준정규분포와 거의 같아짐
-표본의 수가 적으면 양쪽 꼬리가 더 두터워짐
*T검정)귀무가설, 대립가설 중 하나를 선택하는 통계적 검정방법
: 상관분석, 회귀분석
5.카이제곱분포
-표본의 K개의 표본을 가지고 모집단 분산 추론 시/카이제곱 검정 시 표준정규분포를 제곱한 값에 대한 분포
-K개의 표본의 표본이 서로 독립적인 정규분포를 따를 때, 이들의 제곱합은 자유도가 K인 카이제곱분포를 따름
-자유도가 K인 카이제곱분포의 평균은 K, 분산은 2K
-항상 양수이며, 자유도가 커질 수록 정규분포에 가까워짐
*카이제곱 검정) 범주형 자료로 구성된 데이터 분석에 이용
6.F분포
-두 모집단에서 분산비를 활용해 동질성 여부 검정하거나 평균치 간의 차이 유무 검정(F-검정 분산분석, 회귀분석)시 활용
-두 분산간의 동질성 여부를 검정하거나 두 개 이상의 평균치 간의 차이 유무를 검정
-항상 양수이며 정규
-왼쪽으로 치우친 모양으로 두개의 자유도가 커질수록 정규분포에 가까워짐

*F검정) 분산분석
7.신뢰구간
-신뢰구간: 모수가 실제로 포함될 것으로 예측되는 범위
-신뢰수준: 신뢰구간에 포함될 확률
-Z점수: 평균값에서 표준편차의 몇 배정도 떨어져있다는 것을 평가하는 수치

8.Q-Q plot
Q-Q plot: 데이터가 정규분포인지 아닌지 시각적으로 간단하게 확인
-x축은 정규분포의 해당 분위수, y축은 z점수
-y=x 그래프 위에 위치할 수록 정규분포를 보임
