스튜던트 t 분포
⭐️표본이 작을 때 정규분포 대신 사용⭐️

- 검정색이 정규분포.
- 자유도가 커질수록 정규분포에 가까워짐. (자유도: 표본의 크기와 관련이 있는 값. 아래 참조)
- 모집단의 표준편차를 알 수 없고, 표본의 크기가 작은 경우(일반적으로 30 미만)에 사용
- 정규분포와 유사하지만, 표본의 크기가 작을수록 꼬리가 두꺼워짐.
- 표본의 크기가 커지면 정규분포에 가까워
- 작은 표본의 평균 비교, 약물 실험 등 데이터가 적은 경우 사용.
실습
- np.random.standard_t(자유도(df), 샘플개수)
# 스튜던트 t 분포 생성
t_dist = np.random.standard_t(df=10, size=1000)
# 히스토그램으로 시각화
plt.hist(t_dist, bins=30, density=True, alpha=0.6, color='r')
# 스튜던트 t 분포 곡선 추가
x = np.linspace(-4, 4, 100)
p = stats.t.pdf(x, df=10)
plt.plot(x, p, 'k', linewidth=2)
plt.title('student t distribution histogram')
plt.show()

+) 자유도란?
정해진 조건 하에서 통계적 제한을 받지 않고 자유롭게 변화될 수 있는 요소의 수
- 만약 샘플의 개수가 3개이고, 샘플의 평균이 4라고 한다면
- case 1) S1이 3, S2가 5로 정해진 경우 S3는 4가 되어야 함.
- case 2) S2가 4, S3이 4로 정해진 경우 S1은 4가 되어야 함.
- 샘플이 3개일 때, 자유롭게 변화할 수 있는 요소의 수는 2개.
- 샘플이 n개일 때, 자유롭게 변화할 수 있는 요소의 수는 n-1개.
참고자료 - [데세 TV] 짤막 통계 #1_자유도의 개념