[통계] 통계학 기초 2주차 (5) 스튜던트 t 분포

·2025년 1월 7일

통계

목록 보기
8/34

스튜던트 t 분포

⭐️표본이 작을 때 정규분포 대신 사용⭐️

  • 검정색이 정규분포.
  • 자유도가 커질수록 정규분포에 가까워짐. (자유도: 표본의 크기와 관련이 있는 값. 아래 참조)
  • 모집단의 표준편차를 알 수 없고, 표본의 크기가 작은 경우(일반적으로 30 미만)에 사용
  • 정규분포와 유사하지만, 표본의 크기가 작을수록 꼬리가 두꺼워짐.
  • 표본의 크기가 커지면 정규분포에 가까워
  • 작은 표본의 평균 비교, 약물 실험 등 데이터가 적은 경우 사용.

실습

  • np.random.standard_t(자유도(df), 샘플개수)
# 스튜던트 t 분포 생성
t_dist = np.random.standard_t(df=10, size=1000)

# 히스토그램으로 시각화
plt.hist(t_dist, bins=30, density=True, alpha=0.6, color='r')

# 스튜던트 t 분포 곡선 추가
x = np.linspace(-4, 4, 100)
p = stats.t.pdf(x, df=10)
plt.plot(x, p, 'k', linewidth=2)
plt.title('student t distribution histogram')
plt.show()

+) 자유도란?

정해진 조건 하에서 통계적 제한을 받지 않고 자유롭게 변화될 수 있는 요소의 수

  • 만약 샘플의 개수가 3개이고, 샘플의 평균이 4라고 한다면
    • case 1) S1S_1이 3, S2S_2가 5로 정해진 경우 S3S_3는 4가 되어야 함.
    • case 2) S2S_2가 4, S3S_3이 4로 정해진 경우 S1S_1은 4가 되어야 함.
    • 샘플이 3개일 때, 자유롭게 변화할 수 있는 요소의 수는 2개.
    • 샘플이 n개일 때, 자유롭게 변화할 수 있는 요소의 수는 n-1개.

참고자료 - [데세 TV] 짤막 통계 #1_자유도의 개념

profile
To Dare is To Do

0개의 댓글