[부트캠프 #3] Statistics (1) T-test

스르륵·2021년 3월 12일
1

부트캠프 정리하기

목록 보기
3/12

학부 3학년 수업 중 '영어데이터 분석'이라는 수업을 통해 R을 이용한 통계분석을 배운적이 있다. 그때 당시 했던 내용들을 다시 하는 것이지만 무려 5년전 수업이기 때문에 대강만 기억나고 헷갈리는 부분이 많았다.

수업 들을때도 그랬는데, 귀무가설과 대안가설을 만드는 것 자체가 너무 헷갈린다.

t-test

one sample t-test

표본의 평균과 특정값이 동일한지 알아보는 것.

  • 코인토스가 공정한지 알아보자!
    1. 내가 얻은 코인토스 결과의 평균
    2. 공정한 코인토스의 기대값 0.5
    3. 둘을 비교했을때 통계적으로 동일하다고 할 수 있는가?

  • Scipy에서 one-sample t-test하기
    - stats.ttest_1samp(x, n)

two sample t-test

두 샘플의 평균이 서로 동일한지 비교

  • 동전이 2개 있고 둘을 각각 던졌을 때 기대값이 유사한지 알아보자!
    - H0: 두 확률은 같다 (차이가 없다)
    - H1: 두 확률은 같지않다.
  • two-sample t-test
    - stats.ttest_ind(x, y)

one sample, two sample 모두 p-value가 유의값보다 작으면 귀무가설을 기각하고 (대안가설을 채택, 나의 주장이 맞다), 유의값보다 크면 귀무가설을 기각할 수 없다.

one-tailed t-test

-stats.ttest_ind(x, y, alternative='greater')
- alternative에는 큰값에는 greater, 작은값에는 less사용

one tailed에서는 기준 값보다 크다 작다만 판별한다. 그래서 α\alpha가 0.05라면 two tailed에서는 양쪽 사이드에 0.025씩 있는 것이지만 one tailed에서는 기준값에 0.05가 모두 있게 된다.

two tailedone tailed
profile
기록하는 블로그

0개의 댓글