기술 통계(Descriptive Statistics)

  • 수집한 데이터를 요약, 묘사, 설명하는 통계 기법

추리 통계치(Inferential Statistics)

  • 수집한 데이터를 바탕으로 추론, 예측하는 통계 기법

Effective Sampling

단순랜덤 추출법(Simple Random Sampling)

  • 임의의 n개를 추출

계통 추출법(Systematic Sampling)

  • K개씩 n개의 구간으로 나누어 일정한 간격으로 표본을 추출

층화 추출법(Stratified Random Sampling)

  • 유사한 원소끼리 몇 개의 층으로 나누어 각 층에서 랜덤 추출

집락 추출법(Cluster Sampling)

  • 모집단을 여러 그룹으로 나누고 특정 그룹을 무작위로 선택

T-test

T-test Process

  1. 귀무 가설 (Null Hypothesis) 를 설정
  2. 대안 가설 (Alternative Hypothesis) 를 설정
  3. 신뢰도를 설정 (Confidence Level) : 모수가 신뢰구간 안에 포함될 확률 (보통 95, 99% 등을 사용)
  • 신뢰도 95%의 의미
    • 모수가 신뢰 구간 안에 포함될 확률이 95%
    • 귀무가설이 틀렸지만 우연히 성립할 확률이 5%
  1. P-value를 확인
  • P-value 의미
    • P-value 는 주어진 가설에 대해서 "얼마나 근거가 있는지"에 대한 값을 0과 1사이의 값으로 scale한 지표 이며 p-value가 낮다는 것은 귀무가설이 틀렸을 확률이 높다.
  1. p-value를 바탕으로 가설에 대해 결론을 내림

One Sample t-test VS Two Sample T-test

  • One Sample t-test : 표본집단의 평균이 특정 값인지 추정할 때 사용
  • Two Sample T-test : 표본집단 A와 표본집단 B의 평균을 비교할 때 사용

One-side test vs Two-side test

  • One side test : 샘플 데이터의 평균이 "X"보다 크다 혹은 작다 / 크지 않다 작지 않다. 를 검정
  • Two side (tail / direction) test : 샘플 데이터의 평균이 "X"와 같다 / 같지 않다. 를 검정
profile
일단 저지르자! 그리고 해결하자!

0개의 댓글