기술 통계(Descriptive Statistics)
- 수집한 데이터를 요약, 묘사, 설명하는 통계 기법
추리 통계치(Inferential Statistics)
- 수집한 데이터를 바탕으로 추론, 예측하는 통계 기법
Effective Sampling
단순랜덤 추출법(Simple Random Sampling)
계통 추출법(Systematic Sampling)
- K개씩 n개의 구간으로 나누어 일정한 간격으로 표본을 추출
층화 추출법(Stratified Random Sampling)
- 유사한 원소끼리 몇 개의 층으로 나누어 각 층에서 랜덤 추출
집락 추출법(Cluster Sampling)
- 모집단을 여러 그룹으로 나누고 특정 그룹을 무작위로 선택
T-test
T-test Process
- 귀무 가설 (Null Hypothesis) 를 설정
- 대안 가설 (Alternative Hypothesis) 를 설정
- 신뢰도를 설정 (Confidence Level) : 모수가 신뢰구간 안에 포함될 확률 (보통 95, 99% 등을 사용)
- 신뢰도 95%의 의미
- 모수가 신뢰 구간 안에 포함될 확률이 95%
- 귀무가설이 틀렸지만 우연히 성립할 확률이 5%
- P-value를 확인
- P-value 의미
- P-value 는
주어진 가설에 대해서 "얼마나 근거가 있는지"
에 대한 값을 0과 1사이의 값으로 scale한 지표 이며 p-value가 낮다는 것은 귀무가설이 틀렸을 확률이 높다.
- p-value를 바탕으로 가설에 대해 결론을 내림
One Sample t-test VS Two Sample T-test
- One Sample t-test :
표본집단의 평균이 특정 값인지
추정할 때 사용
- Two Sample T-test :
표본집단 A와 표본집단 B의 평균을 비교
할 때 사용
One-side test vs Two-side test
- One side test : 샘플 데이터의 평균이 "X"보다
크다 혹은 작다 / 크지 않다 작지 않다.
를 검정
- Two side (tail / direction) test : 샘플 데이터의 평균이 "X"와
같다 / 같지 않다.
를 검정