1) 통계가 중요한 이유
2) 실제로 통계가 어떻게 사용될까?
1) 기술통계
데이터를 요약하고 설명하는 통계 방법
(1) 평균 (Mean)
(2) 중앙값 (Median)
(3) 분산
(4) 표준편차
2) 추론통계
표본 데이터를 통해 모집단의 특성을 추정하고 가설을 검정하는 통계 방법
주로 신뢰구간, 가설검정 등을 사용
데이터의 일부를 가지고 데이터 전체를 추정하는 것이 핵심
신뢰구간
모집단의 평균이 특정 범위 내에 있을 것이라는 확률
일반적으로 95% 신뢰구간이 사용되며, 모집단 평균이 95% 확률로 이 구간 내에 있음을 의미
가설검증
모집단에 대한 가설을 검증하기 위해 사용
귀무가설(H0) : 검증하고자 하는 가설이 틀렸음을 나타내는 기본 가설(변화가 없다, 효과가 없다 등)
대립가설(H1) : 반대 가설로 주장하는 바를 나타내는 가설(변화가 있다, 효과가 있다 등)
p-value가 0.05 이하 일 경우 유의미한 결과가 나오며, 귀무가설을 기각할 수 있다.
1) 위치추정
2) 변이추정
데이터들이 서로 얼마나 다른지 확인하는 방법
분산, 표준편차, 범위(range) 등을 사용
범위
3) 데이터 분포 탐색
4) 이진 데이터와 범주 데이터 탐색
5) 상관관계
6) 인과관계와 상관관계의 차이
7) 두 개 이상의 변수 탐색