표본평균의 확률분포에 사용하는 분포는 정규분포이다. 정규분포는 평균이 μ이고 표준편차가 σ인 형태를 갖는 분포이다. 표본평균의 확률분포는 표본 크기가 커질수록 정규분포에 가까워지며 이는 중심극한정리에 의해 설명된다.
표본분산의 확률분포에 사용하는 분포는 자유도 n-1인 카이제곱분포이다. 카이제곱분포는 자유도가 증가함에 따라 정규분포에 가까워진다.
중심경향도
중심경향도는 데이터의 값이 모여있는 위치를 나타내는 지표이다. 중심경향도를 나타내는 지표로는 평균, 중위수, 최빈수가 있다.
1) 평균
평균은 데이터의 모든 값을 더한 후 데이터의 개수로 나눈 값이다.
2) 중위수
중위수는 데이터를 크기 순으로 나열했을 때 가운데 위치한 값이다.
3) 최빈수
최빈수는 데이터에서 가장 많이 나타나는 값이다.
정량적 데이터
정량적 데이터는 수치로 표현할 수 있는 데이터이다. 정량적 데이터의 척도로는 명목척도, 서열척도, 등간척도, 비율척도가 있다.
1) 명목척도
데이터를 구분하는 데 사용되는 척도이다. 예를 들어, 성별, 지역, 직업 등이 명목척도에 속한다.
2) 서열척도
데이터를 크기 순으로 나열할 수 있는 척도이다. 예를 들어, 학생의 성적, 상품의 등급 등이 서열척도에 속한다.
3) 등간척도
데이터의 상대적인 차이를 측정할 수 있는 척도이다. 예를 들어, 시험 점수, 온도 등이 등간척도에 속한다.
4) 비율척도
데이터의 절대적인 차이를 측정할 수 있는 척도이다. 예를 들어, 길이, 무게 등이 비율척도에 속한다.
정성적 데이터
정성적 데이터는 수치로 표현할 수 없는 데이터이다. 정성적 데이터의 척도로는 범주척도가 있다.
1) 범주척도
데이터를 범주로 나누는 척도이다. 예를 들어, 고객의 만족도, 제품의 품질 등이 범주척도에 속한다.