
산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야이다.
근대 과학으로서의 통계학은 19세기 중반 벨기에의 케틀레가 독일의 "국상학(國狀學, Staatenkunde, 넓은 의미의 국가학)"과 영국의 "정치 산술(Political Arithmetic, 정치 사회에 대한 수량적 연구 방법)"을 자연과학의 "확률 이론"과 결합하여, 수립한 학문에서 발전되었다.
데이터를 수집하고 수집된 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설명하는 방법론
모집단으로 부터 추출한 표본 데이터를 분석하여 모집단의 여러가지 특성을 추측하는 방법론




표본(데이터)를 이해하기 위해서는 표본의 중심에 대해서 관심을 갖기 때문에 표본의 중심을 설명하는 값을 대표값이라 하며 이를 중심경향치라고 함
대표적인 중심 경향치는 평균이며, 중앙값, 최빈값, 절사 평균 등이 있음
평균은 모집단으로 부터 관측된 n개의 x가 주어 졌을때 아래와 같이 정의됨
평균은 표본으로 추출된 표본 평균(sample mean, 로 표기)이라고하며, 모집단의 평균을 모평균이라고 하며 라고 표기함
평균과 같이 자주 사용하는 값으로 표본으로 부터 관측치를 크기순으로 나열 했을 때, 가운데 위치하는 값을 의미함
관측치가 홀수 일 경우 중앙에 취하는 값이고, 짝수 일 경우 가운데 두개의 값을 산술 평균한 값임
이상치가 포함된 데이터에 대해서 사용함
관측치를 크기순으로 나열 했을 때, 중앙값 m은
관측치 중에서 가장 많이 관측되는 값
옷사이즈와 같이 명목형 데이터의 경우 사용

데이터가 어떻게 흩어져 있는지를 확인하기 위해서는 중심경향치와 함께 산포에 대한 측도를 같이 고려해야 함
데이터의 산포도를 나타내는 측도로는 범위, 사분위수, 분산, 표준편차, 변동 계수 등이 있음
데이터의 분포가 얼마나 흩어져 있는지를 알 수 있는 측도 임
데이터의 각각의 값들의 편차 제곱합으로 계산하며 수식은 아래와 같음
표본 분산 :

크기가 n인 모집단의 평균을 라고 할 때 모평균과 모분산은 다음과 같음
모분산 :
모표준편차 :
