통계학은 기술통계
와 추리통계
로 나뉜다.
관측을 통해 얻은 데이터에서 그 데이터의 특징을 뽑아내기 위한 기술을 말한다.
(ex.출생률이나 사망률 데이터를 가지고 어떠한 특징을 꺼내려고 하는 특징)
전체를 파악할 수 없을 정도의 큰 대상이나 아직 일어나지 않은 미래에 일어날 일에 관해 추측하는 것이다.
👉 부분으로 전체를 추측한다고 볼 수 있다.
(ex. 투표에 있어서, 주가예상, 지구온난화 예상 등)
데이터가 평균값 주변에 어느정도 넓게 펴져 있는지를 나타내는 통계량이다.
표준편차는 정규분포, 카이제곱분포, t분포 등 과도 이해관계가 있다.
통계 : 관측된 데이터의 집합으로 과거에 일어난 것에 관한 기술
확률 : 미래에 일어날 것에 관한 기술
서울시에 거주중인 20대 남성들 50명의 키를 재본다고 가정하였을때,
당연히 남성들의 키는 모두 같지 않고 제각각의 수치로 나타난다.
이렇게 한 집단에서 다양한 수치로 나타나는 것을 통계적 용어로분포하다.
라고 표현한다.
데이터로 나열되어 있는 많은 숫자를 어떤 기준으로 정리정돈해서 의미있는 정보만을 추출하는 것을 의미한다.
그래프로 만들어서 그 특징을 파악하는 방법과 숫자 하나로 특징을 대표하도록 하는 두 가지의 방법이 존재한다.
(이때 대표하는 숫자는 통계량)
그래프
만들기, 통계량
구하기가 있다.