기술통계와 추리통계

까만호랭·2023년 10월 29일
0

통계학은 기술통계추리통계로 나뉜다.

📌 기술통계

관측을 통해 얻은 데이터에서 그 데이터의 특징을 뽑아내기 위한 기술을 말한다.
(ex.출생률이나 사망률 데이터를 가지고 어떠한 특징을 꺼내려고 하는 특징)

📌 추리통계

전체를 파악할 수 없을 정도의 큰 대상이나 아직 일어나지 않은 미래에 일어날 일에 관해 추측하는 것이다.
👉 부분으로 전체를 추측한다고 볼 수 있다.
(ex. 투표에 있어서, 주가예상, 지구온난화 예상 등)

📌 표준편차

데이터가 평균값 주변에 어느정도 넓게 펴져 있는지를 나타내는 통계량이다.
표준편차는 정규분포, 카이제곱분포, t분포 등 과도 이해관계가 있다.

📌 통계 vs 확률

통계 : 관측된 데이터의 집합으로 과거에 일어난 것에 관한 기술
확률 : 미래에 일어날 것에 관한 기술

📌 분포하다

서울시에 거주중인 20대 남성들 50명의 키를 재본다고 가정하였을때,
당연히 남성들의 키는 모두 같지 않고 제각각의 수치로 나타난다.
이렇게 한 집단에서 다양한 수치로 나타나는 것을 통계적 용어로 분포하다. 라고 표현한다.

축약

데이터로 나열되어 있는 많은 숫자를 어떤 기준으로 정리정돈해서 의미있는 정보만을 추출하는 것을 의미한다.
그래프로 만들어서 그 특징을 파악하는 방법과 숫자 하나로 특징을 대표하도록 하는 두 가지의 방법이 존재한다.
(이때 대표하는 숫자는 통계량)

정리

  1. 데이터 자체는 현실 그대로를 나타내지만 데이터를 본다고 해서 그 의미를 알 수는 없다.
  2. 데이터를 축약하는 방법에는 그래프 만들기, 통계량 구하기가 있다.
  3. 도수분포표는 데이터를 5~8개 정도의 그룹으로 나눈 것이다.
    도수분포표로 데이터의 특성(데이터가 집중되는 곳이나 대칭성 등)을 파악할 수 있다.
  4. 히스토그램은 도수분포표를 그래프로 바꾼 것이며 데이터의 특징을 파악하기가 더 쉽다.
profile
남들과 함께 발자국을 남기는 까만호랭

0개의 댓글

관련 채용 정보