평균, 분산, 표준편차

까만호랭·2023년 10월 29일
0

📌 평균값이란?

데이터는 수치적으로 널리 퍼져있지만, 그 널리 퍼져있는 것 중에 하나의 수를 모든 데이터를 대표하는 수로 뽑은 것이 평균값이다.
(데이터들은 평균값 주변에 분포되어 있다. 라는 말도 말이 된다.)

많이 나타나는 데이터는 평균값에 주는 영향력이 크다
평균은 좌우 대칭이 되는 축에 자리한다.

📌 평균의 종류

  1. 산수평균 : 데이터 합계를 데이터 총 개수로 나눈 것이다.
  2. 상승평균(기하평균) : 곱해서 루트를 씌우는 계산이다.
  3. 제곱평균 : 각 데이터를 제곱하여 더하고 총 개수로 나눈 뒤 루트를 씌운다.
  4. 조화평균 : 2/((1/x)+(1/y))

1번의 산술평균의 경우 덧셈의 의미로 본질을 유지하고자 할때 사용한다.
2번의 기하평균의 경우 성장률 등을 다루며 곱셈의 의미로 본질을 유지하고자 할 때 사용한다.
3번의 조화평균의 경우 속도를 다룰때 선택한다.

📌 편차

각 데이터가 평균값으로부터 어느 정도 크거나 작은지를 나타낸다.
(모든 데이터는 그 펴낯를 만들어 편차들을 산술평균으로 구하면 0이다.)
(표준편차 : 편차의 제곱평균이 되는 통계량, 데이터들의 평균값에서 떨어져 있는 것을 평균화 하는 것)
데이터의 실제 상황을 더 자세히 파악할 수 있는 통계량을 표준편차라고 생각할 수 있다.

📌 분산

데이터가 퍼져 있는 상태를 평가할 수 있는 통계량이다.
이 분산에 루트를 씌운 것을 표준편차라고 한다.

📌 정리

  • 평균값은 분포하고 있는 데이터 중에서 대표적인 수로 꺼낸 것이다.
  • 평균값으로부터 퍼져 있거나 흩어져 있는 정도를 평가하는 것이 표준편차이다.
  • 데이터의 특수성을 판단하는 데는 표준편차를 기준으로 한다.
  • 표준편차를 실생활에서 쉽게 접할 수 있는 곳은 주식거래 사용되는 주가변동성을 예로 들 수 있다.
profile
남들과 함께 발자국을 남기는 까만호랭

0개의 댓글

관련 채용 정보