대표값

강승구·2023년 2월 27일
0

주어진 자료를 대표하는 특정 값을 그 자료의 대표값이라고 한다. 대표값은 자료의 중심적인 경향이나 자료분포의 중심의 위치를 나타내주는데, 일반적 으로 사용되는 것에는 평균(mean), 중위수(median), 최빈수(mode) 등이 있다.

평균 (mean)

평균은 산술평균, 기하평균, 조화평균, 가중평균 등으로 분류할 수 있다.

1. 산술평균 (arithmetic mean)

일반적으로 평균 이라고 줄여말하는 것으로, 자료의 모든 측정값을 합산하여 이 값을 전체 자료의 수로 나누어 준 값을 말한다. 가장 보편적이고, 흔히 사용하는 값이다.
img

2. 기하평균 (geometric mean)

변화하는 비율을 나타내는 평균이다.

예를 들어, 자본금 100만원 으로 사업을 시작하여 첫 해에는 자본금이 2배, 두 번째 해는 자본금이 8배 증가했다고 하자. 그러면 자본금은 2년 동안 총 16배가 늘어났고, 매년 평균 적으로 4배 늘어났다고 볼 수 있다. 이렇듯 기하평균은 여러 개의 수를 연속 으로 곱하여 그 개수의 거듭제곱근으로 구한다.

만약 이를 산술평균으로 구하면 2배와 8배의 산술평균 즉 5배가 되어 실제 평균증가율보다 높게 나타난다.
img

3. 조화평균 (harmonic mean)

평균속도를 계산하거나 일정금액을 가지고 구입할 수 있는 상품의 수량의 평균을 구할 때 이용되는데, 자료값을 각각 역수로 하여 산술 평균을 구한 다음 다시 이 값의 역수를 취하여 산출한다.
img

4. 가중평균(Weighted Average)

각각의 자료값이 가지는 중요성이 서로 다르면, 자료값에 자료의 상대적 중요도인 가중치(w)를 곱하여 합산한 값을 각각의 가중치의 합계로 나누어 구한다. 가중평균은 물가지수 산정 등 광범위하게 사용되고 있다.
img


중앙값 (median)

중위수는 중앙값이라고도 하며, 자료를 크기 순으로 나열했을 때 한가운 데에 위치하는 자료값을 말한다.

자료가 홀수 개이면 정중앙 값이 중앙값이 되지만, 짝수 개이면 중앙에 위치한 값이 두 개가 되므로 이 경우에는 두 값의 평균을 중앙값으로 한다.
img


최빈값 (mode)

자료 중 빈도수가 가장 높은 자료값을 말한다.

자료값이 7, 10, 10, 8, 9, 10, 6, 10로 주어졌다고 하자. 크기순대로 자료값을 다시 나열하면 6, 7, 8, 9, 10, 10, 10, 10이므로 중위수는 네 번째 값 9와 다섯 번째 값10의 평균인 9.5가 되며, 4번으로 가장 빈도수가 높은 10이 최빈수가 된다.

자료 중에 극단적인 값이 한 개 이상 있을 때 그 값들이 산술평균에 큰 영향을 미쳐서 산술평균이 대표값으로 부적절한 경우가 있다. 이런 경우에는 극단적인 값의 영향을 받지 않는 중위수나 최빈수가 오히려 대표값으로 적절 할 수 있다.

profile
강승구

0개의 댓글