수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.
N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.
첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.
첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.
둘째 줄에는 중앙값을 출력한다.
셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.
넷째 줄에는 범위를 출력한다.
21%에서 틀렸다면 산술평균을 조건에 맞게 연산했는지를 점검해볼 것.
import sys
input = sys.stdin.readline
n = int(input())
q = list()
p = [0] * 8002
for i in range(n):
a = int(input())
q.append(a)
p[a + 4000] += 1
# round 함수는 원래 두 개의 인자를 받는데
# 두 번째 인자가 생략되면 소수 첫째 자리에서 반올림한다.
avg = round(sum(q) / n)
q.sort()
mid = q[n//2]
ma_x = max(p)
ma_x_list = list()
for i in range(0, 8002):
if ma_x == p[i]:
ma_x_list.append(i-4000)
# 산술평균
print(avg)
# 중앙값
print(mid)
# 최빈값
many = ma_x_list[0]
if len(ma_x_list) > 1:
many = ma_x_list[1]
print(many)
# 범위
ran = max(q) - min(q)
print(ran)
산술평균, 중앙값, 범위의 경우 Python built-in sort 메소드를 사용하기 위해 리스트에 그냥 넣어서 처리하였다.
최빈값의 경우 Counting Sort를 이용하면 쉽게 구할 수 있어서 8002까지 리스트에 할당해놓고 들어오는 값에 4000을 더해서 누적합을 구했다.