수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.
첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.
첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.
둘째 줄에는 중앙값을 출력한다.
셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.
넷째 줄에는 범위를 출력한다.
5
1
3
8
-2
2
2
2
1
10
1
4000
4000
4000
4000
0
5
-1
-2
-3
-1
-2
-2
-2
-1
2
import sys
n = int(input())
num = []
for _ in range(n):
x = int(sys.stdin.readline())
num.append(x)
num.sort()
avg = int(round(sum(num) / n, 0))
mid = num[n//2]
def mode(num):
from collections import Counter
mode_dict = Counter(num)
modes = [k for k, v in mode_dict.items() if v == max(mode_dict.values())]
modes = sorted(modes)
return modes[0] if len(modes) == 1 else modes[1]
ran = max(num) - min(num)
#print('results are following: ')
print(avg)
print(mid)
print(mode(num))
print(ran)
다른 통계치는 구하기 쉬웠으나, 최빈값을 구하기 어려웠다.
구글링 결과, collection
의 Counter
라는 메서드를 import하면 쉽게 구현할 수 있다는 것을 알게 되었다.