수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.
산술평균 : N개의 수들의 합을 N으로 나눈 값
중앙값 : N개의 수들을 증가하는 순서로 나열했을 경우 그 중앙에 위치하는 값
최빈값 : N개의 수들 중 가장 많이 나타나는 값
범위 : N개의 수들 중 최댓값과 최솟값의 차이
N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.
첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.
첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.
둘째 줄에는 중앙값을 출력한다.
셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.
넷째 줄에는 범위를 출력한다.
import sys
from collections import deque
sys.stdin = open("input.text", "rt")
input = sys.stdin.readline
n = int(input())
data = []
for _ in range(n):
data.append(int(input()))
data.sort()
avg = round(sum(data) / n)
mid = data[n//2]
#최빈값 딕셔너리로
res = dict()
for i in range(len(data)):
if data[i] in res.keys():
res[data[i]] += 1
else:
res[data[i]] = 1
max_data = max(res.values())
cnt = 0
tt = [] #최빈값을 저장할 리스트
for key, val in res.items():
if val == max_data:
cnt += 1
tt.append(key)
if cnt >= 2:
most = tt[1]
else:
most = tt[0] #어차피 tt에 최빈값 저장되니깐. 0번에 딱 하나 저장되어 있을 것.
# data_set = list(set(data))
# data_set.sort()
# cnt = []
# for x in data_set:
# count = data.count(x)
# cnt.append(count)
# #cnt에 개수 같은게 여러개라면 두번째로 작은거.
# temp = max(cnt)
# c = cnt.count(temp)
# if c >= 2: #같은거 2개이상인 경우 두번째로 작은거 찾아야함
# ss = []
# for i in range(len(data_set)):
# if cnt[i] == temp:
# ss.append(data_set[i])
# most = ss[1]
# else: #가장큰거 한개인 경우.
# most = data_set[cnt.index(temp)]
ran = data[-1] - data[0]
print(avg)
print(mid)
print(most)
print(ran)
특정 문자나 특정 값의 개수를 알아야 할 때는 딕셔너리를 활용하는 것이 좋다. 간편하고...