수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.
산술평균 : N개의 수들의 합을 N으로 나눈 값
중앙값 : N개의 수들을 증가하는 순서로 나열했을 경우 그 중앙에 위치하는 값
최빈값 : N개의 수들 중 가장 많이 나타나는 값
범위 : N개의 수들 중 최댓값과 최솟값의 차이
N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.
첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.
첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.
둘째 줄에는 중앙값을 출력한다.
셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.
넷째 줄에는 범위를 출력한다.
from collections import Counter
from sys import stdin
num = int(stdin.readline())
num_list = []
for i in range(num):
num_list.append(int(stdin.readline()))
num_list.sort()
def print_avg(my_list):
sum = 0
for a in my_list:
sum = sum + a
list_len = len(my_list)
print(round(sum/list_len))
def print_cen(my_list):
if len(my_list)%2==1:
print(my_list[num//2])
else:
print(my_list[num//2] + my_list[num//2-1])
def print_mode(my_list):
cnt = Counter(my_list)
c = cnt.most_common()
maximum = c[0][1]
if len(cnt)>1 and c[1][1] == maximum:
print(c[1][0])
else:
print(c[0][0])
def print_maxmin(my_list):
print(my_list[-1] - my_list[0])
print_avg(num_list)
print_cen(num_list)
print_mode(num_list)
print_maxmin(num_list)
노가다가 심했다 .. stdin 임포트 하고 stdin.readline() 하는게 실행시간 대폭 줄어들더라 (반복문 안에서). input 대신 이걸 사용해야겠음
print_mode 함수에서 인덱스 오류가 났는데, 이프문을 검사할때도 앞 순서부터 검사하더라. 길이를 먼저 검사하고 아니면 거기서 바로 이프문을 탈출해버리니까 뒤에 조건을 검사 안해서 인덱스 오류가 안뜸. 참고하자.