문제
수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.
- 산술평균 : N개의 수들의 합을 N으로 나눈 값
- 중앙값 : N개의 수들을 증가하는 순서로 나열했을 경우 그 중앙에 위치하는 값
- 최빈값 : N개의 수들 중 가장 많이 나타나는 값
- 범위 : N개의 수들 중 최댓값과 최솟값의 차이
N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.
첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.
첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.
둘째 줄에는 중앙값을 출력한다.
셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.
넷째 줄에는 범위를 출력한다.
알고리즘 속도가 빨라야 한다는 걸 염두해두고 1,2,3,4번을 푼다.
산술 평균의 경우 sum함수를 이용해
중앙값의 경우 sort함수를 통해 중앙 index로 중앙값 뽑아낸다.
최빈값의 경우 나올 때마다 값을 카운팅해야 하는데, 카운팅할 리스트를 따로 만들어서 그 리스트를 비교함. 이때 max값이 여러 개면(countList), 가장 큰 값을 빼고 나머지 배열의 max값을 받아옴(arr)
범위의 경우 max값과 min값을 출력
N = int(input())
arr = []
for _ in range(N) :
arr.append(int(input()))
#첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.
length = len(arr)
avg = sum(arr)/length
print(round(avg,0))
#둘째 줄에는 중앙값을 출력한다.
arr.sort()
print(arr[length//2])
#3
countArr = {}
countArr[arr[0]] = 1
for i in range(1, N):
poped = arr[i]
if poped in arr[0:i] : # 뽑은 숫자가 원래 리스트에 있으면
countArr[poped] = countArr.get(poped) + 1
else :
countArr[poped] = 1
maxArr= [k for k, v in countArr.items() if max(countArr.values()) == v]
if len(maxArr) == 1:
print(maxArr)
else :
maxArr.remove(min(maxArr))
print(min(maxArr))
#4
print(max(arr) - min(arr))
쩝..
2번째에서 중앙값 찾을 때 sort로 정렬하지 않고 정렬하는 동안 count를 줘야할 것 같다.