[백준] 2108번 통계학 파이썬

그린·2023년 3월 19일
0

백준

목록 보기
27/44
post-thumbnail
post-custom-banner

[백준] 2108번 통계학


✔️문제

분류

구현(implementation), 수학(math), 정렬(sorting)

문제 설명

수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.

  1. 산술평균 : N개의 수들의 합을 N으로 나눈 값
  2. 중앙값 : N개의 수들을 증가하는 순서로 나열했을 경우 그 중앙에 위치하는 값
  3. 최빈값 : N개의 수들 중 가장 많이 나타나는 값
  4. 범위 : N개의 수들 중 최댓값과 최솟값의 차이

N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.

입력

첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.

출력

  • 첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.
  • 둘째 줄에는 중앙값을 출력한다.
  • 셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.
  • 넷째 줄에는 범위를 출력한다.

✔️풀이

시간 초과로 계속 실패해서 시간을 줄이는 방법에 대해서 엄청 생각해봤는데 결국 입력을 input()이 아닌 sys.stdin.readline()로 받으면 해결되는 문제였다. 허무해😩

✅첫번째 풀이

메모리시간
52640KB548ms
import sys
N = int(sys.stdin.readline())
arr=[]
sum_v = 0
for _ in range(N):
  x = int(sys.stdin.readline())
  arr.append(x)
  sum_v += x

arr.sort()
#산술평균
if sum_v <0:
  print(0 - abs(sum_v//N + (1 if (sum_v/N - sum_v//N)>=0.5 else 0)))
else:
  print(sum_v//N + (1 if (sum_v/N - sum_v//N)>=0.5 else 0))
#중앙값
print(arr[N//2])

#최빈값
dict = {}
for a in arr:
  if a not in dict:
    dict[a] = 1
  else:
    dict[a] += 1
max_cnt = max(dict.values())
max_arr = sorted([k for k,v in dict.items() if v == max_cnt])
if len(max_arr)>1:
  print(max_arr[1])
else:
  print(max_arr[0])

#범위
print(arr[-1] - arr[0])
  1. 숫자를 입력받아 배열에 추가한다.
  2. 배열을 정렬한다.
  3. 정렬된 배열을 이용해 산술평균, 중앙값, 범위를 구한다.
    3-2. 중앙값은 배열의 가운데에 위치한 N//2 인덱스를 가진 값을 리턴해준다.
    3-3. 범위는 배열의 가장 큰 값에서 가장 작은 값을 빼준다. 배열이 정렬되어 있으므로 인덱스로 바로 찾을 수 있다.
  4. 최빈값은 숫자 : 숫자가 나온 횟수로 딕셔너리를 이용해 찾아줬다.
    4-1. 횟수, 즉 딕셔너리의 value의 가장 큰 값을 찾는다 max_cnt
    4-2. values가 max_cnt과 같은 숫자(key)만 max_arr에 담는다.
    4-3. 만약 배열의 길이가 1이면 배열에 든 숫자를 리턴해준다.
    4-4. 만약 배열의 길이가 1보다 크면 (이미 정렬된 배열로 딕셔너리를 만들었으므로) 배열의 두번째 값을 리턴해준다.

✅두번째 풀이

메모리시간
50976KB432ms
import sys
N = int(sys.stdin.readline())
arr=[]
sum_v = 0
max_v = -4000
min_v = 4000
for _ in range(N):
  x = int(sys.stdin.readline())
  arr.append(x)
  if x<min_v:
    min_v = x
  if x>max_v:
    max_v = x
  sum_v += x

dict = {}
for a in arr:
  if a not in dict:
    dict[a] = 1
  else:
    dict[a] += 1

#산술평균
if sum_v <0:
  print(0 - abs(sum_v//N + (1 if (sum_v/N - sum_v//N)>=0.5 else 0)))
else:
  print(sum_v//N + (1 if (sum_v/N - sum_v//N)>=0.5 else 0))
  
#중앙값
sort_dict = sorted(dict.items(), key = lambda x : x[0])
idx = 0
for d in sort_dict:
  idx += d[1]
  if idx >= N//2+1:
    print(d[0])
    break

#최빈값
max_cnt = max(list(dict.values()))
max_arr = [x[0] for x in sort_dict if x[1] == max_cnt]

if len(max_arr)>1:
  print(max_arr[1])
else:
  print(max_arr[0])

#범위
print(max_v - min_v)
post-custom-banner

0개의 댓글