스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.
노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.
genres | plays | return |
---|---|---|
["classic", "pop", "classic", "classic", "pop"] | [500, 600, 150, 800, 2500] | [4, 1, 3, 0] |
import heapq
from collections import defaultdict
def solution(genres, plays):
n = len(genres)
song_by_genre = defaultdict(list)
plays_sum = defaultdict(int)
play_hq = []
ans = []
for i in range(n):
plays_sum[genres[i]] += plays[i]
song_by_genre[genres[i]].append((-plays[i], i))
for key in song_by_genre.keys():
song_by_genre[key].sort()
for key in plays_sum.keys():
heapq.heappush(play_hq, (-plays_sum[key], key))
while play_hq:
total_plays, genre = heapq.heappop(play_hq)
for i in range(min(2, len(song_by_genre[genre]))):
ans.append(song_by_genre[genre][i][1])
return ans
문제가 그렇게 어렵지는 않았지만....
이상한 곳에서 허우적대서 생각보다 풀이가 늦어진 문제입니다.
저는 이 문제를 풀기 위해 2개의 딕셔너리(Map)이 필요하다고 생각 했습니다.
1. 각 장르별로 총 청취 횟수를 저장하는 Map
2. 각 장르별 음악을 저장해 놓는 Map
그래서 1은 plays_sum
, 2는 song_by_genre
로 구현했습니다.
그림으로 보면 이렇게 되겠네요
입출력 예시를 바탕으로 도식화 하면 다음과 같이 들어갑니다.
그리고 또 해줘야 할 작업이 있습니다.
바로 song_by_gnere
의 value들을 정렬시켜줘야하는 건데요
정렬 기준은 첫 번째의 요소인 재생 수 입니다.
그렇기 때문에 각 key 별로 순회화면서 value를 정렬시켜주는 작업을 수행했습니다. (15 ~ 16 라인)
파이썬에서는 sort를 하면 기본적으로 오름차순으로 정렬시켜주기 때문에 애초에 재생 횟수는 음수화 시켜서 넣어줬습니다.
그 다음에는 이제 장르를 총 재생 횟수를 기준으로 내림차순으로 정렬을 해 줘야 합니다.
그렇기 때문에 이번에는 PriorityQueue를 사용해서 정렬하겠습니다.
play_hq
를 사용해서 정렬을 진행을 할겁니다
참고로 파이썬의 heapq는 숫자는 기본적으로 오름차순 정렬이기 때문에 음수화 시켜서 넣어줘야 합니다.
17 ~ 18 라인이 해당 부분 코드입니다.
그리고 이제 사전 작업을 다 마쳤으니, 베스트 앨범을 뽑아주면 됩니다!!!
play_hq
에서 뽑아줌song_by_genre
의 키로 넣어서 높은 재생수를 가진 노래를 최대 2개를 가져옴play_hq
가 빌 때까지 계속 반복함(모든 장르에 대해서 최대 2곡 뽑기)