베스트앨범 (프로그래머스 Level 3, Python)

Seop·2023년 5월 15일
0

알고리즘

목록 보기
6/16
post-thumbnail

문제

베스트앨범

문제 설명

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

  1. 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
  2. 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
  3. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

제한사항
  • genres[i]는 고유번호가 i인 노래의 장르입니다.
  • plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
  • genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
  • 장르 종류는 100개 미만입니다.
  • 장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
  • 모든 장르는 재생된 횟수가 다릅니다.
입출력 예
genresplaysreturn
["classic", "pop", "classic", "classic", "pop"][500, 600, 150, 800, 2500][4, 1, 3, 0]

정답 코드

import heapq
from collections import defaultdict


def solution(genres, plays):
    n = len(genres)
    song_by_genre = defaultdict(list)
    plays_sum = defaultdict(int)
    play_hq = []
    ans = []
    for i in range(n):
        plays_sum[genres[i]] += plays[i]
        song_by_genre[genres[i]].append((-plays[i], i))
    for key in song_by_genre.keys():
        song_by_genre[key].sort()
        
    for key in plays_sum.keys():
        heapq.heappush(play_hq, (-plays_sum[key], key))

    while play_hq:
        total_plays, genre = heapq.heappop(play_hq)
        for i in range(min(2, len(song_by_genre[genre]))):
            ans.append(song_by_genre[genre][i][1])
    return ans

풀이

문제가 그렇게 어렵지는 않았지만....
이상한 곳에서 허우적대서 생각보다 풀이가 늦어진 문제입니다.

저는 이 문제를 풀기 위해 2개의 딕셔너리(Map)이 필요하다고 생각 했습니다.
1. 각 장르별로 총 청취 횟수를 저장하는 Map
2. 각 장르별 음악을 저장해 놓는 Map

그래서 1은 plays_sum, 2는 song_by_genre로 구현했습니다.

그림으로 보면 이렇게 되겠네요

입출력 예시를 바탕으로 도식화 하면 다음과 같이 들어갑니다.

그리고 또 해줘야 할 작업이 있습니다.
바로 song_by_gnere의 value들을 정렬시켜줘야하는 건데요
정렬 기준은 첫 번째의 요소인 재생 수 입니다.
그렇기 때문에 각 key 별로 순회화면서 value를 정렬시켜주는 작업을 수행했습니다. (15 ~ 16 라인)
파이썬에서는 sort를 하면 기본적으로 오름차순으로 정렬시켜주기 때문에 애초에 재생 횟수는 음수화 시켜서 넣어줬습니다.

그 다음에는 이제 장르를 총 재생 횟수를 기준으로 내림차순으로 정렬을 해 줘야 합니다.

그렇기 때문에 이번에는 PriorityQueue를 사용해서 정렬하겠습니다.
play_hq를 사용해서 정렬을 진행을 할겁니다

참고로 파이썬의 heapq는 숫자는 기본적으로 오름차순 정렬이기 때문에 음수화 시켜서 넣어줘야 합니다.
17 ~ 18 라인이 해당 부분 코드입니다.

그리고 이제 사전 작업을 다 마쳤으니, 베스트 앨범을 뽑아주면 됩니다!!!

  1. 총 재생 횟수를 기준으로 가장 많이 재생된 장르를 play_hq에서 뽑아줌
  2. 뽑힌 장르를 이제 song_by_genre의 키로 넣어서 높은 재생수를 가진 노래를 최대 2개를 가져옴
  3. ans 배열에 append 해줌
  4. 위 3단계를 play_hq가 빌 때까지 계속 반복함(모든 장르에 대해서 최대 2곡 뽑기)
    끝!
profile
어제보다 더 나은 개발자가 되고파요

0개의 댓글