스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.
노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.
genres plays return
["classic", "pop", "classic", "classic", "pop"] [500, 600, 150, 800, 2500] [4, 1, 3, 0]
classic 장르는 1,450회 재생되었으며, classic 노래는 다음과 같습니다.
pop 장르는 3,100회 재생되었으며, pop 노래는 다음과 같습니다.
따라서 pop 장르의 [4, 1]번 노래를 먼저, classic 장르의 [3, 0]번 노래를 그다음에 수록합니다.
이번 문제는 딕셔너리를 활용하는 문제였다. 장르별로 defaultdict를 이용하여 리스트 형태로 재생횟수와 고유번호를 저장하고 (lists), 이 딕셔너리를 순회하며 장르별 총 재생횟수를 딕셔너리로 관리하였다(total). 그리고 총 재생횟수 딕셔너리를 value의 내림차순으로 정렬하였고, 새로운 리스트(n_lists)를 생성하여 여기에 total의 key값에 대한 lists의 value를 내림차순으로 정렬시켜 넣었다. 그리고 total의 길이만큼 반복하는 for문을 통해 n_lists의 현재 인덱스의 크기가 2 이상일 경우, 상위 2개를 answer에 담았고, 2 미만일 경우에는 전체 길이만큼의 갯수를 answer에 담았다.
이 과정에서 어려웠던 점은 딕셔너리의 정렬이었다. 딕셔너리의 key값에 대한 정렬 방법은 다음과 같다.
# key값에 대한 정렬
new_dict=sorted(dict.items())
value값에 대한 정렬 방법은 다음과 같다.
# value값에 대한 정렬
new_dict=sorted(dict.items(), key=lambda x:x[1])
복잡할 줄 알았던 딕셔너리의 정렬은 생각 외로 lambda함수를 통해 바로 가능하였다. 나는 여기서 중요한 포인트를 파악하지 못한채로 문제에 접근하여 에러를 만나게 되었다.
sorted()함수의 반환값은 list이다. 비록 딕셔너리의 정렬이라 할지라도 items()를 이용하여 딕셔너리의 값들을 꺼냈고, sorted()로 정렬하였기 때문에 list로 반환된다.
이 사실을 파악하고 나서는 쉽게 문제를 해결할 수 있었다.
from collections import defaultdict
def solution(genres, plays):
answer = []
lists = defaultdict(list)
for i in range(len(genres)):
lists[genres[i]].append([plays[i], i])
total = defaultdict(int)
for key, value in lists.items():
for p, i in value:
total[key] += p
total=sorted(total.items(), key=lambda x: x[1], reverse=True)
n_lists=[]
for k, v in total:
n_lists.append(sorted(lists[k], key=lambda x:x[0], reverse=True))
for i in range(len(total)):
if len(n_lists[i])>=2:
for j in range(2):
answer.append(n_lists[i][j][1])
else:
for j in range(len(n_lists[i])):
answer.append(n_lists[i][j][1])
return answer