[Programmers/Python] 해시 - 베스트앨범

Frye 'de Bacon·2023년 11월 27일
0

코딩테스트

목록 보기
25/45

프로그래머스 - 베스트앨범


문제

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

  1. 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
  2. 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
  3. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

제한사항

  • genres[i]는 고유번호가 i인 노래의 장르입니다.
  • plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
  • genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
  • 장르 종류는 100개 미만입니다.
  • 장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
  • 모든 장르는 재생된 횟수가 다릅니다.

입출력 예

genresplaysreturn
["classic", "pop", "classic", "classic", "pop"][500, 600, 150, 800, 2500][4, 1, 3, 0]

입출력 예 설명

classic 장르는 1,450회 재생되었으며, classic 노래는 다음과 같습니다.

  • 고유 번호 3: 800회 재생
  • 고유 번호 0: 500회 재생
  • 고유 번호 2: 150회 재생

pop 장르는 3,100회 재생되었으며, pop 노래는 다음과 같습니다.

  • 고유 번호 4: 2,500회 재생
  • 고유 번호 1: 600회 재생

따라서 pop 장르의 [4, 1]번 노래를 먼저, classic 장르의 [3, 0]번 노래를 그다음에 수록합니다.

장르별로 가장 많이 재생된 노래를 최대 두 개까지 모아 베스트 앨범을 출시하므로 2번 노래는 수록되지 않습니다.


풀이

설계

  1. 각 장르별로 재생 횟수를 더하여 '가장 많이 재생된 장르'를 찾는다.
    • 최초 : 딕셔너리를 생성하고 value를 추가하여 sum을 함으로써 최다 재생 장르 확인
    • 변경 : 딕셔너리를 생성하고 각 장르별 재생 횟수를 value로 더한 뒤 내림차순 정렬하여 최다 재생 장르 확인
  2. 각 장르별로 가장 많이 재생된 순으로 곡 목록을 정렬한다.
    • 최초 : 딕셔너리 내 값을 내림차순 정렬로
    • 변경 : 장르별 재생 횟수를 세기 위한 딕셔너리와 별개로 딕셔너리를 생성, (index, 재생 횟수) 형태의 튜플을 요소로 하는 리스트를 value로 삽입
  3. 최다 재생 장르 - 최다 재생 곡 순으로 각 장르별 2곡씩을 선정하여 해당 인덱스 값을 answer에 더한다.
    • 최초 : 딕셔너리 생성 시 (인덱스, 재생 횟수)의 튜플 형태로 데이터를 삽입한다면 해결 가능할 듯
    • 변경 : 장르별 재생 횟수 순으로 for문 순회, 장르별로 1곡만 존재하는 경우도 계산할 것

코드

def solution(genres, plays):
    answer = []
    songs_dict = {}  # 장르별로 각 노래의 재생 횟수와 index를 튜플로 저장할 딕셔너리
    sorted_genres = {}  # 가장 많이 재생된 장르를 순서대로 정렬하기 위한 딕셔너리

    for i in range(len(plays)):
        if genres[i] in songs_dict:
            songs_dict[genres[i]].append((i, plays[i]))
            sorted_genres[genres[i]] += plays[i]
        else:
            songs_dict[genres[i]] = [(i, plays[i])]
            sorted_genres[genres[i]] = plays[i]

    sorted_genres = list(map(lambda x: x[0], sorted(sorted_genres.items(), reverse=True, key=lambda x: x[1])))
    # ['pop', 'classic']

    for genre in sorted_genres:
        temp = sorted(songs_dict[genre], reverse=True, key=lambda x: x[1])  # 각 장르별로 최다 재생 곡부터 정렬
        answer.append(temp[0][0])
        if len(temp) > 1:
            answer.append(temp[1][0])  # 2개씩 answer에 추가

    return answer

아이디어 자체는 빠르게 떠올랐는데, 딕셔너리라는 자료구조에서 원하는 형태의 데이터를 뽑아 쓰고, 혹은 원하는 형태로 정렬하는 등의 부분이 조금 어려웠던 문제였다.
곡이 하나만 있는 장르를 고려하지 않고 그냥 일괄적으로 2개씩 추가하도록 코드를 짰을 때 index 에러가 나는 게 아니라 런타임 에러가 뜨는 건 왜인지 모르겠다.

profile
AI, NLP, Data analysis로 나아가고자 하는 개발자 지망생

0개의 댓글