스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.
속한 노래가 많이 재생된 장르를 먼저 수록합니다.
장르 내에서 많이 재생된 노래를 먼저 수록합니다.
장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.
노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.
genres[i]는 고유번호가 i인 노래의 장르입니다.
plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
장르 종류는 100개 미만입니다.
장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
모든 장르는 재생된 횟수가 다릅니다.
genres | plays | return |
---|---|---|
["classic", "pop", "classic", "classic", "pop"] | [500, 600, 150, 800, 2500] | [4, 1, 3, 0] |
classic 장르는 1,450회 재생되었으며, classic 노래는 다음과 같습니다.
고유 번호 3: 800회 재생
고유 번호 0: 500회 재생
고유 번호 2: 150회 재생
pop 장르는 3,100회 재생되었으며, pop 노래는 다음과 같습니다.
고유 번호 4: 2,500회 재생
고유 번호 1: 600회 재생
따라서 pop 장르의 [4, 1]번 노래를 먼저, classic 장르의 [3, 0]번 노래를 그다음에 수록합니다.
import collections def solution(genres, plays): musics = [[genre, 0] for genre in list(collections.Counter(genres))] for i in range(len(musics)): for j in range(len(genres)): if genres[j] == musics[i][0]: musics[i][1] += plays[j] musics = sorted(musics, key = lambda musics: musics[1], reverse = True) result = [] for i in range(len(musics)): if genres.count(musics[i][0]) == 1: result.append(genres.index(musics[i][0])) else: arr = [] for j in range(len(genres)): if genres[j] == musics[i][0]: arr.append([j, plays[j]]) arr = sorted(arr, key = lambda arr: arr[1]) if arr[len(arr)-1][1] == arr[len(arr)-2][1]: arr2 = [arr[i][0] for i in range(len(arr)) if arr[len(arr)-1][1] == arr[i][1]] result.append(arr2[0]) result.append(arr2[1]) else: result.append(arr[len(arr)-1][0]) if arr[len(arr)-2][1] == arr[len(arr)-3][1]: arr2 = [arr[i][0] for i in range(len(arr)-1) if arr[len(arr)-2][1] == arr[i][1]] arr2.sort() result.append(arr2[0]) else: result.append(arr[len(arr)-2][0]) return result
처음 이중 for문에서 musics=[[장르, 총 plays]]를 만들었다.
이후 musics를 총 plays를 기준으로 내림차순으로 정렬했다.
이제 장르별로 plays가 첫번째, 두번째로 많은 순으로 index를 반환하면 된다.
14번째 줄의 if문은 genres에서 musics[i][0] (장르명)이 한 번 반복 되는 지를 묻는다.
만약 그렇다면 하나의 곡만 선택해야 하기 때문이다.
그리고 else문 이하는 장르명이 모두 두 번 이상 반복 될 때의 구문이다.
musics[i][0]와 같은 장르인 genres[j]에 대해 arr=[]에 [j, plays[j]]를 담는다.
이를 arr[1], 즉 plays를 기준으로 정렬한다.
재생 횟수가 같으면 고유 번호가 낮은 노래를 먼저 수록해야 하므로 arr2에 plays가 같은 요소들의 인덱스를 모두 담고 이 리스트 arr2[0], arr2[1]을 순서대로 담는다. (애초에 arr는 같은 plays에 대해 index는 오름차순으로 정렬돼 있으므로 arr2를 sort할 필요는 없다.)
이하 else문에서는 재생 횟수가 최대인 요소는 한 개이므로 그냥 result에 담고 두번째로 큰 요소는 위 문단과 같은 로직으로 index가 가장 작은 값을 담는다.
def solution(genres, plays): answer = [] musics = {genre:[] for genre in set(genres)} for e in zip(genres, plays, range(len(plays))): musics[e[0]].append([e[1] , e[2]]) genreSort =sorted(list(musics.keys()), key= lambda x: sum(map(lambda y: y[0],musics[x])), reverse = True) for g in genreSort: temp = [plays_index[1] for plays_index in sorted(musics[g],key= lambda x: (x[0], -x[1]), reverse = True)] answer += temp[:min(len(temp),2)] return answer
musics를 genres의 키에 대한 dictionary로 만들고 아래 for문을 통해 musics[장르]에 [플레이수, 고유번호]를 append한다.
그 뒤의 genreSort의 선언은 lambda를 두 번 써서 조금 어렵다.
musics의 keys, 이는 곧 장르명인데, musics[장르][0]의 sum을 내림차순으로 정렬했을 때의 장르를 리스트에 담은 것이다.
그리고 temp에는 musics[g]의 요소들인 plays_index([재생 횟수, 고유번호])의 1번 요소, 즉 한 장르의 고유번호들을 모아둔 리스트이다.
이를 x[0](재생 횟수)에 대한 reverse, 내림차순의 순으로, 그리고 같은 plays에 대해서는 -x1의 reverse, 즉 index 값의 오름차순으로 정렬된다.
말이 조금 어려울 수 있지만, 코드 자체가 길지 않되 복잡하게 짜여진 것이기 때문에 어쩔 수 없다.
결과적으로 for문 안에서 temp에는 한 장르(g)에 대해 재생 횟수에 대한 내림차순, 같은 재생 횟수일 때는 고유번호의 오름차순으로 정렬된 고유번호들이 담긴다는 것을 이해하면 된다.
그리고 answer에 temp의 요소 중 0에서 min(len(temp),2)-1까지의 요소를 더해준다.
이것은 곧 temp의 길이가 1일 때(0일 수는 없다)는 min(len(temp),2) 값이 1이므로 answer += temp[:0]와 같은 의미이다. temp의 길이가 2이상일 때는 min(len(temp),2) 값이 2이므로 answer += temp[:1]이다. 장르에 속한 노래가 하나일 때 하나의 곡만 선택한다는 것을 표현한 것이다.
가독성은 다소 떨어지지만, lambda에 대한 활용을 배울 수 있는 답안이다.