매운 것을 좋아하는 Leo는 모든 음식의 스코빌 지수를 K 이상으로 만들고 싶습니다. 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 Leo는 스코빌 지수가 가장 낮은 두 개의 음식을 아래와 같이 특별한 방법으로 섞어 새로운 음식을 만듭니다.
섞은 음식의 스코빌 지수 = 가장 맵지 않은 음식의 스코빌 지수 + (두 번째로 맵지 않은 음식의 스코빌 지수 * 2)
Leo는 모든 음식의 스코빌 지수가 K 이상이 될 때까지 반복하여 섞습니다.Leo가 가진 음식의 스코빌 지수를 담은 배열 scoville과 원하는 스코빌 지수 K가 주어질 때, 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 섞어야 하는 최소 횟수를 return 하도록 solution 함수를 작성해주세요.
scoville | K | return |
---|---|---|
[1, 2, 3, 9, 10, 12] | 7 | 2 |
모든 음식의 스코빌 지수가 7 이상이 되었고 이때 섞은 횟수는 2회입니다.
import heapq
def solution(scoville, K):
answer = 0
heapq.heapify(scoville) #리스트를 바로 heap으로 변환
while scoville[0] < K:
new_sco = heapq.heappop(scoville) + (heapq.heappop(scoville)*2)
heapq.heappush(scoville,new_sco)
answer += 1
if len(scoville) == 1 and scoville[0] < K: # K이상으로 만들 수 없을때
return -1
return answer
파이썬 heapq 모듈은 heapq (priority queue) 알고리즘을 제공한다.
모든 부모 노드는 그의 자식 노드보다 값이 작거나 큰 이진트리(binary tree) 구조인데, 내부적으로는 인덱스 0에서 시작해 k번째 원소가 항상 자식 원소들(2k+1, 2k+2) 보다 작거나 같은 최소 힙의 형태로 정렬된다.
그렇다고 해서 heap[-1]이 최댓값인 것을 보장할 수 없다. 여기서 최소 힙의 형태로 정렬된다는 말은 항상 부모 노드 < 자식노드 임을 의미하는 것이다.
heapq는 파이썬에서 제공하는 내장 모듈이기 때문에 import heapq
로 선언해서 사용한다.
heapq
주요 함수 (min-heap)heapq.heappush(heap, item)
: item을 heap에 추가 - timeheapq.heappop(heap)
: heap에서 가장 작은 원소(앞부터)를 pop & 리턴. 비어 있는 경우 IndexError가 호출됨. - timeheapq.heapify(x)
: 리스트 x를 즉각적으로 heap으로 변환함 - time 최대 힙을 만들려면 각 값에 대한 우선 순위를 구한 후, (우선 순위, 값) 구조의 튜플(tuple)을 힙에 추가하거나 삭제하면 됩니다. 그리고 힙에서 값을 읽어올 때는 각 튜플에서 인덱스 1에 있는 값을 취하면 됩니다.
from heapq import heappush, heappop
nums = [4, 1, 7, 3, 8, 5]
heap = []
for num in nums:
heappush(heap, (-num, num)) # (우선 순위, 값)
while heap:
print(heappop(heap)[1]) # index 1(최댓값)
heap
에서는 nsmallest()
, nlargest()
메소드를 통해서 구할 수 있습니다.
import heapq
heapq.nsmallest(n,iterable) # n번째 최솟값
heapq.nlargest(n,iterable) # n번째 최댓값
그럼 가장 중요한것은 heap은 코딩테스트에서 어떤 제한사항에서 쓰이느냐가 관건이다. 보통 for문 배열로 돌리면(빡쎄게..) 될 것같은데?류의 문제에서 timeout error가 발생할때 이런 문제들은 대개 heap을 활용해야 풀릴 가능성이 매우 높다.
또는 시작-종료 시간을 주고 최대로 수용할 수 있는 강의의 개수를 구하시오와 같은 비슷한 문제들이 백준,프로그래머스,softeer,SWEA 등등 유명한 코테 사이트에서도 출제가 되는데 이 문제는 백이면 백 다 heap을 알아야 풀 수 있는 문제이다.
즉 필자의 경험으론, 배열의 사이즈가 10**6 크기로 주어졌을때, heap을 활용하면 대개 O(logN) time에 해결하여 기업에서 파놓은 timeout error를 피해갈 수 있다고 생각한다.
# heap 모듈 불러오기
import heapq
heap = []
# 삽입
heapq.heappush(heap, value)
# 삭제 (최솟값을 삭제한다.)
heapq.heappop(heap)
# peek (최솟값을 삭제하지 않고 추출만 하기)
heap[0]
# 리스트를 heap으로 변환
heapq.heapify(heap)