전체 정렬과 우선순위 큐 (시간 복잡도의 착각과 오해)

devswansong·2025년 1월 4일

시간 복잡도 우선순위 큐 정렬

Algorithm

목록 보기

2/2

아래 내용들은 저의 개인적인 경험에 따른 가정과 추측에 대한 내용입니다.
틀린 내용이 당연히 있을 수 있으며 어떠한 피드백이라도 감사히 잘 받겠습니다.

개요

전체 정렬은 알고리즘으로 분류되고 우선순위 큐는 자료구조로 분류됩니다.
이 둘을 직접적으로 비교하면 와닿지 않을 수 있으니 상황을 예로 들겠습니다.

n 은 i 조건을 따르는 임의의 수 50개로 이루어져 있습니다. (0 < i < 100)
그리고 n 에서 내림차순으로 10 개의 수를 뽑아내야합니다.

정렬 알고리즘 접근법
전체 정렬 알고리즘으로 이 문제를 접근한다면 n 의 전체 원소를 정렬한 뒤에 내림차순으로 원소를 접근할 것입니다.

우선순위 큐
우선순위 큐로 이 문제를 접근한다면 n 의 전체 원소를 우선순위 큐라는 자료구조에 다시 담은 뒤 peek 값을 원하는 수만큼 추출해낼 것입니다.

정렬 알고리즘 시간복잡도
모든 원소를 정렬하게 되니 O(|n| * lg|n|) 의 시간복잡도로 정렬을 수행하고 내림차순으로 원소에 접근할 땐 O(1) 의 시간복잡도로 수행할 것입니다.

우선순위 큐 시간복잡도
모든 원소에 접근해 우선순위 큐를 새롭게 형성하니 O(|n| * lg|n|) 의 시간복잡도가 소요될 것입니다. 그리고 내림차순으로 원소에 접근할 땐 O(lg|n|) 의 시간복잡도가 소요될 것입니다.

정리 표

	정렬	우선순위 큐
형성 비용	O(lg\|N\|)	O(lg\|N\|)
최고값 접근 비용	O(1)	O(lg\|N\|)

착각

이렇게 시간복잡도로만 보면 해당 문제를 해결할 땐 정렬을 사용하는게
늘 합리적여 보입니다. 형성 비용은 정렬, 우선순위 큐가 동일하며 접근할 땐 정렬이 더 뛰어난 성능을 보이니 말이죠.

이게 오늘 새벽까지 제가 가지고 있던 착각과 오해였습니다.

PS 에 빠져살다보니 로직의 성능 평가에 있어 Big O notation 이 절대적인 평가수치라고 생각했습니다.
이런 저의 기대를 져버리고 우선순위 큐가 훨씬 높은 성능을 보여준 문제가 있었습니다.

결론

시간 복잡도 만으로 다 드러나지 않는 무언가가 있다는건 잘 알았습니다.

그럼 언제 우선순위 큐를 써야하고 언제 전체 정렬을 써야할까요?

다음과 같이 정리했습니다.

근거 없는 수치이지만 |n| <= 10^4 수준이라면 뭘 써도 상관이 없을 것 같습니다. 이러한 조건이라면 언어적으로 지원을 더 잘 받는 배열계 자료구조와 정렬을 사용할 것입니다.

하지만 |n| 이 그 이상이라면 문제의 성향에 따라 달라질 것입니다.
이번 문제처럼 매번 최대값을 추출해내는 문제라면 저는 우선순위 큐를 선택할 것 같습니다. 반드시 모든 원소에 접근한다는 가정이 있다면 정렬을 택할 듯 하지만 경우에 따라 몇 개의 원소에만 접근한다면 Lazy 하게 최대, 최소값에 접근하는 우선순위 큐를 택할 것 입니다.

그 외의 상황이라면 배열계 자료구조와 정렬을 택할 것 같습니다.
Two Pointer 와 Binary Search 등을 활용해야하는 문제라면 더욱 더 말입니다.

그 외

TreeMap 으로도 시도해보고 싶네요.

다른 해결책으론 10^4 만큼 정수형 배열을 만든 다음
가격을 인덱스로 무게들을 더해 최종적으로는 내림차순으로 인덱스를 접근해 최적의 값을 구할 수도 있을 것 같습니다. 이 경우 O(|n|) 으로 문제를 해결할 수 있을 것 같아 정해가 아닐까 생각합니다.

devswansong

unagi.zoso == ziggy stardust == devswansong

이전 포스트

전체 정렬과 우선순위 큐 (시간 복잡도의 착각과 오해)

Algorithm

개요

착각

결론

그 외

[Algorithm] Trie (Python code)

0개의 댓글