📖 백준 13975번 : https://www.acmicpc.net/problem/13975

| 시간 제한 | 메모리 제한 |
|---|---|
| 2 초 | 512 MB |
소설가인 김대전은 소설을 여러 장(chapter)으로 나누어 쓰는데, 각 장은 각각 다른 파일에 저장하곤 한다. 소설의 모든 장을 쓰고 나서는 각 장이 쓰여진 파일을 합쳐서 최종적으로 소설의 완성본이 들어있는 한 개의 파일을 만든다. 이 과정에서 두 개의 파일을 합쳐서 하나의 임시파일을 만들고, 이 임시파일이나 원래의 파일을 계속 두 개씩 합쳐서 파일을 합쳐나가고, 최종적으로는 하나의 파일로 합친다. 두 개의 파일을 합칠 때 필요한 비용(시간 등)이 두 파일 크기의 합이라고 가정할 때, 최종적인 한 개의 파일을 완성하는데 필요한 비용의 총 합을 계산하시오.
예를 들어, C1, C2, C3, C4가 네 개의 장을 수록하고 있는 파일이고, 파일 크기가 각각 40, 30, 30, 50 이라고 하자. 이 파일들을 합치는 과정에서, 먼저 C2와 C3를 합쳐서 임시파일 X1을 만든다. 이때 비용 60이 필요하다. 그 다음으로 C1과 X1을 합쳐 임시파일 X2를 만들면 비용 100이 필요하다. 최종적으로 X2와 C4를 합쳐 최종파일을 만들면 비용 150이 필요하다. 따라서, 최종의 한 파일을 만드는데 필요한 비용의 합은 60+100+150=310 이다. 다른 방법으로 파일을 합치면 비용을 줄일 수 있다. 먼저 C1과 C2를 합쳐 임시파일 Y1을 만들고, C3와 C4를 합쳐 임시파일 Y2를 만들고, 최종적으로 Y1과 Y2를 합쳐 최종파일을 만들 수 있다. 이때 필요한 총 비용은 70+80+150=300 이다.
소설의 각 장들이 수록되어 있는 파일의 크기가 주어졌을 때, 이 파일들을 하나의 파일로 합칠 때 필요한 최소비용을 계산하는 프로그램을 작성하시오.
프로그램은 표준 입력에서 입력 데이터를 받는다. 프로그램의 입력은 T개의 테스트 데이터로 이루어져 있는데, T는 입력의 맨 첫 줄에 주어진다.각 테스트 데이터는 두 개의 행으로 주어지는데, 첫 행에는 소설을 구성하는 장의 수를 나타내는 양의 정수 K (3 ≤ K ≤ 1,000,000)가 주어진다. 두 번째 행에는 1장부터 K장까지 수록한 파일의 크기를 나타내는 양의 정수 K개가 주어진다. 파일의 크기는 10,000을 초과하지 않는다.
프로그램은 표준 출력에 출력한다. 각 테스트 데이터마다 정확히 한 행에 출력하는데, 모든 장을 합치는데 필요한 최소비용을 출력한다.
파일들을 하나로 합칠 때 최소비용을 가지는 경우는 반드시 주어진 파일들에서 가장 작은 값들부터 합치는 경우여야한다. 연속해야한다는 조건이 없으므로 주어진 값들을 정렬해서 최솟값을 반복적으로 구해내는 방식으로 구현했다. 처음엔 multiset을 활용해서 최솟값을 구했는데, 시간 초과를 받았다. 중간에 multiset을 초기화하는 구문에서 clear함수를 안쓰고 생성자를 불러와 새로 정의하는 방식으로 초기화하니 아슬아슬하게 통과했다. priority_queue를 사용해서 구했을 때는 거의 2~3배 정도 더 빠른 시간으로 널널하게 통과했다.
둘 다 똑같이 O(logN)의 복잡도를 가진 자료구조인데 왜이렇게 차이가 클까 싶어서 여러 자료를 찾아봤다. 먼저 set은 여러 노드들이 존재하고 이 노드들을 이터레이터로 순회하는 방식으로 구현되어져 있다. 즉, 여러 allocation이 존재하는 형태이다. priority_queue는 하나의 자료구조에서 heapify의 알고리즘으로 데이터를 저장하는 방식으로 구현되어져 있다. 하나의 allocation으로 이루어진 형태이다. 따라서 이론적으로는 같은 시간 복잡도를 갖는 자료구조이지만, 마치 이중연결리스트보다 배열에서 탐색하는 것이 더 빠른 속도로 탐색하고 적은 메모리를 사용하는 것과 비슷하게 priority_queue가 더 빠르고 적은 메모리를 사용한다! 앞으로는 반복적으로 최솟값 혹은 최댓값을 찾아야할 때, 가급적이면 priority_queue를 사용하고 최소, 최대를 동시에 자주 찾아야할 때만 제한적으로 set을 사용하는 것이 좋겠다.
#include <iostream>
#include <queue>
#define lli long long int
using namespace std;
priority_queue<lli> pq;
int main() {
ios::sync_with_stdio(false);
cin.tie(NULL); cout.tie(NULL);
lli ans = 0;
int t, k;
long long int temp;
cin >> t;
for (int i = 0; i < t; i++) {
cin >> k;
for (int j = 0; j < k; j++) {
cin >> temp;
pq.push(-temp);
}
while (pq.size() > 1) {
temp = pq.top();
pq.pop();
temp += pq.top();
pq.pop();
pq.push(temp);
ans += -temp;
}
cout << ans << '\n';
ans = 0;
pq = priority_queue<lli>();
}
return 0;
}
#include <iostream>
#include <set>
using namespace std;
multiset<long long int> mts;
int main() {
ios::sync_with_stdio(false);
cin.tie(NULL); cout.tie(NULL);
long long int ans = 0;
int t, k;
int temp;
cin >> t;
for (int i = 0; i < t; i++) {
cin >> k;
for (int j = 0; j < k; j++) {
cin >> temp;
mts.insert(temp);
}
for (int i = 0; i < k-1; i++) {
auto it = mts.begin();
long long int pages = *it;
mts.erase(it);
it = mts.begin();
pages += *it;
mts.erase(it);
mts.insert(pages);
ans += pages;
}
cout << ans << '\n';
ans = 0;
mts = multiset<long long int>();// clear함수를 썼을 땐 시간 초과가 나왔다..
}
return 0;
}