BOJ 11066 파일 합치기 (Java)

사람·2025년 2월 14일
0

BOJ

목록 보기
31/75

문제

소설가인 김대전은 소설을 여러 장(chapter)으로 나누어 쓰는데, 각 장은 각각 다른 파일에 저장하곤 한다. 소설의 모든 장을 쓰고 나서는 각 장이 쓰여진 파일을 합쳐서 최종적으로 소설의 완성본이 들어있는 한 개의 파일을 만든다. 이 과정에서 두 개의 파일을 합쳐서 하나의 임시파일을 만들고, 이 임시파일이나 원래의 파일을 계속 두 개씩 합쳐서 소설의 여러 장들이 연속이 되도록 파일을 합쳐나가고, 최종적으로는 하나의 파일로 합친다. 두 개의 파일을 합칠 때 필요한 비용(시간 등)이 두 파일 크기의 합이라고 가정할 때, 최종적인 한 개의 파일을 완성하는데 필요한 비용의 총 합을 계산하시오.

예를 들어, C1, C2, C3, C4가 연속적인 네 개의 장을 수록하고 있는 파일이고, 파일 크기가 각각 40, 30, 30, 50 이라고 하자. 이 파일들을 합치는 과정에서, 먼저 C2와 C3를 합쳐서 임시파일 X1을 만든다. 이때 비용 60이 필요하다. 그 다음으로 C1과 X1을 합쳐 임시파일 X2를 만들면 비용 100이 필요하다. 최종적으로 X2와 C4를 합쳐 최종파일을 만들면 비용 150이 필요하다. 따라서, 최종의 한 파일을 만드는데 필요한 비용의 합은 60+100+150=310 이다. 다른 방법으로 파일을 합치면 비용을 줄일 수 있다. 먼저 C1과 C2를 합쳐 임시파일 Y1을 만들고, C3와 C4를 합쳐 임시파일 Y2를 만들고, 최종적으로 Y1과 Y2를 합쳐 최종파일을 만들 수 있다. 이때 필요한 총 비용은 70+80+150=300 이다.

소설의 각 장들이 수록되어 있는 파일의 크기가 주어졌을 때, 이 파일들을 하나의 파일로 합칠 때 필요한 최소비용을 계산하는 프로그램을 작성하시오.

입력
프로그램은 표준 입력에서 입력 데이터를 받는다. 프로그램의 입력은 T개의 테스트 데이터로 이루어져 있는데, T는 입력의 맨 첫 줄에 주어진다.각 테스트 데이터는 두 개의 행으로 주어지는데, 첫 행에는 소설을 구성하는 장의 수를 나타내는 양의 정수 K (3 ≤ K ≤ 500)가 주어진다. 두 번째 행에는 1장부터 K장까지 수록한 파일의 크기를 나타내는 양의 정수 K개가 주어진다. 파일의 크기는 10,000을 초과하지 않는다.

출력
프로그램은 표준 출력에 출력한다. 각 테스트 데이터마다 정확히 한 행에 출력하는데, 모든 장을 합치는데 필요한 최소비용을 출력한다.

예제 입력 1
2
4
40 30 30 50
15
1 21 3 4 5 35 5 4 3 5 98 21 14 17 32
예제 출력 1
300
864

접근

이 문제를 처음 봤을 때 너무 허프만 코딩 문제처럼 생겨서, 그리디 문제라고 철썩같이 믿고 접근했었는데 놀랍게도 아니었다...
'허프만 코딩 == 작은 수부터 합치면 최적해' 라는 것만 머릿속에 남아 있고 순서에 관한 건 기억에 없어서 수열 내 숫자들의 순서를 바꿀 수 있어야만 허프만 코딩을 사용할 수 있다는 걸 몰랐다....
정해진 순서 안에서 최대한 작은 숫자들끼리 계속 더해봤는데 아무리 해봐도 예제 출력과 값이 다르게 나왔다. 40 30 30 50만 해도 가운데에 있는 30과 30을 먼저 더하는 게 가장 작은데, 문제에 그대로 나와 있듯이 이렇게 더하면 최적해가 나오지 않는다.

그래서 알고리즘 분류를 보니 DP 문제라길래 몇 시간 삽질한 거 엎고 다시 구현했다...^^ 그래도 예제 입력 뜯어보면서 부분의 최솟값을 합쳐 전체의 최솟값을 만들 수 있지 않을까? 라는 추측을 했었어서 DP로 금방 구현할 수 있었다.
dp[i][j]에 i부터 j까지의 파일을 합치는 비용의 최솟값을 메모이제이션하는 방식으로 구현하면 된다. 일단 i부터 j까지의 파일들을 합치는 모든 경우의 수를 구한다. 각 경우의 수는 다음과 같은 과정을 거쳐 구할 수 있다.
1. i부터 j까지의 파일들을 p를 기준으로 자른다.
2. 모든 가능한 p 값(i <= p < j)에 대해 (**i부터 p까지**의 파일을 합치는 최솟값) + (**p + 1부터 j까지**의 파일을 합치는 최솟값)을 구한다.
3. 이렇게 구한 두 덩어리(i~p, p+1~j)의 파일들을 하나로 합친 결과를 구한다.
이렇게 구한 결과들 중 최솟값을 최종적인 dp[i][j]의 값으로 저장했다.

그런데 여기서 또 내가 혼자 생각지 못했던 게 있는데, 바로 부분합을 더해주는 부분이다. 위 3번 과정을 진행할 때, 어떤 때는 두 덩어리의 파일들을 그대로 합치고 또 어떤 때는 어느 한 덩어리의 값을 2배를 해서 합치고,,, 하는 게 너무 헷갈렸었는데 다른 풀이를 보니 그냥 각 덩어리를 더한 다음 i부터 j까지의 부분합을 더해주면 모든 경우에 대해 파일을 합치는 비용이 잘 구해지더라..

구현

import java.io.*;
import java.util.*;

class Main {
    static int[] files;
    static int[][] dp;
    static int[] sum;
    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        StringBuilder sb = new StringBuilder();
        int T = Integer.parseInt(br.readLine());
        for (int t = 0; t < T; t++) {
            int K = Integer.parseInt(br.readLine());
            files = new int[K + 1];
            dp = new int[K + 1][K + 1];
            sum = new int[K + 1];
            StringTokenizer st = new StringTokenizer(br.readLine());
            for (int k = 1; k <= K; k++) {
                files[k] = Integer.parseInt(st.nextToken());
                Arrays.fill(dp[k], Integer.MAX_VALUE);
                sum[k] = sum[k - 1] + files[k];
            }
            sb.append(mergeFiles(1, K)).append('\n');
        }
        System.out.print(sb.toString());
    }

    private static int mergeFiles(int start, int end) {
        if (dp[start][end] == Integer.MAX_VALUE) {
            if (start == end) {
                dp[start][end] = 0;
            } else if (start + 1 == end) {
                dp[start][end] = files[start] + files[end];
            } else {
                int subSum = sum[end] - sum[start - 1];
                dp[start][end] = mergeFiles(start + 1, end) + subSum;
                for (int i = start + 1; i < end; i++) {
                    dp[start][end] = Math.min(dp[start][end], mergeFiles(start, i) + mergeFiles(i + 1, end) + subSum);
                }
            }
        }
        return dp[start][end];
    }
}

profile
알고리즘 블로그 아닙니다.

0개의 댓글