[백준] 파일 합치기 (Kotlin)

wonseok·2023년 2월 13일

해당 문제는 DP로 해결해야하는 문제이다.
아직까지도 DP문제를 마주치면 두려움이 엄습해오는데, 꾸준히 공부하고 기록하며 DP에 대한 두려움을 극복하고자 한다.

문제

소설가인 김대전은 소설을 여러 장(chapter)으로 나누어 쓰는데, 각 장은 각각 다른 파일에 저장하곤 한다. 소설의 모든 장을 쓰고 나서는 각 장이 쓰여진 파일을 합쳐서 최종적으로 소설의 완성본이 들어있는 한 개의 파일을 만든다. 이 과정에서 두 개의 파일을 합쳐서 하나의 임시파일을 만들고, 이 임시파일이나 원래의 파일을 계속 두 개씩 합쳐서 소설의 여러 장들이 연속이 되도록 파일을 합쳐나가고, 최종적으로는 하나의 파일로 합친다. 두 개의 파일을 합칠 때 필요한 비용(시간 등)이 두 파일 크기의 합이라고 가정할 때, 최종적인 한 개의 파일을 완성하는데 필요한 비용의 총 합을 계산하시오.

예를 들어, C1, C2, C3, C4가 연속적인 네 개의 장을 수록하고 있는 파일이고, 파일 크기가 각각 40, 30, 30, 50 이라고 하자. 이 파일들을 합치는 과정에서, 먼저 C2와 C3를 합쳐서 임시파일 X1을 만든다. 이때 비용 60이 필요하다. 그 다음으로 C1과 X1을 합쳐 임시파일 X2를 만들면 비용 100이 필요하다. 최종적으로 X2와 C4를 합쳐 최종파일을 만들면 비용 150이 필요하다. 따라서, 최종의 한 파일을 만드는데 필요한 비용의 합은 60+100+150=310 이다. 다른 방법으로 파일을 합치면 비용을 줄일 수 있다. 먼저 C1과 C2를 합쳐 임시파일 Y1을 만들고, C3와 C4를 합쳐 임시파일 Y2를 만들고, 최종적으로 Y1과 Y2를 합쳐 최종파일을 만들 수 있다. 이때 필요한 총 비용은 70+80+150=300 이다.

소설의 각 장들이 수록되어 있는 파일의 크기가 주어졌을 때, 이 파일들을 하나의 파일로 합칠 때 필요한 최소비용을 계산하는 프로그램을 작성하시오.

입력

프로그램은 표준 입력에서 입력 데이터를 받는다. 프로그램의 입력은 T개의 테스트 데이터로 이루어져 있는데, T는 입력의 맨 첫 줄에 주어진다.각 테스트 데이터는 두 개의 행으로 주어지는데, 첫 행에는 소설을 구성하는 장의 수를 나타내는 양의 정수 K (3 ≤ K ≤ 500)가 주어진다. 두 번째 행에는 1장부터 K장까지 수록한 파일의 크기를 나타내는 양의 정수 K개가 주어진다. 파일의 크기는 10,000을 초과하지 않는다.

출력

프로그램은 표준 출력에 출력한다. 각 테스트 데이터마다 정확히 한 행에 출력하는데, 모든 장을 합치는데 필요한 최소비용을 출력한다.

예제 입력

2
4
40 30 30 50
15
1 21 3 4 5 35 5 4 3 5 98 21 14 17 32

예제 출력

300
864

접근 방법

우선 이 문제를 왜 DP로 접근해야하는가? 부터 생각해보자. 비용의 합을 구하는 과정에서 첫 번째, 두 번째 케이스 모두 150이라는 C1~C4의 전체 비용 합을 더해주는 연산이 중복해서 나타난다. 어떠한 문제의 SubProblem이 중복해서 나타난다면, 이 문제는 DP로 푸는 것이 적절해보인다. 중복하지 않는다면? -> 분할정복으로 접근하면 된다.

그렇다면, 이 문제의 dp 배열이 과연 1차원 배열일까 아니면 2차원 배열일까를 또 고민해봐야 한다. 결국 연속된 파일들을 특정한 구간 내에서 여러 합쳐서 누적합을 구하는 과정이 하나의 SubProblem이 되는 것이고, 이 모든 SubProblem들이 합쳐져서 큰 전체의 문제를 해결하는 것이다. 그럼 dp 배열은 결국 x~y번째 파일들을 합치는데 필요한 최소비용이 되는 것이고, 시작하는 인덱스 x, 끝나는 인덱스 y 2가지의 파라미터가 필요하므로 dp 배열은 2차원 배열이 되어야 한다.

그래서 결국 dp[x][y]는 x번째부터 y번째 파일들을 합치는데 필요한 최소비용(누적 합)이다.
또한 전체 비용 합이 중복해서 나타나기 때문에 sum[x] 라는 1번째 부터 x번째 파일까지의 비용을 총 합한 배열이 추가적으로 필요하다.

그림을 통해 추가적으로 설명해보겠다.

결국 플이 코드는 삼중 for문으로 돌아가며, O(N³)의 시간 복잡도를 가지게 된다.

처음에는 이게 맞나 싶었지만, K가 최대 500이므로 500^3 = 대략 1억 2천 5백만번의 연산을 시간 제한 2초내에 수행할 수 있을 것 같아 그대로 코드를 짜보았다.

설명을 덧붙이자면, 구해야 하는 범위 크기인 i가 1일 때는 1~2번째 파일, 2~3번째 파일, 3~4번째 파일, ... 이고 i가 2일 때는 1~3번째 파일, 2~4번째 파일, 3~5번째 파일, ... 이다.

풀이 코드 (kotlin)

fun main() {
    val t = readln().toInt()
    repeat(t) {
        val K = readln().toInt()
        val files = readln().split(" ").map { it.toLong() }
        val dp: Array<LongArray> = Array(K + 1) { LongArray(K + 1) }
        val sum = LongArray(K + 1)

        // sum 배열 초기화
        for (i in 1..K) {
            sum[i] = sum[i - 1] + files[i - 1]
        }

        // bottom-up 방식으로 dp 배열 채워나가기
        for (i in 1..K) {
            for (j in 1..K - i) {
                dp[j][j + i] = MAX_VALUE
                for (k in j until j + i) {
                    dp[j][j + i] = min(dp[j][j + i], dp[j][k] + dp[k + 1][j + i] + sum[j + i] - sum[j - 1])
                }
            }
        }

        // 1~k번쨰 까지 파일들을 합치는데 필요한 최소비용 출력
        println(dp[1][K])
    }
}

결과!!!

wonseok

이전 포스트

[프로그래머스 Lv.2] 조이스틱 (Kotlin)

다음 포스트