백준 2098 외판원 순회 (TSP)

HyunKyu Lee·2023년 11월 29일
0

문제 링크
2098번: 외판원 순회

문제

외판원 순회 문제는 영어로 Traveling Salesman problem (TSP) 라고 불리는 문제로 computer science 분야에서 가장 중요하게 취급되는 문제 중 하나이다. 여러 가지 변종 문제가 있으나, 여기서는 가장 일반적인 형태의 문제를 살펴보자.

1번부터 N번까지 번호가 매겨져 있는 도시들이 있고, 도시들 사이에는 길이 있다. (길이 없을 수도 있다) 이제 한 외판원이 어느 한 도시에서 출발해 N개의 도시를 모두 거쳐 다시 원래의 도시로 돌아오는 순회 여행 경로를 계획하려고 한다. 단, 한 번 갔던 도시로는 다시 갈 수 없다. (맨 마지막에 여행을 출발했던 도시로 돌아오는 것은 예외) 이런 여행 경로는 여러 가지가 있을 수 있는데, 가장 적은 비용을 들이는 여행 계획을 세우고자 한다.

각 도시간에 이동하는데 드는 비용은 행렬 W[i][j]형태로 주어진다. W[i][j]는 도시 i에서 도시 j로 가기 위한 비용을 나타낸다. 비용은 대칭적이지 않다. 즉, W[i][j] 는 W[j][i]와 다를 수 있다. 모든 도시간의 비용은 양의 정수이다. W[i][i]는 항상 0이다. 경우에 따라서 도시 i에서 도시 j로 갈 수 없는 경우도 있으며 이럴 경우 W[i][j]=0이라고 하자.

N과 비용 행렬이 주어졌을 때, 가장 적은 비용을 들이는 외판원의 순회 여행 경로를 구하는 프로그램을 작성하시오.

입력

첫째 줄에 도시의 수 N이 주어진다. (2 ≤ N ≤ 16) 다음 N개의 줄에는 비용 행렬이 주어진다. 각 행렬의 성분은 1,000,000 이하의 양의 정수이며, 갈 수 없는 경우는 0이 주어진다. W[i][j]는 도시 i에서 j로 가기 위한 비용을 나타낸다.

항상 순회할 수 있는 경우만 입력으로 주어진다.

출력

첫째 줄에 외판원의 순회에 필요한 최소 비용을 출력한다.

예제 입력 1

4
0 10 15 20
5 0 9 10
6 13 0 12
8 8 9 0

예제 출력 1

35

외판원 순회 문제 이해하기

N의 최대크기는 16이다. 그래서 만약 모든 경로를 조회하면서 답을 구하려고 한다면 16! = 약 20조 정도가 되어 시간초과가 발생한다. 그래서 비트마스킹과 DP를 사용하여 풀어줘야한다. 비트마스킹을 사용하면 2^n의 상태값을 n bit로 표현할 수 있다. 그리고 그 줄어든 O(n!)을 dp 메모제이션 기법을 사용하여 최적화를 이뤄준다.

TSP는 한 정점에서 다른 모든 정점을 순회하여 다시 출발 정점으로 돌아오는 최적의 경로를 찾는 방식으로 풀 수 있다. 이 순회 경로는 싸이클로  n개의 정점 중 어느 정점에서 탐색을 시작을 해도 결과는 똑같다는 것을 알아야한다.

  • 정리하면 TSP(외판원 순회)는 최단 순환 경로를 탐색해야하는데 1) N! 의 중복 경로를 제거해주는 DP 메모제이션 기법을 사용한다. 그래도 2^N의 모든 경우의 수를 표현해야 하기 때문에 그만큼의 공간복잡도가 필요하다. 2) 메모리 사용량도 줄이고 성능 향상을 위해서 2^N의 경우의 수를 Nbit로 표현할 수 있는 비트마스킹으로 사용한다.

정답 코드

import java.io.*;
import java.util.*;

class Main {
    static int maxBit;
    static int n;
    static int[][] map;
    static int[][] dy;
    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
//        BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(System.out));
//        Scanner sc = new Scanner(System.in);
        n = Integer.valueOf(br.readLine());
        maxBit = (1 << n) - 1;
        map = new int[n + 1][n + 1];
        dy = new int[n + 1][1 << n];
        for (int i = 1; i <= n; i++) {
            StringTokenizer st = new StringTokenizer(br.readLine(), " ");
            for (int j = 1; j <= n; j++) {
                map[i][j] = Integer.valueOf(st.nextToken());
            }
        }

        for (int i = 0; i < n + 1; i++) {
            Arrays.fill(dy[i], -1);
        }
        int answer = DFS(1, 1);
        System.out.println(answer);
    }

    private static int DFS(int now, int bit) {
        if ((bit & maxBit) == maxBit){
            if (map[now][1] != 0){
                return map[now][1];
            }
            return Integer.MAX_VALUE;
        }
        if (dy[now][bit] != -1)
            return dy[now][bit];
        dy[now][bit] = Integer.MAX_VALUE;
        for (int i = 1; i <= n; i++) {
            if (map[now][i] != 0){
                int tmp =  1 << i - 1;
                if ((bit & tmp) != tmp){
                    int result = DFS(i, bit | tmp);
                    if (result != Integer.MAX_VALUE)
                        dy[now][bit] = Math.min(dy[now][bit], result + map[now][i]);
                }
            }
        }
        return dy[now][bit];
    }

}
  • dy[i][j] → i는현재 위치, j는 현재 위치가지 오는데 방문한 도시의 비트
    • j가 이진수 1010이라면 4번과 2번 도시를 지나왔다는 것임
  • dy를 -1로 채워준 이유는 만약 첫 도시로 돌아오는 경로가 없을 때 IntMax를 return하는데 이때 방문을 이미 했는데도 IntMax인지 방문을 안한 IntMax인지 구분할 수 없어서 무한루프가 걸릴 수 있기 때문이다.
profile
backend developer

0개의 댓글

관련 채용 정보