📃 문제 링크
도현이는 컴퓨터와 컴퓨터를 모두 연결하는 네트워크를 구축하려 한다. 하지만 아쉽게도 허브가 있지 않아 컴퓨터와 컴퓨터를 직접 연결하여야 한다. 그런데 모두가 자료를 공유하기 위해서는 모든 컴퓨터가 연결이 되어 있어야 한다. (a와 b가 연결이 되어 있다는 말은 a에서 b로의 경로가 존재한다는 것을 의미한다. a에서 b를 연결하는 선이 있고, b와 c를 연결하는 선이 있으면 a와 c는 연결이 되어 있다.)
그런데 이왕이면 컴퓨터를 연결하는 비용을 최소로 하여야 컴퓨터를 연결하는 비용 외에 다른 곳에 돈을 더 쓸 수 있을 것이다. 이제 각 컴퓨터를 연결하는데 필요한 비용이 주어졌을 때 모든 컴퓨터를 연결하는데 필요한 최소비용을 출력하라. 모든 컴퓨터를 연결할 수 없는 경우는 없다.
입력
첫째 줄에 컴퓨터의 수 N (1 ≤ N ≤ 1000)가 주어진다.
둘째 줄에는 연결할 수 있는 선의 수 M (1 ≤ M ≤ 100,000)가 주어진다.
셋째 줄부터 M+2번째 줄까지 총 M개의 줄에 각 컴퓨터를 연결하는데 드는 비용이 주어진다. 이 비용의 정보는 세 개의 정수로 주어지는데, 만약에 a b c 가 주어져 있다고 하면 a컴퓨터와 b컴퓨터를 연결하는데 비용이 c (1 ≤ c ≤ 10,000) 만큼 든다는 것을 의미한다. a와 b는 같을 수도 있다.
출력
모든 컴퓨터를 연결하는데 필요한 최소비용을 첫째 줄에 출력한다.
예제 입력 1
6
9
1 2 5
1 3 4
2 3 2
2 4 7
3 4 6
3 5 11
4 5 3
4 6 8
5 6 8
예제 출력 1
23
최소신장트리(MST) 문제였다. 최소신장트리 알고리즘 중에서 크루스칼(Kruskal) 알고리즘으로 풀었고, 코드로는 처음 공부해보는 거라 알고리즘을 참고해서 풀었다.
최소신장트리는 무방향 가중치 그래프에서 간선의 가중치 합이 최소인 트리로, 이 문제에서 요구하는 답이다.
크루스칼 알고리즘은 간선들을 가중치가 작은 것부터 오름차순으로 정렬한 다음, 차례대로 간선을 돌면서 현재 선택한 간선들과 사이클을 이루지 않는 경우 트리 간선으로 선택하는 알고리즘이다.
최종적으로 parent
에는 각 노드의 루트 노드가 들어가게 되고, rank
에는 노드의 트리 높이가 들어가게 된다.
먼저 parent
리스트를 각 노드의 값으로 초기화해주고, rank
는 모두 0
으로 초기화한다.
edges
는 주어진 그래프로, 가중치를 기준으로 정렬하기 위해서 (가중치, a컴퓨터, b컴퓨터)
형식으로 저장한 후 오름차순으로 정렬한다.
find 함수
는 현재 노드에 연결되어 있는 루트 노드를 찾는 함수이다. 루트 노드를 찾아 parent
의 값을 바꿔주게 된다.
edges
를 반복문으로 돌면서 a컴퓨터
와 b컴퓨터
의 루트 노드가 다르다면 따로 떨어져 있는 그래프이기 때문에 (두 노드가 사이클을 이루고 있지 않기 때문에) union 함수
로 두 노드를 합쳐준다.
union 함수
는 두 트리의 높이(rank
)가 다르다면 높이가 큰 트리에 높이가 작은 트리를 붙여준다. 두 트리의 높이가 같다면 한 쪽의 트리 높이를 1
증가시켜준 뒤 다른 한 쪽의 트리를 붙여준다.
union
을 실행했다면 한 트리로 만들어준 것이기 때문에 (선택했다는 의미) 선택한 트리 간선의 가중치를 answer
에 더해주는 과정을 반복하고, 최종적으로 answer
를 리턴해주면 된다.
결과적으로 가중치가 작은 순서대로 로직을 실행하기 때문에 그리디 알고리즘 기반이라고 할 수 있다.