출처: https://www.acmicpc.net/problem/1197
그래프가 주어졌을 때, 그 그래프의 최소 스패닝 트리를 구하는 프로그램을 작성하시오.
최소 스패닝 트리는, 주어진 그래프의 모든 정점들을 연결하는 부분 그래프 중에서 그 가중치의 합이 최소인 트리를 말한다.
첫째 줄에 정점의 개수 V(1 ≤ V ≤ 10,000)와 간선의 개수 E(1 ≤ E ≤ 100,000)가 주어진다. 다음 E개의 줄에는 각 간선에 대한 정보를 나타내는 세 정수 A, B, C가 주어진다. 이는 A번 정점과 B번 정점이 가중치 C인 간선으로 연결되어 있다는 의미이다. C는 음수일 수도 있으며, 절댓값이 1,000,000을 넘지 않는다.
그래프의 정점은 1번부터 V번까지 번호가 매겨져 있고, 임의의 두 정점 사이에 경로가 있다. 최소 스패닝 트리의 가중치가 -2,147,483,648보다 크거나 같고, 2,147,483,647보다 작거나 같은 데이터만 입력으로 주어진다.
첫째 줄에 최소 스패닝 트리의 가중치를 출력한다.
👉 입력 - 주어진 테스트 케이스
3 3
1 2 1
2 3 2
1 3 3
🔥 ex2 input)
5 7
1 2 1
1 3 1
1 4 1
2 3 1
2 4 1
3 4 1
4 5 2
👉 출력
3
🔥 ex2 output)
5
최소 스패닝 트리를 구하는 문제로서 Kruskal이나 Prim으로 접근해서 풀 수 있는 문제이다.
""" Kruskal """
import sys
V, E = map(int, sys.stdin.readline().strip().split())
edges = []
for _ in range(E):
src, dest, w = map(int, input().split())
edges.append((w, src, dest))
def find(parent, node):
if parent[node] == node: return node
else: return find(parent, parent[node])
def union(parent, v1, v2):
if v1 > v2: parent[v1] = v2
else: parent[v2] = v1
def solution(V, E, edges):
# sort by weights
edges.sort(key=lambda x: x[0])
parent = [e for e in range(V + 1)]
answer, cnt = 0, 0
for edge in edges:
pv1 = find(parent, edge[1])
pv2 = find(parent, edge[2])
if pv1 != pv2:
cnt += 1
union(parent, pv1, pv2)
answer += edge[0]
if cnt == V - 1: break
return answer
print(solution(V, E, edges))
""" Prim """
from heapq import heappush, heappop
V, E = map(int, input().split())
graph = [[] for _ in range(V + 1)]
for _ in range(E):
src, dst, w = map(int, input().split())
graph[src].append((dst, w))
graph[dst].append((src, w))
answer = 0
visited = [False for _ in range(V + 1)]
q = [(0, 1)] # w, node
cnt = 0
while cnt < V: # cnt == V - 1 -> break
w, node = heappop(q)
if visited[node] == False:
visited[node] = True
answer += w
cnt += 1
for nv, nw in graph[node]:
heappush(q, (nw, nv))
Kruskal의 시간복잡도가 간선의 갯수가 e개 라고 하면 가 되어야 하고, Prim의 시간 복잡도는 그래프의 정점의 갯수가 n이면 가 되어야한다.
공부를 하면서 짰던 코드를 정답자의 코드를 보고 바꿔봤지만 로직에서는 거의 같은 과정을 구현한 거 같은데 시간 차이가 많이 났다 😭
위에 게시한 코드는 5028ms 가 Kruskal, 5336ms이 Prim 알고리즘을 적용한 코드인데 속도면에서 보면 아직도 이해가 되지는 않는다..
484ms 가 나왔던 정답자의 코드를 더 분석해봐야겠다 🧐
import sys
def find(x):
global parent
if parent[x] == x: return x
else: return find(parent[x])
def union(x, y):
pX, pY = find(x), find(y)
if pX > pY: parent[pX] = pY
else: parent[pY] = pX
V, E = map(int, sys.stdin.readline().strip().split())
arr, parent = [], [i for i in range(V + 1)]
for _ in range(E):
v1, v2, w = map(int, sys.stdin.readline().strip().split())
arr.append([w, v1, v2])
arr.sort()
result = 0
for a in arr:
if find(a[1]) == find(a[2]): continue
union(a[1], a[2])
result += a[0]
print(result)