BOK - 1197번 최소 스패닝 트리

SEUNGHWANLEE·2021년 10월 20일

1197번 BOK 최소 스패닝 트리

Algorithm

목록 보기

10/14

출처: https://www.acmicpc.net/problem/1197

문제

그래프가 주어졌을 때, 그 그래프의 최소 스패닝 트리를 구하는 프로그램을 작성하시오.
최소 스패닝 트리는, 주어진 그래프의 모든 정점들을 연결하는 부분 그래프 중에서 그 가중치의 합이 최소인 트리를 말한다.

입력

첫째 줄에 정점의 개수 V(1 ≤ V ≤ 10,000)와 간선의 개수 E(1 ≤ E ≤ 100,000)가 주어진다. 다음 E개의 줄에는 각 간선에 대한 정보를 나타내는 세 정수 A, B, C가 주어진다. 이는 A번 정점과 B번 정점이 가중치 C인 간선으로 연결되어 있다는 의미이다. C는 음수일 수도 있으며, 절댓값이 1,000,000을 넘지 않는다.

그래프의 정점은 1번부터 V번까지 번호가 매겨져 있고, 임의의 두 정점 사이에 경로가 있다. 최소 스패닝 트리의 가중치가 -2,147,483,648보다 크거나 같고, 2,147,483,647보다 작거나 같은 데이터만 입력으로 주어진다.

출력

첫째 줄에 최소 스패닝 트리의 가중치를 출력한다.

예제

👉 입력 - 주어진 테스트 케이스

🔥 ex2 input)

👉 출력

🔥 ex2 output)

풀이방법

최소 스패닝 트리를 구하는 문제로서 Kruskal이나 Prim으로 접근해서 풀 수 있는 문제이다.

Kruskal Algorithm

참고 - Kruskal Algorithm 포스팅

💡 구현해야할 것

find 기능: 찾으려는 노드의 최상위 부모를 찾는 작업
union 기능: 부모가 다르다면 더 작은 부모로 각 부모를 통일시켜주는 작업
edge 탐색: 정렬된 edges(간선들)을 탐색하면서 선택할 지 말지 판단하는 작업

""" Kruskal """
import sys

V, E = map(int, sys.stdin.readline().strip().split())
edges = []
for _ in range(E):
    src, dest, w = map(int, input().split())
    edges.append((w, src, dest))


def find(parent, node):
    if parent[node] == node: return node
    else: return find(parent, parent[node])


def union(parent, v1, v2):
    if v1 > v2: parent[v1] = v2
    else: parent[v2] = v1


def solution(V, E, edges):
    # sort by weights
    edges.sort(key=lambda x: x[0])
    parent = [e for e in range(V + 1)]

    answer, cnt = 0, 0
    for edge in edges:
        pv1 = find(parent, edge[1])
        pv2 = find(parent, edge[2])
        
        if pv1 != pv2:
            cnt += 1
            union(parent, pv1, pv2)
            answer += edge[0]
            if cnt == V - 1: break
    return answer

print(solution(V, E, edges))

Prim Algorithm

💡 구현해야할 것

그래프, 정점과 간선을 알 수 있는 그래프
bfs처럼 방문한 노드를 확인할 수 있는 자료구조
minheap으로 구성된 신장(스패닝) 트리

""" Prim """
from heapq import heappush, heappop

V, E = map(int, input().split())
graph = [[] for _ in range(V + 1)]
for _ in range(E):
    src, dst, w = map(int, input().split())
    graph[src].append((dst, w))
    graph[dst].append((src, w))

answer = 0
visited = [False for _ in range(V + 1)]
q = [(0, 1)]  # w, node
cnt = 0

while cnt < V:  # cnt == V - 1 -> break
    w, node = heappop(q)

    if visited[node] == False:
        visited[node] = True
        answer += w
        cnt += 1
        for nv, nw in graph[node]:
            heappush(q, (nw, nv))

Kruskal의 시간복잡도가 간선의 갯수가 e개 라고 하면 $O(elog_2e)$ 가 되어야 하고, Prim의 시간 복잡도는 그래프의 정점의 갯수가 n이면 $O(n^2)$ 가 되어야한다.

공부를 하면서 짰던 코드를 정답자의 코드를 보고 바꿔봤지만 로직에서는 거의 같은 과정을 구현한 거 같은데 시간 차이가 많이 났다 😭
위에 게시한 코드는 5028ms 가 Kruskal, 5336ms이 Prim 알고리즘을 적용한 코드인데 속도면에서 보면 아직도 이해가 되지는 않는다..

484ms 가 나왔던 정답자의 코드를 더 분석해봐야겠다 🧐

import sys

def find(x):
    global parent
    if parent[x] == x: return x
    else: return find(parent[x])

def union(x, y):
    pX, pY = find(x), find(y)
    if pX > pY: parent[pX] = pY
    else: parent[pY] = pX

V, E = map(int, sys.stdin.readline().strip().split())
arr, parent = [], [i for i in range(V + 1)]
for _ in range(E):
    v1, v2, w = map(int, sys.stdin.readline().strip().split())
    arr.append([w, v1, v2])
arr.sort()
result = 0
for a in arr:
    if find(a[1]) == find(a[2]): continue
    union(a[1], a[2])
    result += a[0]
print(result)