신장트리
하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프
(트리의 성립 조건이기도 함)
크루스칼 알고리즘
신장 트리 중, 최소 비용으로 만들 수 있는 신장트리를 찾는 알고리즘의 대표적인 알고리즘 (그리디 알고리즘)
가장 적은 비용으로 모든 노드를 연결할 수 있기 때문에 그리디 알고리즘으로 분류
먼저 모든 간선에 대해 정렬을 수행(가장 거리가 짧은 간선부터 집합에 포함시키면 됨)
사이클 발생시킬 수 있는 간선의 경우, 집합에 포함시키지 않음
1. 간선 데이터를 비용에 따라 오름차순 정렬
2. 간선을 하나씩 확인하며, 현재의 간선이 사이클을 발생시키는지 확인
- 사이클 발생 X -> 최소 신장 트리에 포함 O
(같은 집합에 속해있지 않으면, union함수를 이용해 동일한 집합에 속하게 함)
- 사이클 발생 O -> 최소 신장 트리에 포함 X
(이미 같은 집합에 속해있을 경우,union 함수 호출 X)
3. 모든 간선에 대해 2 반복최소 신장 트리는 일종의 트리 자료구조 이므로
간선의 개수 = 노드의 개수 - 1
ex) 노드의 수가 8개이면, 간선의 수는 7이다.
# 특정 원소가 속한 집합 찾기
def find_parent(parent, x):
if parent[x] != x: # 자기 자신이 아닌 경우, 루트 노드 존재
parent[x] = find_parent(parent, parent[x]) # 루트노드
return parent[x]
# 집합 합치기
def union_parent(parent, a, b):
a = find_parent(parent, a)
b = find_parent(parent, b)
if a < b:
parent[b] = a
else:
parent[a] = b
# 노드의 개수와 간선(union 연산진행) 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화
# 모든 간선을 담을 리스트와 최종 비용 담을 변수
edges = []
result = 0
# 부모를 자기 자신을 초기화
for i in range(1, v + 1):
parent[i] = i
# 모든 간선에 대한 입력 받기
for _ in range(e):
a, b, cost = map(int, input().split())
edges.append((cost, a, b))
# 간선을 비용순으로 정렬(cost)
edges.sort()
# 간선 하나씩 확인
for edge in edges:
cost, a, b = edge # 비용, 출발, 도착노드
# 사이클 발생하지 않은 경우에만, 집합에 추가
if find_parent(parent, a) != find_parent(parent, b):
union_parent(parent, a, b)
result += cost
print(result)
시간복잡도 : O(ElogE) - 간선을 정렬하는 작업이 가장 오래 걸림