1. 서로소 집합

서로소 집합(Disjoint Sets): 공통 원소가 없는 두 집합

📍 예시.

  • {1, 2}와 {3, 4}는 서로소 관계이다.
  • {1, 2}와 {2,3}은 서로소 관계가 아니다.

1) 서로소 집합 자료구조

  • 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조(합치기 찾기-Union Find 자료구조라고도 부른다.)

  • 두 종류의 연산을 지원
    👉 합집합(Union) : 두 개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산
    👉 찾기(Find) : 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산

  • 동작 과정
    👉 A, B 노드가 연결되어 있다고 할때, 먼저 A,B의 루트 노드 A', B'를 각각 찾고, A'를 B'의 부모 노드로 설정한다.
    👉 모든 합집합 연산을 처리할 때까지 이 과정을 반복한다.





👉 3번 노드와 4번 노드는 같은 집합이다. 그러나, 둘의 부모 노드는 다른 것을 확인할 수 있다. 그래서, 두 원소가 같은 집합에 속해있는지 확인하기 위해서 '루트'노드를 찾을 수 있도록 해야한다.

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    # 루트 번호가 작은 쪽을 부모 노드로 설정
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기 
v, e = map(int, input().split())
parent = [0] * (n + 1) # 부모 테이블 초기화

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# Union 연산을 각각 수행
for i in range(n):
    a,b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력하기
print('각 원소가 속한 집합: ', end = '')
for i in range(1, v+1):
	print(find_parent(parent, i), end = '')
    
print()

# 부모 테이블 내용 출력하기
print('부모 테이블:', end= '')
for i in range(1, v+1):
	print(parent[i], end = ' ')

2) 서로소 집합 자료구조의 문제점

  • 합집합 연산이 편향되게 이루어지는 경우 찾기 함수가 비효율적으로 동작한다.

  • 최악의 경우에는 찾기(Find)함수가 모든 노드를 다 확인하게 되어 시간 복잡도가 O(V)가 될 수 있다.

  • 찾기(Find)함수를 최적화하기 위한 방법으로 경로 압축(Path Compression)을 이용할 수 있다. (찾기 함수를 재귀적으로 호출한 뒤에 부모 테이블 값을 바로 갱신한다.)

def find_parent(parent, x):
	#루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
	if parent[x] != x:
    	# 부모테이블의 부모 값이 자신의 루트 값이 될 수 있도록
    	parent[x] = find_parent(parent, parent[x])
    return parent[x]

0개의 댓글