그래프

hyyyynjn·2021년 8월 16일
0

알고리즘 정리

목록 보기
5/12
post-thumbnail
post-custom-banner

📌다양한 그래프 알고리즘

👏훑어 보기

  • DFS/BFS, 최단 경로 알고리즘은 모두 그래프 알고리즘의 한 유형이다.
  • 이외에도 다양한 그래프 알고리즘이 존재한다. 출제비중은 낮지만 제대로 알아야 한다.
    • 크루스칼 알고리즘 : 그리디 알고리즘으로 분류
    • 위상 정렬 알고리즘 : 큐/스택 자료구조로 구현
  • 그래프
    • 노드와 노드 사이에 연결된 간선의 정보를 가지는 자료구조이다.
    • 서로 다른 개체(객체)가 연결되어 있다 라는 이야기를 들으면 -> 바로 그래프 알고리즘을 떠올려야한다.
    • 가장 자주 사용되는 자료구조 : Tree 자료구조
    그래프트리
    방향성방향 그래프 or 무방향 그래프방향 그래프(컴퓨터 공학 분야 한정)
    순환성순환 및 비순환비순환
    루트 노드 존재 여부루트노드 없음루트노드 있음
    노드간 관계성부모와 자식 관계 없음부모와 자식관계 있음
    모델의 종류네트워크 모델계층 모델
  • 그래프의 구현 방법
    1. 인접 행렬 : 2차원 배열을 사용하는 방식
    2. 인접 리스트 : 리스트를 사용하는 방식
    노드의 개수 = V, 간선의 개수 = E인접 행렬인접 리스트
    메모리 공간O(V^2)O(E)
    특정 노드에서 다른 노드로 이어진 간선의 비용(시간)O(1)O(V)
    알고리즘플로이드 워셜다익스트라 최단 경로 (우선순위 큐)
    문제최단경로 문제 + 노드의 개수가 적은 경우노드, 간선의 개수가 많은 경우

👏서로소 집합

  • 서로소 집합 : 공통원소가 없는 두 집합

📢서로소 집합 자료구조

  • 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
    • union, find 2개의 연산으로 서로소 집합 자료구조를 조작할 수 있다.
  • union(합집합) 연산 : 2개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산
  • find(찾기) 연산 : 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산
    • 서로소 집합 자료구조를 union-find 자료구조라고 한다.
  • 서로소 집합 자료구조는 트리 자료구조를 이용하여 집합을 표현한다.
    1. union 연산을 확인하여, 서로 연결된 두 노드 A,B를 확인한다.
    • A와 B의 루트 노드 A',B'를 각각 찾는다.
    • A'를 B'의 부모 노드로 설정한다.(B'가 A'를 가리키도록 한다.)
      • 보통 번호가 작은 원소가 부모 노드가 되도록 구현하는 경우가 많다.
      • 즉, A'=1, B'=3이면 B'가 A'를 가리키도록 설정한다.
    1. 모든 union 연산을 처리할 때까지 1번 과정을 반복한다.

예시

union 1,4 union 2,3 union 2,4 union 5,6

  • 4개의 union 연산이 있다.
    • 각각, 1과 4는 같은집합. 2와 3은 같은 집합. 2와 4는 같은 집합. 5와 6은 같은 집합의 의미를 가진다.
    • 4개의 union연산이 수행된 후, 전체 원소들의 부분 집합 형태를 확인해보자.
  • 먼저 노드의 개수(V) 크기의 부모 테이블을 초기화한다. 이때 모든 원소가 자기 자신을 부모로 가지도록한다.
노드번호123456
부모123456
  • union 1,4을 수행한다.
    • 1과 4를 합친다.
    • 노드 4의 부모노드를 노드 1로 설정한다.
노드번호123456
부모123156
  • union 2,3을 수행한다.
    • 2과 3를 합친다.
    • 노드 3의 부모노드를 노드 2로 설정한다.
노드번호123456
부모122156
  • union 2,4을 수행한다.
    • 2과 4를 합친다.
    • 노드 2와 노드 4의 루트 노드를 각각 찾는다.
      • 노드 2의 루트 노드 == 2
      • 노드 4의 루트 노드 == 1
        • 루트 노드 2의 부모를 1로 설정한다. (재귀적인 부분)
노드번호123456
부모112156
  • union 5,6을 수행한다.
    • 5과 6를 합친다.
    • 노드 6의 부모노드를 노드 5로 설정한다.
노드번호123456
부모112155

코드

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    #루트 노드를 찾을때까지 따라들어가며 재귀호출 (루트노드는 자기자신이 부모노드이므로)
    if parent[x] != x: #x가 루트노드가 아니라면
        parent[x] =  find_parent(parent, parent[x])
    return parent[x]

#두 원소가 속한 집합을 합치기 
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a<b: #두 노드중 큰 노드의 부모를 바꿔준다.
        parent[b] = a
    else:
        parent[a] = b
      
v,e = map(int,input().split())
parent = [0] * (v+1)

for i in range(1,v+1):
    parent[i] = i
    
for i in range(e):
    a,b = map(int,input().split())
    union_parent(parent,a,b)
    
for i in range(1,v+1):
    print(find_parent(parent,i), end=" ")
    
print()

print("부모 테이블 : ", end=" ")
for i in range(1,v+1):
    print(parent[i], end=" ")
    

Union-find 주의사항

union-find 알고리즘을 통해 나온 parent 배열에는 각 노드의 부모 노드가 담겨있지만 최종 부모노드가 아닐 수 있다.

parent = [0, 1, 3, 1, 4, 4, 5]
123456
부모노드131445

2번의 부모노드는 3이다. 3의 부모노드는 1이므로 결국 2번의 부모노드는 1이다.

따라서 만약 각 노드의 부모노드를 활용하여 그룹을 나눌 때, parent 배열을 바로 사용하면 안된다.

for j in range(1, n + 1):
    parent[j] = find(parent, parent[j])

위처럼 find 과정을 최종적으로 수행해줘야한다.

📢서로소 집합을 활용한 사이클 판별

  • 서로소 집합은 다영한 알고리즘에 사용가능하다.
    • 무방향 그래프 내에서의 사이클을 판별할 때 사용할 수 있다.
  • 두 노드가 포함되어 있는 집합을 합치는 과정을 반복하는 것만으로도 사이클을 판별할 수 있다.
    1. 각 간선을 확인하며 두 노드의 루트 노드를 확인한다.
    • 루트 노드가 서로 다르다면 두 노드에 대하여 union 연산을 수행한다.
    • 루트 노드가 서로 같다면 사이클이 발생한 것이다.
    1. 그래프에 포함되어 있는 모든 간서에 대해 1번과정을 반복한다.

코드

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    #루트 노드를 찾을때까지 따라들어가며 재귀호출 (루트노드는 자기자신이 부모노드이므로)
    if parent[x] != x: #x가 루트노드가 아니라면
        parent[x] =  find_parent(parent, parent[x])
    return parent[x]

#두 원소가 속한 집합을 합치기 
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a<b: #두 노드중 큰 노드의 부모를 바꿔준다.
        parent[b] = a
    else:
        parent[a] = b

v,e = map(int, input().split())
parent = [0] * (v+1) #부모테이블

#초기상태 - 부모를 자기자신으로 초기화
for i in range(1,v+1):
    parent[i] = i
 
cycle = False #사이블 발생여부

for i in range(e):
    a,b = map(int, input().split())
    #사이클이 발생한 경우 종료
    if find_parent(parent,a) == find_parent(parent, b):
        cycle = True
        break
    else:
        union_parent(parent, a, b)

if cycle:
    print('사이클이 발생했습니다.')
else:
    print('사이클이 발생하지 않았습니다.')

👏신장 트리

  • 신장 트리 : 하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프이다.

  • A,B,C,D,E,F 노드를 포함하면서 사이클이 존재하지 않는다.
  • 최소 신장 트리 알고리즘 : 노드를 모두 연결할 때 최소한의 비용으로 만들 수 있는 트리를 찾는 알고리즘이다.
    • 대표적인 최소 신장 트리 알고리즘 : 크루스칼 알고리즘이다.

📢크루스칼 알고리즘 -> sort 대신 heapq로

  • 그리디 알고리즘으로 분류된다.
    • 모든 간선에 대해 정렬을 수행한 뒤, 가장 거리가 짧은 간선부터 집합에 포함시킨다.
    • 포함시킨 간선이 사이클을 발생시킨다면 집합에 포함시키지 않는다.
  1. 간선 데이터를 비용에 따라 오름차순으로 정렬한다
  2. 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인한다.
  • 사이클이 발생하지 않는 경우 최소 신장 트리에 포함시킨다.
  • 사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않는다.
  1. 모든 간선에 대하여 2번의 과정을 반복한다.

코드

import heapq


def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

def union_parent(parent, a, b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b

v,e = map(int, input().split())
parent = [0] * (v+1)

#간선을 담을 리스트, 최종비용을 담을 변수
edges = []
result = 0

for i in range(1, v+1):
    parent[i] = i

for _ in range(e):
    a,b,cost = map(int, input().split())
    heapq.heappush(edges, (cost, a, b))

while edges:
    cost, a, b = heapq.heappop(edges)
    # a,b노드의 루트가 다른경우 = 서로다른 집합인경우 = 사이클이 없다
    if find_parent(parent,a) != find_parent(parent,b):
        union_parent(parent,a,b)
        result += cost

print(result)

📢프림 알고리즘

특정 시작 정점에서 출발하여 MST 집합을 확장해나가는 알고리즘

  • 정점 선택 기반 알고리즘

과정

  1. 최초 MST 집합에는 시작 정점만 포함되어 있음
  2. 이전 단계에서 만들어진 MST 집합에 인접한 정점들 중 최소 간선으로 연결된 정점을 MST 집합에 포함
    • MST 집합에 인접 정점들 중 최소 간선을 가진 정점 찾기 → 우선순위 큐 활용
      • 우선순위 큐를 heap이나 array로 구현할 경우
    • 사이클 방지하기 위해 방문 처리가 필요함
  3. MST 집합에 포함된 간선의 수가 n-1개가 될 때까지 1~2 번을 반복
import heapq
import collections
import sys
sys.setrecursionlimit(10**6)
input = sys.stdin.readline

n, m = map(int,input().split()) # 노드 수, 간선 수
graph = collections.defaultdict(list) # 빈 그래프 생성
visited = [0] * (n+1) # 노드의 방문 정보 초기화

# 무방향 그래프 생성
for i in range(m): # 간성 정보 입력 받기
    u, v, weight = map(int,input().split())
    graph[u].append([weight, u, v])
    graph[v].append([weight, v, u])


# 프림 알고리즘
def prim(graph, start_node):
    visited[start_node] = 1 # 방문 갱신
    candidate = graph[start_node] # 인접 간선 추출
    heapq.heapify(candidate) # 우선순위 큐 생성
    mst = [] # mst
    total_weight = 0 # 전체 가중치

    while candidate:
        weight, u, v = heapq.heappop(candidate) # 가중치가 가장 적은 간선 추출
        if visited[v] == 0: # 방문하지 않았다면
            visited[v] = 1 # 방문 갱신
            mst.append((u,v)) # mst 삽입
            total_weight += weight # 전체 가중치 갱신

            for edge in graph[v]: # 다음 인접 간선 탐색
                if visited[edge[2]] == 0: # 방문한 노드가 아니라면, (순환 방지)
                    heapq.heappush(candidate, edge) # 우선순위 큐에 edge 삽입

    return total_weight

print(prim(graph,1))

👏위상 정렬

  • 위상 정렬 : 방향 그래프의 모든 노드를 '방향성에 거스르지 않도록 순서대로 나열하는 것' 이다.
  1. 진입차수가 0인 노드를 큐에 넣는다
  2. 큐가 빌 때까지 다음의 과정을 반복한다.
  • 큐에서 원소를 꺼내 해당 노드에서 출발하는 간선을 그래프에서 제거한다.
  • 새롭게 진입차수가 0이 된 노드를 큐에 넣는다.

코드

from collections import deque

#노드의 개수와 간선의 개수 입력
v,e = map(int, input().split())
# 모든 노드에 대한 진입차수를 0으로 초기화 ('나'로 들어오는 간선의 개수)
indegree = [0] * (v+1)

#각 노드에 연결된 간선정보를 담기위한 연결리스트 초기화
graph = [[] for _ in range(v+1)]

# 방향 그래프의 모든 간선정보 입력받기
for _ in range(e):
    a,b = map(int, input().split())
    graph[a].append(b) # 정점 a에서 b로 이동 
    indegree[b] +=1 #진입차수 증가

# 위상정렬 함수
def topology_sort():
    result = [] # 알고리즘 수행결과를 담을 리스트
    q = deque() #큐 기능을 위한 라이브러리 사용
    # 처음 시작할때는 진입차수가 0인 모든 노드를 큐에 삽입
    for i in range(1, v+1):
        if indegree[i] == 0:
            q.append(i)
    # 큐가 빌때까지
    while q:
        # 큐에서 꺼내고
        now = q.popleft()
        result.append(now)
        
        # 꺼낸 노드로부터 연결된 노드들을 순회하며 해당 노드들의 진입차수에서 1을 빼고 0이된 노드들이 잇다면 큐에 담는다.
        for i in graph[now]:
            indegree[i] -= 1
            if indegree[i] == 0:
                q.append(i)
    
    #위상정렬의 수행결과 출력
    for i in result:
        print(i)

topology_sort()
post-custom-banner

0개의 댓글