[알고리즘] 그래프에서의 최단경로

Woonil·2025년 2월 14일
0

알고리즘

목록 보기
30/38

최단경로(Shortest Path)는 가중치 그래프에서 정점u와 정점v를 연결하는 경로 중 가중치의 합이 최소인 경로로 ‘가장 짧은 경로’를 말한다.

문제 출제 경향

최단경로를 모두 출력하는 문제보다는 단순히 최단 거리를 출력하도록 요구하는 문제가 주로 출제

개념

Bellman_Ford

벨만포드(Bellman_Ford) 알고리즘은 음의 가중치를 허용하는 최단경로 탐색 알고리즘이다.

코딩 테스트를 위한 벨만 포드 알고리즘 7분 핵심 요약

과정

  1. 출발 노드 설정한다.

  2. 최단 거리 테이블 초기화한다.

  3. 다음의 과정 N-1번 반복한다.

    1. 전체 간선 E개를 하나씩 확인한다.
    2. 각 간선을 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
  4. 만약 음수 간선 순환이 발생하는지 체크하고 싶다면 3번 과정을 한 번 더 수행한다.

    이때, 최단 거리 테이블이 갱신된다면 음수 간선 순환이 존재한다고 판단한다.

cf ) 시작점 s에서 다른 각 정점에 이르는 최단거리를 모두 구하기에 동적계획법(Dynamic Programming)을 사용하였다고 볼 수 있음

구현

  • Psuedo code
    BellmanFord(G, r) {
    	// 최단 거리 테이블 초기화
    	for each u ∈ V
    		du <- ∞ 
    	d[r] <- 0;
      // n-1만큼 반복 (간선의 개수)
    	for i <- 1 to |V|-1
    		for each (u,v) ∈ E
    			if (d[u] + w[u,v] < d[v]_v) then {
    				d[v] <- d[u] + w[u,v];
    				prev[v] <- u;
    			}
    	// 음의 간선 순환 존재 여부 확인 (모든 정점에 대해 확인)
    	for each (u,v) ∈ E
    		if (d[u] + w[u,v] < d[v]_v) output "해없음";
    }
    시간복잡도 ⇒ Θ(|E||V|) (두번째 반복문에 의함) cf) 음의 간선 순환 확인에서 모든 정점을 포함하는 이유: 모든 간선을 거치는 순환도 포함

Floyd_Warshall

플로이드_와샬(Floyd_Warshall) 알고리즘은 그래프의 서로 다른 모든 정점의 쌍 u와 v간의 최단경로를 구하는 알고리즘이다.

  • 특징
    • 점화식
      Dab=min(Dab,Dak+Dkb)Dab = min(Dab, Dak + Dkb)
      Dab : a에서 b로 가는 데에 필요한 최소 비용 노드의 개수가 N개일 때 알고리즘 상으로 N번의 단계를 수행하며, 단계마다 O(N^2)의 연산을 통해 ‘현재 노드를 거쳐 가는’ 모든 경로를 고려 ⇒ 시간 복잡도 : O(N^3)
    • 방향/무방향 그래프 모두에서 동작한다.
    • 간선의 값이 음수여도 잘 동작한다. (음수인 사이클이 존재하는 경우에서는 문제가 생긴다.)

[바킹독의 실전 알고리즘] 0x1C강 - 플로이드 알고리즘

구현

  • python 구현
    1. 입력값 받기 및 2차원 리스트 생성 및 초기화

      INF = int(10e9)
      # 노드의 개수 및 간선의 개수 입력
      n = int(input())
      m = int(input())
      # 2차원 리스트 생성 및 모든 값 무한으로 초기화
      graph = [[INF] * (n+1) for _ in range(n+1)]
    2. Self-loop는 0으로 초기화

      # 자기 자신에서 자기 자신으로 가는 비용 0으로 초기화
      for a in range(1, n+1):
        for b in range(1, n+1):
          if a == b:
            graph[a][b] = 0
      # 축약하여 나타낼 수도 있음
      # for i in range(1, n + 1):
      #		graph[i][i] = 0
    3. 각 간선 정보에 대한 입력 받기

      # 각 간선에 대한 정보를 입력받아, 그 값으로 초기화
      for _ in range(m):
        # A에서 B로 가는 비용은 C라고 설정
        a, b, c = map(int, input().split())
        graph[a][b] = c
        # **방향그래프인지 무방향그래프인지 고려**
      	# 무방향 그래프인경우: graph[b][a] = c 도 추가
    4. 점화식에 따른 알고리즘 수행

      # 점화식에 따라 플로이드 워셜 
      알고리즘 수행
      for k in range(1, n+1): # k: 거쳐가는 정점 (1~n번 정점)
        for a in range(1, n+1):
          for b in range(1, n+1):
      			graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])

Dijkstra

다익스트라(Dijkstra) 알고리즘은 음의 가중치를 허용하지 않는 최단경로 탐색 알고리즘이다. 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구할 수 있다.

25강 - 다익스트라 알고리즘(Dijkstra Algorithm) [ 실전 알고리즘 강좌(Algorithm Programming Tutorial) #25 ]

[바킹독의 실전 알고리즘] 0x1D강 - 다익스트라 알고리즘

  • 특징
    • ‘음의 간선’이 있는 경우, 현재 갈 수 있는 정점 중에서 가장 가까운 정점까지의 거리를 확정할 수가 없다. 따라서 ‘음의 간선’이 없을 때 정상적으로 동작한다. (음의 간선: 0보다 작은 값을 가지는 간선) ↔ 벨만포드

      현실 세계의 길(간선)은 음의 간선으로 표현되지 않으므로, 실제 GPS 소프트웨어의 기본 알고리즘으로 채택되곤 한다.

    • 매번 ‘가장 작은 비용이 적은 노드’를 선택해서 임의의 과정을 반복하기 때문에 ‘그리디 알고리즘’으로 분류된다.
    • 각 노드에 대한 현재까지의 최단거리 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신
    • 최단 거리가 완전히 선택된 노드(최단거리 테이블에서 가장 최단거리가 짧은 것이라고 판단된 노드)는 더 이상 알고리즘을 반복해도 최단 거리가 줄어들지 않는다. ⇒ 한 단계당 하나의 노드에 대한 최단 거리를 확보
  • 과정
    1. 출발 노드 설정
    2. 최단 거리 테이블 초기화
    3. 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드 선택
    4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신 (그리디)
    5. 과정 3과 과정 4를 반복
  • Pseudo code
    Dijkstra(G, r) { // G(V,E): 주어진 그래프, r: 시작으로 삼을 정점
    	S <- Ø; // S: 정점 집합
    	for each u ∈ V
    		d[u] <-; // 최단거리 테이블 무한으로 초기화
    	d[r] <- 0; // 시작 정점의 최단거리테이블 값 초기화
    	while (S ≠ V) { // n회 순환
    		u <- extractMin(V-S, d);
    		S <- S ∪ {u};
    		for each v ∈ L(u) // L(u): u에 인접한 정점의 리스트
    			if (v ∈ V-S and d[u] + w[u,v] < d[v]) then {
    				d[v] <- d[u] + w[u,v]; // 최단거리 테이블 갱신
    				prev[v] <- u; // 힙에 추가
    	}
    }
    
    extractMin(Q, d[]) {
    	집합 Q에서 d값이 가장 작은 정점 u 리턴
    }

구현(간단한 방법)

최단거리 테이블에서 최소값을 가져올 때 순차탐색을 사용한다.

⇒ 시간복잡도 : O(V^2)

  • python 구현
    1. 입력값 받기 (시작 노드 번호 포함)

      import sys
      input = sys.stdin.readline
      INF = int(1e9)
      
      # 노드의 개수, 간선의 개수 입력
      n, m = map(int, input().split())
      # 시작 노드 번호 입력
      	start = int(input())
    2. 리스트 생성 (간선정보, 최단거리, 방문여부)

      # 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 생성
      graph = [[] for i in range(n + 1)]
      
      # 최단거리 테이블을 모두 무한으로 초기화
      distance = [INF] * (n + 1)
      
      # method1에서만 필요 - 방문한 적이 있는지 체크하는 목적의 리스트 생성
      visited = [False] * (n + 1)
    3. 간선 정보 입력

      # 모든 간선 정보 입력
      for _ in range(m):
        a, b, c = map(int, input().split())
        # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
        graph[a].append((b,c))
        # graph[b].append((a,c)) 양방향 그래프인 경우 추가
    4. 탐색노드를 갱신하는 함수 정의 (method1에서만 필요)

      # 방문하지 않은 노드 중 가장 최단 거리가 짧은 노드의 번호를 반환
      def get_smallest_node():
        min_value = INF
        index = 0 # 가장 최단 거리가 짧은 노드(인덱스)
        for i in range(1, n+1):
          if distance[i] < min_value and not visited[i]:
            min_value = distance[i]
            index = i
        return index
    5. 알고리즘 수행

      def dijkstra(start):
        # 시작 노드에 대한 초기화
        distance[start] = 0
        visited[start] = True
        for j in graph[start]:
          distance[j[0]] = j[1]
        # 시작 노드를 제외한 전체 n-1개의 노드에 대해 반복
        for i in range(n-1):
          # 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
          now = get_smallest_node()
          visited[now] = True
          # 현재 노드와 연결된 다른 노드 확인
          for j in graph[now]:
            cost = distance[now] + j[1]
            if cost < distance[j[0]]:
              distance[j[0]] = cost
      
      # 다익스트라 알고리즘 수행
      dijkstra(start)

구현(개선된 방법)

  • 간단한 방법의 문제점 최단거리가 가장 짧은 노드를 찾기 위해서, 매번 최단 거리 테이블을 선형적으로 탐색하므로, 정점의 갯수가 많은데 간선은 적을 때 치명적이게 비효율적으로 동작할 수 있다. ⇒ get_smallest_node() 의 로직에 최소힙(우선순위 큐를 구현하기 위하여 사용하는 자료구조인)을 사용하여 시간복잡도를 줄인다.
  • 큐에서 원소를 꺼낼 때 방문 여부를 판단하므로, 방문 여부 리스트(visited)를 생성할 필요가 없다. ⇒ 시간복잡도 : O(ElogE) == O(ElogV)
import heapq

def dijkstra(start):
  q = []
  # 시작노드로 가기 위한 최단 경로는 0으로 설정, 큐에 삽입 
	**# (튜플의 첫 번째 원소를 기준으로 힙 정렬하기에 삽입 순서 주의)**
	heapq.heappush(q, (0, start))
  distance[start] = 0

  while q: # 큐가 비어있지 않다면
    # 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
    dist, now = heapq.heappop(q)

    **# 현재 노드가 이미 처리된 적이 있는(최단거리가 확정된) 노드라면 무시 (방문 여부 판단)**
    if distance[now] < dist:
      continue

    # 현재 노드와 연결된 다른 인접한 노드들을 확인
    for i in graph[now]:
      cost = dist + i[1]
      # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우 최단거리 테이블 갱신
      if cost < distance[i[0]]:
        distance[i[0]] = cost
        heapq.heappush(q, (cost, i[0]))

Dijkstra VS Bellman_Ford

  • Dijkstra
    • 매번 방문하지 않은 노드 중에서 최단거리가 가장 짧은 노드를 선택
    • 음수 간선이 없다면 최적의 해를 찾을 수 있다.
  • Bellman_Ford
    • 매번 모든 간선을 전부 확인 (다익스트라의 최적의 해를 항상 포함)

    • 음수 간선 순환을 탐지할 수 있다.

      cf) 음수 간선에 관한 최단 경로 문제는 음수 간선 순환이 있는 경우와 없는 경우로 다시 나눌 수 있다.

시간복잡도 : Dijkstra < Bellman_Ford

Dijkstra VS Floyd-Warshall

  • Dijkstra
    • 간선정보를 인접리스트에 저장한다.
    • 한 지점에서 다른 특정 지점까지의 최단 경로를 구해야 하는 경우 사용
    • 다른 모든 노드까지의 최단 거리를 저장하기 위해서 1차원 리스트(최단거리 테이블)를 사용한다. (출발노드가 1개)
    • 방문하지 않은 노드 중에서 현재 최단 거리가 가장 짧은 노드를 확인(정렬 알고리즘 사용)해 그 노드에 대하여 최단거리 테이블을 갱신한다. ⇒ 그리디 알고리즘
    • 노드의 개수와 간선의 개수 모두 많은 경우에 유리하다.
  • Floyd-Warshall
    • 간선정보를 인접행렬에 저장한다.
    • 모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우 사용
    • 다른 모든 노드까지의 최단 거리를 저장하기 위해서 2차원 리스트를 사용한다. (출발노드가 N개)
    • 점화식에 맞게 2차원 리스트를 갱신 ⇒ 다이나믹 프로그래밍
    • 노드의 개수가 적은 경우에 유리하다.

참고 자료
이것이 취업을 위한 코딩테스트다. -나동빈

profile
프론트 개발과 클라우드 환경에 관심이 많습니다:)

0개의 댓글

관련 채용 정보