[코딩 테스트] - 다익스트라 최단 경로 알고리즘

Jeonghwan Kim·2022년 11월 8일
0

코딩 테스트

목록 보기
11/21

다익스트라 최단 경로 알고리즘

  • 최단 경로 문제

    • 최단 경로 알고리즘은 가장 짧은 경로를 찾는 알고리즘을 의미함
    • 다양한 문제 상황: 한 지점에서 다른 한 지점까지의 최단 경로, 한 지점에서 다른 모든 지점까지의 최단 경로, 모든 지점에서 다른 모든 지점까지의 최단 경로
    • 각 지점은 그래프에서 노드로 표현, 지점 간 연결된 도로는 그래프에서 간선으로 표현
  • 다익스트라 최단 경로 알고리즘 개요

    • 특정한 노드에서 출발하여 다른 모든 노트로 가는 최단 경로를 계산함
    • 다익스트라 최단 경로 알고리즘은 음의 간선이 없을 때 정상적으로 동작함
      • 현실 세계의 도로(간선)는 음의 간선으로 표현되지 않음
    • 다익스트라 최단 경로 알고리즘은 그리디 알고리즘으로 분류
      • 매 상황에서 가장 비용이 적은 노드를 선택해 임의의 과정을 반복함
  • 다익스트라 최단 경로 알고리즘 동작 과정

    1. 출발 노드 설정
    2. 최단 거리 테이블 초기화
    3. 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드 선택
    4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블 갱신
    5. 3번과 4번 반복
    • 초기상태: 그래프를 준비하고 출발 노드 설정

    • Step 1: 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드인 1번 노드 처리

    • Step 2: 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드인 4번 노드 처리

    • Step 3: 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드인 2번 노드 처리

    • Step 4: 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드인 5번 노드 처리

    • Step 5: 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드인 3번 노드 처리

    • Step 6: 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드인 6번 노드 처리 (마지막 노드는 처리하지 않아도 됨)

  • 다익스트라 알고리즘의 특징

    • 매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택해 임의의 과정 반복
    • 단계를 거치며 한 번 처리된 노드의 최단 거리는 고정되어 더 이상 바뀌지 않음
      • 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것
    • 다익스트라 알고리즘을 수행한 뒤에 테이블에 각 노드까지의 최단 거리 정보가 저장됨
      • 완벽한 형태의 최단 경로를 구하려면 소스코드에 추가적인 기능을 더 넣어야 함
  • 코드

    • 단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 테이블의 모든 원소를 확인(순차 탐색)함

      import sys
      input = sys.stdin.readline
      INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정
      
      # 노드의 개수, 간선의 개수를 입력받기
      n, m = map(int, input().split())
      # 시작 노드 번호를 입력받기
      start = int(input())
      # 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
      graph = [[] for i in range(n + 1)]
      # 방문한 적이 있는지 체크하는 목적의 리스트를 만들기
      visited = [False] * (n + 1)
      # 최단 거리 테이블을 모두 무한으로 초기화
      distance = [INF] * (n + 1)
      
      # 모든 간선 정보를 입력받기
      for _ in range(m):
          a, b, c = map(int, input().split())
          # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
          graph[a].append((b, c))
      
      # 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
      def get_smallest_node():
          min_value = INF
          index = 0 # 가장 최단 거리가 짧은 노드(인덱스)
          for i in range(1, n + 1):
              if distance[i] < min_value and not visited[i]:
                  min_value = distance[i]
                  index = i
          return index
      
      def dijkstra(start):
          # 시작 노드에 대해서 초기화
          distance[start] = 0
          visited[start] = True
          for j in graph[start]:
              distance[j[0]] = j[1]
          # 시작 노드를 제외한 전체 n - 1개의 노드에 대해 반복
          for i in range(n - 1):
              # 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
              now = get_smallest_node()
              visited[now] = True
              # 현재 노드와 연결된 다른 노드를 확인
              for j in graph[now]:
                  cost = distance[now] + j[1]
                  # 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
                  if cost < distance[j[0]]:
                      distance[j[0]] = cost
      
      # 다익스트라 알고리즘을 수행
      dijkstra(start)
      
      # 모든 노드로 가기 위한 최단 거리를 출력
      for i in range(1, n + 1):
          # 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
          if distance[i] == INF:
              print("INFINITY")
          # 도달할 수 있는 경우 거리를 출력
          else:
              print(distance[i])
  • 다익스트라 알고리즘의 시간 복잡도

    • 총 O(V)번에 걸쳐 최단 거리가 가장 짧은 노드를 매번 선형 탐색하므로 전체 시간 복잡도는 O(V^2)
    • 일반적으로 전체 노드의 개수가 5000개 이하라면 문제를 해결할 수 있지만 그 이상이라면 다른 방법 필요
  • 우선순위 큐 (Priority Queue)

    • 우선순위가 가장 높은 데이터를 가장 먼저 삭제하는 자료구조
    • ex) 여러개의 물건 데이터를 자료구조에 넣었다가 가치가 높은 물건 데이터부터 꺼내서 확인해야 하는 경우에 우선순위 큐 이용
    • 표준 라이브러리 형태로 지원함
  • 힙(Heap)

    • 우선순위 큐(Priority Queue)를 구현하기 위해 사용하는 자료구조 중 하나
    • 최소 힙(Min Heap, 값이 낮은 데이터부터 꺼냄)과 최대 힙(Max Heap, 값이 높은 데이터부터 꺼냄)이 있음
  • 다익스트라 알고리즘의 개선된 구현 방법

    • 단계마다 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드를 선택하기 위해 힙(Heap) 자료구조 이용

    • 다익스트라 알고리즘이 동작하는 기본원리는 동일함

      • 현재 가장 가까운 노드를 저장해놓기 위해 힙 자료구조를 추가적으로 이용한다는 점이 다름
      • 현재의 최단 거리가 가장 짧은 노드를 선택해야하므로 최소 힙 사용
      import heapq
      import sys
      input = sys.stdin.readline
      INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정
      
      # 노드의 개수, 간선의 개수를 입력받기
      n, m = map(int, input().split())
      # 시작 노드 번호를 입력받기
      start = int(input())
      # 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
      graph = [[] for i in range(n + 1)]
      # 최단 거리 테이블을 모두 무한으로 초기화
      distance = [INF] * (n + 1)
      
      # 모든 간선 정보를 입력받기
      for _ in range(m):
          a, b, c = map(int, input().split())
          # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
          graph[a].append((b, c))
      
      def dijkstra(start):
          q = []
          # 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
          heapq.heappush(q, (0, start))
          distance[start] = 0
          while q: # 큐가 비어있지 않다면
              # 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
              dist, now = heapq.heappop(q)
              # 현재 노드가 이미 처리된 적이 있는 노드라면 무시
              if distance[now] < dist:
                  continue
              # 현재 노드와 연결된 다른 인접한 노드들을 확인
              for i in graph[now]:
                  cost = dist + i[1]
                  # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
                  if cost < distance[i[0]]:
                      distance[i[0]] = cost
                      heapq.heappush(q, (cost, i[0]))
      
      # 다익스트라 알고리즘을 수행
      dijkstra(start)
      
      # 모든 노드로 가기 위한 최단 거리를 출력
      for i in range(1, n + 1):
          # 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
          if distance[i] == INF:
              print("INFINITY")
          # 도달할 수 있는 경우 거리를 출력
          else:
              print(distance[i])
    • 개선된 다익스트라 알고리즘의 시간 복잡도

      • 힙 자료구조를 이용하는 다익스트라 알고리즘의 시간 복잡도는 O(ElogV)
      • 노드를 하나씩 꺼내 검사하는 반복문(while문)은 노드 개수 V 이상의 횟수로는 처리되지 않음
        • 결과적으로 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총횟수는 최대 간선의 개수(E)만큼 연산이 수행될 수 있음
      • 전체 과정은 E개의 원소를 우선순위 큐에 넣었다가 모두 빼내는 연산과 매우 유사함
        • 시간복잡도를 O(ElogE)로 판단할 수 있음
        • 중복 간선을 포함하지 않는 경우에 이를 O(ElogV)로 정리할 수 있음
          • O(ElogE) → O(ElogV^2) → O(2ElogV) → O(ElogV)

참고: 이것이 취업을 위한 코딩 테스트다 with 파이썬 (취업과 이직을 결정하는 알고리즘 인터뷰 완벽 가이드), 유튜브 강의 영상

0개의 댓글