먼저 그래프에 대해 알아보자.
두 노드가 엣지로 연결되어 있을 때 (ex) 위 그림에서 A-B 가 연결되어있음
'두 노드가 인접한다(Adjacent)'라고 표현한다.
프로그래밍에서는 그래프를 표현하는 2가지 방식이 있다.
1. 인접 행렬 (Adjacency Matrix) : 2차원 배열로 그래프의 연결 관계를 표현
2. 인접 리스트 (Adjacency List) : 리스트로 그래프의 연결 관계를 표현
0 | 1 | 2 | |
---|---|---|---|
0 | 0 | 5 | 7 |
1 | 5 | 0 | 무한 |
2 | 7 | 무한 | 0 |
위 그림의 그래프를 인접 행렬로 표현하면 위 표와 같다. Python에서는 2차원 리스트로 구현한다. 연결 되어 있지 않는 노드끼리는 무한(Infinity)의 비용이라고 작성한다.
실제 코드에서는 논리적으로 정답이 될 수 없는 큰 값 중에서 999999999, 987654321 등의 값으로 초기화하는 경우가 많다. 이렇게 그래프를 인접 행렬 방식으로 처리할 때는 위와 같이 데이터를 초기화한다!
# 2차원 리스트로 인접 행렬 표현
graph = [
[0, 5, 7],
[5, 0, INF],
[7, INF, 0]
]
print(graph)
>>> [[0, 5, 7], [5, 0, 999999999], [7, 999999999, 0]]
인접 리스트 방식에서는 위 그림처럼 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.
인접 리스트는 '연결 리스트(Linked List)'라는 자료구조를 이용해 구현하는데, C++ or Java와 같은 언어에서는 별도로 연결 리스트 기능을 위한 표준 라이브러리를 제공한다.
Python에서는 기본 자료형인 리스트 자료형이 append()
메소드를 제공한다. 이는 전통적인 프로그래밍 언어에서의 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.
※ Python으로 인접 리스트로 그래프를 표현할 때 단순히 2차원 리스트를 사용하면 된다!
# 행(Row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]
# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1, 5))
graph[0].append((2, 7))
# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0, 5))
# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0, 7))
print(graph)
>>> [[(1, 5), (2, 7)],
[(0, 5)],
[(0, 7)]]
인접 행렬
- 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비된다. (메모리 측면)
인접 리스트
- 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.
특정한 노드와 연결된 모든 인접 노드를 순회하는 경우에 인접 행렬 방식에 비해 메모리 공간의 낭비가 훨씬 적다.
- 하지만 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다. 연결된 데이터를 하나씩 확인해야 하기 때문이다. (연결된 정보를 많이 저장할 경우 전부 다 확인해야함.)
그래프와 그래프 탐색의 개념을 알았으니 DFS를 알아보도록 하자!
DFS란? 깊이 우선 탐색 알고리즘이다.
특정한 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.
DFS는 스택
자료구조를 이용한다.
(보통 재귀 함수를 이용해 DFS를 구현한다. 컴퓨터 구조 측면에서 보자면 연속해서 호출되는 함수는 메인 메모리의 스택 공간에 적재되므로 재귀 함수는 스택 자료구조와 같다는 말은 틀린 말이 아니다. 일단 재귀 함수는 내부적으로 스택 자료구조와 동일하다는 것만 기억하자.)
DFS의 구체적인 동작 과정을 알아보자.
① 탐색 시작 노드를 스택에 삽입 후 방문 처리를 한다.
② 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다.
방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
③ ②의 과정을 더 이상 수행할 수 없을 때까지 반복한다.
위 그림을 통해 DFS를 이해해보자. 그림을 보면 탐색할 때 최대한 깊이 탐색한 후 다시 되돌아온다. 그 다음에 탐색할 때에도 똑같이 최대한 깊이 탐색한다.
실제로 스택을 쓰지 않아도 된다. 탐색을 수행함에 있어 데이터의 개수가 N개인 경우 O(N)
의 시간이 소요된다는 특징이 있다.
# DFS 메서드 정의 (재귀 함수 이용)
def dfs(graph, v, visited):
# 현재 노드를 방문 처리
visited[v] = True
print(v, end=' ')
# 현재 노드와 연결된 다른 노드를 재귀적으로 방문
for i in graph[v]:
if not visited[i]:
dfs(graph, i, visited)
BFS란? 너비 우선 탐색 알고리즘이다.
쉽게 말하자면, 가까운 노드부터 탐색하는 알고리즘이다.
(<-> DFS는 제일 깊이 탐색 반면 BFS는 넓게 탐색)
BFS는 선입선출(FIFO) 방식인큐
자료구조를 이용하여 구현하는 것이 정석이다.
인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성 -> 자연스럽게 먼저 들어온 것이 먼저 나가게 되므로 가까운 노드부터 탐색하게 된다.
BFS의 구체적인 동작 과정을 알아보자.
① 탐색 시작 노드를 큐에 삽입 후 방문 처리를 한다.
② 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.
③ ②의 과정을 더 이상 수행할 수 없을 때까지 반복한다.
위 그림을 보면 시작 노드에서 부터 가장 가까운 노드부터 탐색하게 된다.
Python에서 deque 라이브러리를 사용하여 큐를 이용하여 BFS를 구현하는 것이 좋다. 탐색을 수행함에 있어 O(N)
의 시간이 소요된다. 일반적인 경우 실제 수행 시간은 DFS보다 좋은 편이라고 한다.
from collections import deque
# BFS 메서드 정의
def bsf(graph, start, visited):
# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque([start])
# 현재 노드를 방문 처리
visited[start] = True
# 큐가 빌 때까지 반복
while queue:
# 큐에서 하나의 원소를 뽑아 출력
v = queue.popleft()
print(v, end=' ')
# 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
for i in graph[v]:
if not visited[i]:
queue.append(i)
visited[i] = True
DFS | BFS | |
---|---|---|
동작 원리 | 스택 | 큐 |
구현 방법 | 재귀 함수 이용 | 큐(deque 라이브러리) 이용 |
P.S 2차원 배열에서의 탐색 문제를 풀게되면 그래프 형태로 바꿔서 생각하면 풀이 방법을 조금 더 쉽게 떠올릴 수 있다. 따라서 그래프 탐색 문제를 보면 그래프 형태로 표현한 다음에 풀이법을 고민하는 연습을 하면 좋을 것이다!!
참고 : https://velog.io/@gimtommang11/%EC%9E%90%EB%A3%8C%EA%B5%AC%EC%A1%B0%EA%B7%B8%EB%9E%98%ED%94%84
https://csacademy.com/app/graph_editor/
https://github.com/ndb796/python-for-coding-test