출처: [이것이 취업을 위한 코딩테스트다 - 나동빈 저](https://ridibooks.com/books/443000825
배너: godori님이 만드신 배너 메이커 활용
그래프 참고: Sue_ 님의 velog 자료
그래프 그림 작성: 그래프 에디터
DFS는 Depth-First Search, 깊이 우선 탐색이라고 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.
그래프는 노드(Node)와 엣지(Edge; 간선)로 이루어져 있다. 그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다.
두 노드가 엣지로 연결되어 있을 때 '두 노드가 인접하다(Adjacent)'라고 표현한다.
참고로, 노드는 버텍스(vertex; 정점), 엣지는 아크(arc)로 불리기도 한다.
프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있다
1. 인접 행렬(Adjacency Matrix): 2차원 배열로 그래프의 연결 관계를 표현하는 방식
2. 인접 리스트(Adjacency List): 리스트로 그래프의 연결 관계를 표현하는 방식
2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다.
0 | 1 | 2 | |
---|---|---|---|
0 | 0 | 7 | 5 |
1 | 7 | 0 | 무한 |
2 | 5 | 무한 | 0 |
위와 같이 연결된 그래프를 인접 행렬로 표현할 때 파이썬에서는 2차원 리스트로 구현할 수 있다.
연결이 되어 있지 않은 노드끼리는 무한(Infitnity)의 비용이라고 작성한다.
실제 코드에서는 논리적으로 정답이 될 수 없는 큰 값 중에서 999999999, 987654321 등의 값으로 초기화하는 경우가 많다.
이렇게 그래프를 인접 행렬 방식으로 처리할 때는 다음과 같이 데이터를 초기화한다.
INF = 999999999
# 2차원 리스트를 이용해 인접 행렬 표현
graph = [
[0, 7, 5],
[7, 0, INF],
[5, INF, 0]
]
print(graph)
[[0, 7, 5],
[7, 0, 999999999],
[5, 999999999, 0]]
인접 리스트 방식에서는 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.
인접 리스트는 '연결 리스트(Linked List)' 라는 자료구조를 이용해 구현한다.
C++나 자바 같은 언어에서는 별도로 연결 리스트 기능을 위한 표준 라이브러리를 제공한다.
파이썬은 기본 자료형인 리스트 자료형이 append()
메소드를 제공하므로, 전통적인 프로그래밍 언어에서의 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.
파이썬으로 인접 리스트를 이용해 그래프를 표현하고자 할 때도 단순히 2차원 리스트를 이용하면 된다.
# 행(Row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]
# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1, 7))
graph[0].append((2, 5))
# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0, 7))
# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0, 5))
print(graph)
[[(1, 7), (2, 5)],
[(0, 7)],
[(0, 5)]]
인접 행렬 방식
인접 리스트 방식
자 이제 DFS로 돌아오자. DFS는 깊이 우선 탐색 알고리즘이다.
이 알고리즘은 특정한 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.
DFS는 스택 자료구조를 이용하며, 구체적인 동작 과정은 다음과 같다.
'방문 처리'는 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것을 의미한다. 방문 처리를 함으로써 각 노드를 한 번씩만 처리할 수 있다.
일반적으로 인접한 노드 중에서 방문하지 않은 노드가 여러 개 있으면 노드 번호가 낮은 순서부터 처리한다.(관행적인 것, 요구하지 않으면 필수는 x)
위 그래프에서 노드의 탐색 순서(스택에 들어간 순서)는 다음과 같다.
1 -> 2 -> 7 -> 6 -> 8 -> 3 -> 4 -> 5
DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다.
실제로는 스택을 쓰지 않아도 되며 탐색을 수행함에 있어서 O(N)의 시간이 소요된다는 특징이 있다.
또한 DFS는 스택을 이용하는 알고리즘이기 때문에 실제 구현은 재귀 함수를 이용했을 때 매우 간결하게 구현할 수 있다. (컴퓨터 내부에서 재귀 함수의 수행이 스택 자료구조를 이용함)
# DSF 메서드 정의
def dfs(graph, v, visited):
# 현재 노드를 방문 처리
visited[v] = True
print(v, end=' ')
# 현재 노드와 연결된 다른 노드를 재귀적으로 방문
for i in graph[v]:
if not visited[i]:
dfs(graph, i, visited)
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7]
]
# 각 노드가 방문된 정보를 리스트 자료형으로 표현
visited = [False] * 9
# 정의된 DFS 함수 호출
dfs(graph, 1, visited)
1 2 7 6 8 3 4 5
BFS(Breadth First Search) 알고리즘은 너비 우선 탐색으로,
쉽게 말해 가까운 노드부터 탐색하는 알고리즘이다.
BFS 구현에서는 선입선출(FIFO) 방식은 큐 자료구조를 이용하는 것이 정석이다.
인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다.
동작 과정은 다음과 같다.
위 그래프에서 노드의 탐색 순서(큐에 들어간 순서)는 다음과 같다.
1 -> 2 -> 3 -> 8 -> 7 -> 4 -> 5 -> 6
BFS는 큐 자료구조에 기초한다는 점에서 구현이 간단하다.
구현할 때 collections 모듈에서 제공하는 deque 자료구조를 사용하는 것이 좋으며, 탐색에 O(N)의 시간이 소요된다.
일반적인 경우 실제 수행 시간은 DFS보다 좋은 편이라고 한다.
from collections import deque
# BFS 메서드 정의
def bsf(graph, start, visited):
# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque([start])
# 현재 노드를 방문 처리
visited[start] = True
# 큐가 빌 때까지 반복
while queue:
# 큐에서 하나의 원소를 뽑아 출력
v = queue.popleft()
print(v, end=' ')
# 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
for i in graph[v]:
if not visited[i]:
queue.append(i)
visited[i] = True
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7]
]
# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9
# 정의된 BFS 함수 호출
bsf(graph, 1, visited)
1 2 3 8 7 4 5 6
DFS | BFS | |
---|---|---|
동작 원리 | 스택 | 큐 |
구현 방법 | 재귀 함수 이용 | 큐 자료구조 이용 |
참고로, 코딩 테스트 중 2차원 배열에서 탐색 문제를 만나면 그래프 형태로 바꿔서 생각하면 풀이 방법을 조금 더 쉽게 떠올릴 수 있다.
코딩 테스트에서 탐색 문제를 보면 그래프 형태로 표현한 다음 풀이법을 고민하도록 하자.