[이것이코딩테스트다] CHAPTER05 DFS/BFS(1)

HO94·2021년 6월 16일

이것이코딩데스트다

목록 보기

4/14

2021.06.16 정리

<1> 꼭 필요한 자료구조 기초

탐색Search 이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정
대표적인 탐색 알고리즘으로 DFS와 BFS
DFS와 BFS를 제대로 이해하려면 기본 자료구조인 스택과 큐에 대한 이해가 전제되어야 함

자료 구조Data Structure 란 데이터를 표현하고 관리하고 처리하기 위한 구조
스택과 큐는 자료구조의 기초 개념으로 다음의 두 핵심 함수로 구성

삽입(Push) : 데이터를 삽입
삭제(Pop) : 데이터를 삭제

스택과 큐를 사용할 때에는 삽입과 삭제 외에도 오버플로와 언더플로를 고민해야 함

오버플로(Overflow) : 특정한 자료구조가 수용할 수 있는 데이터의 크기를 이미 가득 찬 상태에서 삽입 연산을 수행할 때 발생, 저장 공간을 벗어나 데이터가 넘쳐 흐를 때
언더플로(Underflow) : 특정한 자료구조에 데이터가 전혀 들어 있지 않은 상태에서 삭제 연산을 수행하면 발생

스택

스택stack 은 박스 쌓기에 비유할 수 있음
아래에서부터 위로 차례로 쌓고, 아래에 있는 박스를 치우기 위해선 위에 있는 박스를 먼저 치워야함
선입후출First in Last out 또는 후입선출Last in First out

큐

큐Queue 는 대기줄에 비유할 수 있음(나중에 온 사람일수록 나중에 들어가기 때문에 '공정한' 자료구조)
선입선출First in First out

파이썬으로 큐를 구현할 때에는 collections 모듈에서 제공하는 deque 자료구조를 활용
deque는 스택과 큐의 장점을 모두 채택, 데이터를 넣고 빼는 속도가 리스트 자료형에 비해 효율적이며, queue 라이브러리보다 간단함

재귀함수

DFS와 BFS를 구현하려면 재귀 함수도 이해하고 있어야 함
재귀 함수Recursive Function 란 자기 자신을 다시 호출하는 함수

재귀함수의 종료 조건

재귀 함수를 문제 풀이에서 사용할 때에는 재귀 함수가 언제 끝날지, 종료 조건을 꼭 명시해야 함
컴퓨터 내부에서 재귀 함수의 수행은 스택 자료구조를 이용
스택 자료구조를 활용해야 하는 상당수 알고리즘은 재귀 함수를 이용해서 간단하게 구현될 수 있음(ex.DFS)
재귀 함수를 이용하는 대표적 예제로 팩토리얼Factorial 문제가 있음

팩토리얼 예제

# 반복적으로 구현한 n!
def factorial_iterative(n):
  result = 1
  # 1부터 n까지의 수를 차례대로 곱하기
  for i in range(1, n+1):
    result *= i
  return result

factorial_iterative(5)

# 재귀적으로 구현한 n!
def factorial_recursive(n):
  if n <= 1: # n이 1이하인 경우 1을 반환
    return 1
  # n! = n * (n-1)!를 그대로 코드로 작성하기
  return n * factorial_recursive(n - 1)

factorial_recursive(5)

반복문 대신에 재귀 함수를 사용했을 때 얻는 장점은 코드가 더 간결하다는 점
재귀 함수가 수학의 점화식(재귀식)을 그대로 소스코드에 옮겼기 때문
팩토리얼을 수학적 점화식으로 표현해보면 다음과 같다

n이 0 혹은 1일 때 : $factorial(n) = 1$
n이 1보다 클 때 : $fatorial(n) = n * factorial(n-1)$

<2> 탐색 알고리즘 DFS/BFS

DFS

DFSDepth-First-Search
깊이 우선 탐색, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘

그래프는 노드Node와 간선Edge으로 표현되며 이때 노드를 정점Vertex이라고도 함
그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것
두 노드가 간선으로 연결되어 있다면 '두 노드는 인접하다Adjacent'라고 표현

프로그래밍에서 그래프를 표현하는 2가지 방식

인접 행렬(Adjacency Matrix) : 2차원 배열로 그래프의 연결 관계를 표현
인접 리스트(Adjacency List) : 리스트로 그래프의 연결 관계를 표현

인접 행렬Adjacency Matrix 방식은 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식

# 인접 행렬 방식 예제
INF = 999999999 # 무한의 비용 설정(연결되어 있지 않는 노드끼리)

# 2차원 리스트를 이용해 인접 행렬 표현
graph = [
         [0, 7, 5],
         [7, 0, INF],
         [5, INF, 0]
]

print(graph)

인접 리스트Adjacency List 방식는 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장

# 인접 리스트 방식 예제
# 행(row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1, 7))
graph[0].append((2, 5))

# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0, 7))

# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0, 5))

print(graph)

인접 행렬 방식은 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비
인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용
때문에 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느림

DFS는 스택 자료구조를 이용하며 구체적인 동작 과정은 다음과 같다

1. 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없다면 스택에서 최상단 노드를 꺼낸다.
3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다.
실제로는 스택을 쓰지 않아도 되며 탐색을 수행함에 있어서 데이터의 개수가 N개인 경우 $O(N)$ 의 시간이 소요된다는 특징이 있다.

# DFS 예제
# DFS 메서드 정의
def dfs(graph, v, visited):
  # 현재 노드를 방문처리
  visited[v] = True
  print(v, end=' ')
  # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
  for i in graph[v]:
    if not visited[i]:
      dfs(graph, i, visited)

# 각 노드가 연결된 정보를 리스트 자료형으로 표현
graph = [
         [],
         [2, 3, 8],
         [1, 7],
         [1, 4, 5],
         [3, 5],
         [3, 4],
         [7],
         [2, 6, 8],
         [1, 7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현
visited = [False] * 9

# 정의된 DFS 함수 호출
dfs(graph, 1, visited)

BFS

BFSBreadth First Search
너비 우선 탐색이라는 의미를 가짐
가까운 노드부터 탐색하는 알고리즘

BFS 구현에서는 선입선출 방식인 큐 자료구조를 이용하는 것이 정석
인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행

BFS 동작 과정

1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
2. 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.
3. 2번의 과정을 더 이상 반복할 수 없을 때까지 반복한다.

BFS는 큐 자료구조에 기초한다는 점에서 구현이 간단하다.
deque 라이브러리를 사용하는 것이 좋으며 탐색을 수행함에 있어 $O(N)$ 의 시간이 소요된다.
일반적인 경우 실제 수행은 DFS보다 좋은 편

# BFS 예제
from collections import deque

# BFS 메서드 정의
def bfs(graph, start, visited):
  # 큐(Queue) 구현을 위해 deque 라이브러리 사용
  queue = deque([start])
  # 현재 노드를 방문 처리
  visited[start] = True
  # 큐가 빌 때까지 반복
  while queue:
    # 큐에서 하나의 원소를 뽑아 출력
    v = queue.popleft()
    print(v, end=" ")
    # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
    for i in graph[v]:
      if not visited[i]:
        queue.append(i)
        visited[i] = True

# 각 노드가 연결된 정보를 리스트 자료형으로 표현
graph = [
         [],
         [2, 3, 8],
         [1, 7],
         [1, 4, 5],
         [3, 5],
         [3, 4],
         [7],
         [2, 6, 8],
         [1, 7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현
visited = [False] * 9

# 정의된 BFS 함수 호출
bfs(graph, 1, visited)

DFS와 BFS의 구현 정리

	DFS	BFS
동작원리	스택	큐
구현방법	재귀 함수 이용	큐 자료구조 이용

이론적인부분이라 양도 많고 시간도 오래 걸렸다.
내일 문제 풀 때 기억 못 할 것 같으니 복습 한 번 하고 풀어야겠다

HO94

이전 포스트

[이것이코딩테스트다] CHAPTER04 구현(2)

다음 포스트