DFS & BFS 알고리즘

Kyunghwan Ko·2021년 10월 5일
1

알고리즘

목록 보기
4/9

DFS & BFS 알고리즘

목차

  1. 인트로
  2. 그래프 탐색 알고리즘 DFS/BFS
  3. 스택
  4. 재귀함수
  5. DFS 알고리즘
  6. BFS 알고리즘
  7. DFS & BFS 기초 문제 풀이

인트로

자료구조 수업을 통해서 Graph에 대해서 배우고 과제도 했지만 아직 머릿속에 BFS, DFS가 무엇인지, 어떻게 활용해야하는지 명확하게 알지 못해서 이번기회에 BFS, DFS에서 사용되는 기본적인 자료구조부터 기본 원리 그리고 활용문제까지 정리해보려고한다.

본 내용은 '이것이 취업을 위한 코딩 테스트다.'를 참고하여 제작하였음을 알립니다.

그래프 탐색 알고리즘: DFS/BFS

  • 탐색(Search)이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 말합니다.
  • 대표적인 그래프 탐색 알고리즘으로는 DFS와 BFS가 있습니다.
  • DFS/BFS는 코딩 테스트에서 매우 자주 등장하는 유형이므로 반드시 숙지해야 합니다.

스택(Stack) 구현

  • 먼저 들어 온 데이터나 나중에 나가는 형식(선입후출)의 자료구조 입니다.
  • 입구와 출구가 동일한 형태로 스택을 시각화할 수 있습니다.
img
  • 삽입 & 삭제 연산으로 이루어짐

    삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()img

스택 자료구조

'''
※ 파이썬에선 리스트 자료형을 통해 스택구현가능 => 별도의 표준 라이브러리 필요x
<List>.append(x) -> <List>의 맨 마지막(오른쪽)에 원소x를 추가 -> O(1)
<List>.pop() -> <List>의 맨 마지막(오른쪽)에 원소를 삭제 -> O(1)
'''
stack = []

#삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()

#최상단 원소부터 출력(현재 리스트의 원소순서를 뒤집은 다음에 출력한다.)
print(stack[::-1]) # [1, 3, 2, 5] 

#최하단 원소부터 출력
print(stack) # [5, 2, 3, 1]

큐(Queue) 구현

  • 먼저 들어 온 데이터가 먼저 나가는 형식(선입선출)의 자료구조입니다.
  • 큐는 입구와 출구가 모두 뚫려 있는 터널과 같은 형태로 시각화 할 수 있습니다.
img
  • 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
img

큐 자료구조

from collections import deque

#python에서 리스트를 통해 queue를 구현할 수 있지만 비효율적임.
#큐(Queue) 구현을 위해 deque라이브러리 사용
'''
※ 수행시간
<deque>.append(x) -> 큐에서 오른쪽에 원소x를 삽입 -> O(1)
<deque>.popleft() - > 큐에서 왼쪽에서 원소를 삭제 -> O(1)
'''
queue = deque()

#삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()
queue.append(1)
queue.append(4)
queue.popleft()

#먼저 들어온 순서대로 출력
print(queue) #deque([3, 7, 1, 4])
queue.reverse() # 역순으로 바꾸기
#나중에 들어온 원소부터 출력
print(queue) #deque([4, 1, 7, 3])

5. 재귀함수

  • 재귀 함수(Recursive Function)란 자기 자신을 다시 호출하는 함수를 의미합니다.

  • 단순 평태의 재귀함수 예제

    • '재귀 함수를 호출합니다.' 라는 문자열을 무한히 출력합니다.
    • 어느 정도 출력하다가 최대 재귀 깊이 초과 에러메시지가 출력되면서 강제 종료됩니다.

    (RecursionError: maximum recursion depth exceeded while calling a Python object)

    def recursive_function():
        print('재귀 함수를 호출합니다.')
        recursive_function()
        
    recursive_function()

재귀 함수의 종료 조건

  • 재귀 함수를 문제 풀이에서 사용할 때는 재귀 함수의 종료 조건(or 바닥조건, Base Case)을 반드시 명시해야합니다.

  • 종료 조건을 제대로 명시하지 않으면 함수가 무한히 호출될 수 있습니다.

    • 종료조건을 포함한 재귀 함수 예제

      def recursive_function(i):
          # 100번째 호출을 했을 때 종료되도록 종료조건 명시
          if i == 100:
              return
          print(f'{i} 번째 재귀함수에서 {i+1} 번째 재귀함수를 호출합니다.')
          recursive_function(i+1)
          print(f'{i} 번째 재귀함수를 종료합니다.')
          
      recursive_function(1)

팩토리얼 구현 예제

  • factorial(n) = n ! = 1 x 2 x 3 x ... x (n-1) x n
  • factorial(0) = 1, factorial(1) = 1
# 반복적으로 구현한 n!
def factorial_iterative(n):
    result = 1
    # 1부터 n까지의 수를 차례대로 곱하기
    for i in range(1, n+1):
        result *= i # result = result * i
    return result

# 재귀적으로 구현한 n!
def factorial_recursive(n):
    if n <= 1: # n이 1 이하인 경우 1을 반환
        return 1
   	# n! = n * (n-1)!을 그대로 코드로 작성
    return n * factorial_recursive(n-1)

print('반복적으로 구현한 5!:', factorial_interactive(5)) # 반복적으로 구현한 5!: 120
print('재귀적으로 구현한 5!:', factorial_recursive(5)) # # 재귀적으로 구현한 5!: 120

DFS(Depth-First Search)

  • DFS는 깊이 우선 탐색이라고도 부르며 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘입니다.
  • DFS는 스택 자료구조(혹은 재귀함수)를 이용하며, 구체적인 동작과정은 다음과 같습니다.
    1. 탐색 시작 노드를 스택에 삽입 후, 방문처리 합니다.
    2. 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있으면 그 노드를 스택에 삽입후, 방문처리 합니다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼냅니다.
    3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복합니다.

DFS 동작 예시

[Step 0] 그래프를 준비합니다. (방문 기준: 번호가 낮은 인접 노드(Adjacent Node)부터)

  • 시작 노드: 1
img

[Step 1] 시작 노드인 '1'을 스택에 삽입 후, 방문 처리합니다.

img

[Step 2] 스택의 최상단 노드인 '1'에 방문하지 않은 인접 노드인 '2', '3', '8'이 있습니다.

  • 이 중에서 가장 작은 노드인 '2'를 스택에 삽입 후, 방문 처리합니다.

img

[Step 3] 스택의 최상단 노드인 '2'에 방문하지 않은 인접 노드 '7'이 있습니다.

  • 따라서 '7'번 노드를 스택에 삽입 후, 방문 처리합니다.

img

[Step 4] 스택의 최상단 노드인 '7'에 방문하지 않은 인접 노드 '6', '8'이 있습니다.

  • 이 중에서 가장 작은 노드인 '6'을 스택에 삽입 후, 방문 처리합니다.

img

[Step 5] 스택의 최상단 노드인 '6'에 방문하지 않은 인접 노드가 없습니다.

  • 따라서 스택에서 '6'번 노드를 삭제합니다(=꺼냅니다).

img

[Step 6] 스택의 최상단 노드인 '7'에 방문하지 않은 인접 노드 '8'이 있습니다.

  • 따라서 '8'번 노드를 스택에 삽입 후, 방문 처리합니다

img

[Step n] 위와 같은 과정을 반복했을 때 전체 노드의 탐색 순서(=스택에 들어간 순서)는 다음과 같습니다.

img

DFS 자료구조

# DFS 메서드 정의
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end=' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)
            
# start of main
# 각 노드가 연결된 정보를 표현(2차원 리스트)
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보를 표현 (1차원 리스트)
visited = [False]*9

# 정의된 DFS 함수 호출
dfs(graph, 1, visited) # 1 2 7 6 8 3 4 5

BFS (Breadth-First Search)

  • BFS는 너비 우선 탐색이라고도 부르며, 그래프에서 가까운 노드부터 우선적으로 탐색하는 알고리즘입니다.
  • BFS는 큐 자료구조를 이용하며, 구체적인 동작 과정은 다음과 같습니다.
    1. 탐색 시작 노드를 큐에 삽입 후, 방문 처리합니다.
    2. 큐에서 노드를 삭제 후(=꺼낸 후), 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입 후, 방문 처리합니다.
    3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복합니다.

[Step 0] 그래프를 준비합니다. (방문 기준: 번호가 낮은 인접 노드부터)

  • 시작 노드: 1
img

[Step 1] 시작 노드인 '1'을 큐에 삽입 후, 방문 처리합니다. (※ 현재의 경우 큐의 삽입은 위, 큐의 삭제는 아래 에서 이루어짐)

img

[Step 2] 큐에서 노드 '1'을 삭제 후(꺼낸 후), 방문하지 않은 인접 노드 '2', '3', '8'을 큐에 삽입 후, 방문 처리합니다.

img

[Step 3] 큐에서 노드 '2'를 삭제 후(꺼낸 후), 방문하지 않은 노드 '7'을 큐에 삽입 후, 방문 처리합니다.

img

[Step 4] 큐에서 노드 '3'을 꺼내 방문하지 않은 인접 노드 '4', '5'를 큐에 삽입 후, 방문 처리합니다.

img

[Step 5] 큐에서 노드 '8'을 꺼내고 방문하지 않은 인접노드가 없으므로 무시합니다.

img

[Step n] 위와 같은 과정을 반복하여 전체 노드의 탐색 순서(큐에 들어간 순서)는 다음과 같습니다.

img

※ BFS는 각 간선(edge)의 비용이 동일한 상황에서 최단거리 문제 해결시 자주 사용됨.

BFS 자료구조

from collections import deque

#BFS 메서드 정의
def bfs(graph, start, visited):
    # 큐(Queue) 구현을 위해 deque라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리
    visited[start] = True
    # 큐가 빌 때까지 반복
    while queue:
        # 큐에서 하나의 원소를 삭제해(=뽑아서) 출력
        v = queue.popleft()
        print(v, end=' ')
        # 아직 방문하지 않은 인접한 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True
                
# 각 노드가 연결된 정보를 표현(2차원 리스트)
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보를 표현(1차원 리스트)
visited = [False]*9

# 정의된 BFS함수 호출
bfs(graph, 1, visited) # 1 2 3 8 7 4 5 6

문제1) 음료수 얼려 먹기

문제 설명

N x M 크기의 얼음 틀이 있습니다. 구멍이 뚫려 있는 부분은 0, 칸막이가 존재하는 부분은 1로 표시됩니다. 구멍이 뚫려있는 부분끼리 상, 하, 좌, 우로 붙어 있는 경우 서로 연결되어 있는 것으로 간주합니다.
이때 얼음 틀의 모양이 주어졌을 때 생성되는 총 아이스크림의 개수를 구하는 프로그램을 작성하세요. 다음의 4x5 얼음 틀 예시느에서는 아이스크림이 총 3개 생성됩니다. -> 연결요소찾기(Find Connected Component)

imgimg

입력조건

  • 첫 번째 줄에 얼음 틀의 세로 길이 N과 가로 길이 M이 주어집니다. (1 <= N, M <= 1,000)
  • 두 번째 줄부터 N+1번째 줄까지 얼음 틀의 형태가 주어집니다.
  • 이때 구멍이 뚫려있는 부분은 0, 그렇지 않은 부분은 1입니다.

출력 조건

  • 한 번에 만들 수 있는 아이스크림의 개수를 출력합니다.

입출력 예시

<입력예시>

4 5

00110
00011
11111
00000

<출력예시>

3

문제 해결 아이디어

이 문제는 DFS혹은 BFS로 해결할 수 있습니다. 일단 앞에서 배운 대로 얼음을 얼릴 수 있는 공간이 상, 하, 좌, 우로 연결되어 있다고 표현할 수 있으므로 그래프 형태로 모델링할 수 있습니다. 다음과 같이 3x3 크기의 얼음 틀이 있다고 가정하고 생각해 봅시다.

img

DFS를 활용하는 알고리즘

  1. 특정 지점의 주변 상, 하, 좌, 우를 살펴본 뒤에 주변 지점 중에서 값이 '0'이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문합니다.
  2. 방문한 지점에서 다시 상, 하, 좌, 우를 살펴보면서 방문을 진행하는 과정을 반복하면, 연결된 모든 지점을 방문할 수 있습니다.
  3. 모든 노드에 대하여 1~2번의 과정을 반복하며, 방문하지 않은 지점의 수를 카운트합니다.

문제1) 음료수 얼려 먹기 답안

# DFS로 특정 노드를 방문하고 연결된 모든 노드들도 방문
def dfs(x, y):
    #주어진 범위를 벗어나는 경우에는 즉시 종료
    if x <= -1 or x >= n or y <= -1 or y >= m:
        return False
    #현재 노드를 아직 방문하지 않았다면
    if graph[x][y] == 0:
        #해당노드 방문 처리
        graph[x][y] = 1
        #상, 하, 좌, 우의 위치들도 모두 재귀적으로 호출
        #단지 방문처리용
        dfs(x-1, y)
        dfs(x, y-1)
        dfs(x+1, y)
        dfs(x, y+1)
        return True
    return False

# start of main
# N, M을 공백을 기준으로 구분하여 입력받기
n, m = map(int, input().split())

#2차원 리스트의 맵 정보 입력받기
graph = []
for i in range(n):
    graph.append(list(map(int, input())))

# 모든 노드(위치)에 대하여 음료수 채우기
result = 0
for i in range(n):
    for j in range(m):
        #현재 위치에서 dfs수행
        if dfs(i, j) == True:
            result += 1
#정답 출력
print(result)

문제2) 미로 탈출

문제설명

  • 길동이는 N x M 크기의 직사각형 형태의 미로에 갇혔습니다. 미로에는 여러 마리의 괴물이 있어 이를 피해 탈출해야 합니다.
  • 길동이의 위치는 (1, 1)이며 미로의 출구는 (N, M)의 위치에 존재하며 한 번에 한 칸씩 이동할 수 있습니다. 이때 괴물이 있는 부분은 0으로, 괴물이 없는 부분은 1로 표시되어 있습니다. 미로는 반드시 탈출할 수 있는 형태로 제시됩니다.
  • 이때 길동이가 탈출하기 위해 움직여야하는 최소 칸의 개수를 구하세요. 칸을 셀 때는 시작 칸과 마지막 칸을 모두 포함해서 계산합니다.

입력 조건

  • 첫째 줄에 두 정수 N, M(4 <= N, M <= 200)이 주어집니다. 다음 N개의 줄에는 각각 M개의 정수(0 or 1)로 미로의 정보가 주어집니다. 각각의 수들은 공백 없이 붙어서 입력으로 제시됩니다. 또한 시작 칸과 마지막 칸은 항상 1입니다.

출력 조건

  • 첫째 줄에 최소 이동 칸의 개수를 출력합니다.

입력 예시

5 6

101010
111111
000001
111111
111111

출력 예시

10

문제 해결 아이디어

  • BFS는 시작 지점에서 가까운 노드부터 차례대로 그래프의 모든 노드를 탐색합니다.
  • 상, 하, 좌, 우로 연결된 모든 노드로의 거리가 1로 동일합니다
    • 따라서 (1, 1) 지점부터 BFS를 수행하여 모든 노드의 최단 거리 값을 기록하면 해결할 수 있습니다.
  • 예시로 다음과 같이 3x3 크기의 미로가 있다고 가정해봅시다.

imgimg

[Step 1] 처음에 (1, 1)의 위치에서 시작합니다.

img

[Step 2] (1, 1) 좌표에서 상, 하, 좌, 우로 탐색을 진행하면 바로 옆 노드인 (1, 2) 위치의 노드를 방문하게 되고 새롭게 방문하는 (1, 2) 노드의 값을 2로 바꾸게 됩니다.

img

[Step n] 마찬가지로 BFS를 계속 수행하면 결과적으로 다음과 같이 최단 경로의 값들이 1씩 증가하는 형태로 변경됩니다.

img

문제2) 미로 탈출 답안

from collections import deque
# BFS 소스코드 구현(edge의 거리비용이 동일할때 최단거리 찾기에 적합)    
def bfs(x, y):
    #큐(Queue) 구현을 위해 deque 라이브러리 사용
    queue = deque()
    queue.append((x, y))
    #큐가 빌 때까지 반복하기
    while queue:
        x, y = queue.popleft()
        #현재 위치에서 4가지 방향으로의 위치 확인
        for i in range(4):
            nx = x + dx[i]
            ny = y + dy[i]
            #미로 찾기 공간을 벗어난 경우 무시
            if nx < 0 or nx >= n or ny < 0 or ny >= m:
                continue
            # 괴물이 있을 경우 무시
            if graph[nx][ny] == 0:
                continue
            # 해당 노드를 처음 방문하는 경우에만 최단 거리 기록
            if graph[nx][ny] == 1:
                graph[nx][ny] = graph[x][y] + 1
                queue.append((nx, ny))
   # 가장 오른쪽 아래까지의 최단 거리 반환
   return graph[n-1][m-1]

#start of main
# N, M을 공백을 기준으로 구분하여 입력받기
n, m = map(int, input().split())
# 2차원 리스트의 맵 정보 입력받기
graph = []
for _ in range(n):
    graph.append(list(map(int, input())))
#이동할 4가지 방향 정의 (상, 하, 좌, 우)
dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]

# BFS를 수행한 결과 출력
print(bfs(0, 0))

자주 실수하는 사항

BFS

  1. 시작점에 방문했다는 표시를 남기지 않는다.
  2. 큐에 넣을 때 방문했다는 표시를 하는 대신 큐에서 빼낼 때 방문했다는 표시를 남겼다.
  3. 이웃한 원소가 범위를 벗어났는지에 대한 체크를 잘못했다.
profile
부족한 부분을 인지하는 것부터가 배움의 시작이다.

0개의 댓글