[코테]DFS/BFS

uuuu.jini·2022년 10월 4일
0

1] 자료구조 기초

구현에 붙잡혀있던 나란 인간, 이러다 코테 포기할 것 같은 마음에 넘어가 보도록 할거임;;

탐색(Search) 이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 의미한다. 프로그래밍에서는 그래프, 트리 등의 자료구조 안에서 탐색을 하는 문제를 자주 다룬다.

대표 탐색 알고리즘: DFS, BFS

자료구조 란 '데이터를 표현하고 관리하고 처리하기 위한 구조'를 의미한다. 그 중 스택과 큐는 자료구조의 기초 개념으로 다음의 두 핵심적인 함수로 구성된다.

  • 삽입(push): 데이터를 삽입
  • 삭제(pop): 데이터를 삭제

오버플로: 특정한 자료구조가 수용할 수 있는 데이터 크기를 이미 가득 찬 상태에서 삽입 연산을 수행할 때 발생
언더플로: 특정한 자료구조에 데이터가 전혀 들어 있지 않은 상태에서 삭제 연산을 수행시 데이터가 전혀 없는 상태이므로 발생

> 스택[Stack]

스택은 박스 쌓기에 비유한다. 선입후출(First In Last Out) 구조 또는 후입선출(Last In First Out) 구조 라고 한다.

# 5-1.py

stack = []
stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()
print(stack)
print(stack[::-1])

파이썬에서 스택을 사용시 별도의 라이브러리 필요 없다. --> append()와 pop() 메서드 이용 가능하다.

append(): 리스트의 가장 뒤쪽에 삽입
pop(): 리스트 가장 뒤쪽에서 데이터 삭제

> 큐[Queue]

큐는 대기 줄에 비유할 수 있다. 선입선출(First In First Out) 구조 라고 한다.

from collections import deque

queue = deque() # 큐 구현을 위한 deque 라이브러리 사용

queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()  
queue.append(1)
queue.append(4)
queue.popleft()


print(queue)
queue.reverse()
print(queue)

파이썬으로 큐를 구현시에는 collections 모듈에서 제공하는 deque 자료구조를 활용한다.

deque 객체를 리스트 자료형으로 변경하고자 한다면 list() 메소드를 사용한다.

> 재귀함수

DFS와 BFS를 구현하려면 재귀 함수도 이해하고 있어야 한다. 재귀 함수 란 자기 자신을 다시 호출하는 함수를 의미한다.


def recursive_function():
    print('재귀 호출')
    recursive_function()
recursive_function()

위의 코드를 실행 시 재귀 호출 이라는 문자열을 무한히 출력한다. 해당 함수가 자기 자신을 계속해서 추가로 불러오기 때문이다.

어느 정도 출력하다가 오류 메시지를 출력하고 멈춘다.

- 재귀 함수의 종료 조건

재귀 함수를 문제 풀이에서 사용하는 경우 재귀 함수가 언제 끝날지, 종료 조건을 꼭 명시해야 한다. 종료 조건을 명시하지 않으면 함수가 무한 호출될 수 있다.


def recursive_function(i):
    if i==100:
        return
    print(i,'번째 재귀 함수에서 ',i+1,'번째 재귀함수를 호출')
    recursive_function(i+1)
    print(i,'번째 재귀 함수 종료')
recursive_function(1)

컴퓨터 내부에서 재귀 함수의 수행은 스택 자료구조를 이용한다. 함수를 계속 호출 시 가장 마지막에 호출한 함수가 먼저 수행을 끝내야 그 앞의 함수 호출이 종료되기 때문이다. 따라서 스택 자료구조를 활용해야 하는 상당수 알고리즘은 재귀 함수를 이용해서 간편하게 구현될 수 있다. DFS가 대표적인 예이다.

재귀 함수를 이용하는 대표적 예제로는 팩토리얼 문제가 있다. n!1 X 2 X 3 X ... X (n-1 ) X n을 의미한다.

수학적 점화식: 특정한 함수를 자신보다 더 작은 변수에 대한 함수와의 관계로 표현한 것

  • n이 0 혹은 1 인 경우: 1
  • n이 1보다 큰 경우: factorial(n) = n * factorial(n-1)

2] 탐색 알고리즘 DFS/BFS


> DFS

DFS는 Depth-First Search, 깊이 우선 탐색이라고도 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.

그래프의 기본 구조

그래프는 노드(Node)간선(Edge) 으로 표현되며 이때 노드를 정점(Vertex) 라고도 말한다. 그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다. 또한 두 노드가 간선으로 연결되어 있다면 두 노드는 인접하다 라고 표현한다.

프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있다.

  • 인접 행렬(Adjacency Matrix): 2차원 배열로 그래프의 연결 관계를 표현하는 방식
  • 인접 리스트(Adjacency List): 리스트로 그래프의 연결 관계를 표현하는 방식

- 인접 행렬[Ajacency Matrix]

인접 행렬 방식은 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다. 연결된 그래프를 인접 행렬로 표현할 때 파이썬에서는 2차원 리스트로 구현할 수 있다.

  • 연결이 되어 있지 않은 노드 - 무한의 비용
INF = 99999999 # 무한의 비용 선언

# 2차원 리스트를 이용해 인접 행렬 표현
graph = [
    [0,7,5],
    [7,0,INF],
    [5,INF,0]
]

print(graph)

- 인접 리스트[Adjacency List]

인접 리스트 방식에서는 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.

인접 리스트는 연결 리스트라는 자료구조를 이용해 구현하는데, C++나 자바와 같은 언어에서는 별도로 연결 리스트 기능을 위한 표준 라이브러리를 제공한다. 반면에 파이썬은 기본 자료형인 리스트 자료형이 append()와 메소드를 제공하므로, 전통적인 프로그래밍 언어에서의 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.

파이썬으로 인접 리스트를 이용해 그래프를 표현하고자 할 때에도 단순히 2차원 리스트를 이용하면 된다.

# 행(Row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장 (노드, 거리)
graph[0].append((1,7))
graph[0].append((2,5))

# 노드 1에 연결된 노드 정보 저장
graph[1].append((0,7))

# 노드 2에 연결된 노드 정보 저장
graph[2].append((0,5))

print(graph)

- 두 방식의 차이

메모리 측면에서 보면 인접 행렬 방식은 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비된다. 반면에 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.

하지만 이와 같은 속성 때문에 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다. 인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문이다.

  • 한 그래프에서 노드 1과 노드 7이 연결되어 있는 상황
    : 인접 행렬 방식에서는 graph[1][7]만 확인하면 된다.
    : 인접 리스트 방식에서는 노드 1에 대한 인접 리스트를 앞에서부터 차례대로 확인해야 한다.
    특정한 노드와 연결된 모든 인접 노드를 순회해야 하는 경우, 인접 리스트 방식이 인접 행렬 방식에 비해 메모리 공간의 낭비가 적다.

- DFS 동작 방식

  • 깊이 우선 탐색 알고리즘

이 알고리즘은 특정한 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.

DFS의 스택 자료구조를 이용한 구체적인 동작 과정
1. 탐색 시작 노드를 스택에 삽입하고 방문 처리
2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드 꺼냄.
3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복.

단순하게 가장 깊숙이 위치하는 노드에 닿을 때까지 확인(탐색)하면 된다.

또한 일반적으로 인접한 노드 중에서 방문하지 않은 노드가 여러개 있는 경우 번호가 낮은 순서부터 처리한다.

깊이 우선 탐색 알고리즘인 DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다. 실제로는 스택을 쓰지 않아도 되며 탐색을 수행함에 있어서 데이터의 개수가 N개인 경우 O(N)의 시간이 소요된다는 특징이 있다.

또한 DFS는 스택을 이용하는 알고리즘이기 때문에 실제 구현은 재귀 함수를 이용했을 때 매우 간결하게 구현할 수 있다.

#DFS 메서드 정의
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end= ' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)


# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원)
graph = [
    [],
    [2,3,8],
    [1,7,8],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

visited = [False] * 9

dfs(graph, 1, visited)

> BFS

BFS(Breadth First Search) 알고리즘은 너비 우선 탐색이라는 의미를 가진다. 가까운 노드부터 탐색하는 알고리즘이다. DFS는 최대한 멀리 있는 노드를 우선으로 탐색하는 방식으로 동작한다고 했다. BFS는 그 반대이다.

- BFS 구현 방식

BFS는 선입선출 방식인 큐 자료구조를 이용한다. 인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어간 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다.

  1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
  2. 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.
  3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

마찬가지로 인접한 노드가 여러 개 있는 경우, 숫자가 작은 노드부터 먼저 큐에 삽입한다고 가정한다.

너비 우선 탐색 알고리즘인 BFS는 큐 자료구조에 기초한다는 점에서 구현이 간단하다. 실제로 구현함에 있어 앞서 언급한 대로 deque 라이브러리를 사용하는 것이 좋으며 탐색을 수행함에 있어 O(N)의 시간이 소요된다. 일반적인 경우 실제 수행 시간은 DFS보다 좋은 편이라는 점까지만 기억한다.

from collections import deque

# BFS 메서드 정의
def bfs(graph, start, visited):
    # 큐(Queue) 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리
    visited[start] = True
    # 큐가 빌 때가지 반복
    while queue:
        # 큐에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        print(v, end= ' ')
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True


# 각 노드가 연결된 정볼르 리스트 자료형으로 표현(2차원)
graph = [
    [],
    [2,3,8],
    [1,7,8],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

visited = [False] * 9

bfs(graph,1,visited)

> DFS vs. BFS

DFSBFS
동작 원리스택
구현 방법재귀 함수 이용큐 자료구조 이용
profile
멋쟁이 토마토

0개의 댓글