DFS/BFS

김유진·2022년 4월 15일

Algorithm

목록 보기

4/9

1. 개요

탐색(Search)란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정입니다. 대표적인 그래프 탐색 알고리즘은 DFS,BFS가 있으니 한번 정리해 보자.
DFS와 BFS는 stack 자료구조를 자주 사용하기 때문에 이에 대해서 먼저 정리를 해 보자.

2. Stack이란?

먼저 들어온 데이터가 나중에 나가는 형식인 (선입후출)의 자료구조입니다.
입구와 출구가 동일한 형태를 가지고 있습니다.

stack = []

stack.append(5)
stack.append(2)
stack.append(3)
stack.pop()

print(stack[::-1]) #최상단 원소부터 출력
print(stack) #최하단 원소부터 출력

python에서는 append와 pop의 시간 복잡도가 O(1)이기 때문에 부담 없이 사용할 수 있다.

list slicing을 활용하여 가장 나중에 들어온 원소부터 파악, 데려갈 수 있다.

#include<bits/stdc++.h>

using namespace std;

stack<int> s;

int main(void) {
	s.push(5);
    s.push(2);
    s.push(3);
    s,pop();
    
    while(!s.empty()){
    	cout<<s.top()<<' ';
        s.pop();
    }
}

C++에는 위와 같이 stack 자료구조를 지원하기 때문에 이용할 수 있다.

3. 큐 자료구조란?

먼저 들어온 데이터가 먼저 나가는 형식의 자료구조이다.
큐는 입구와 출구가 모두 뚫려 있는 터널과 같은 형태로 시각화할 수 있다.

from collections import deque

#큐 구현을 위해 deque 라이브러리 사용
queue = deque()

queue.append(5)
queue.append(2)
queue.popleft()

print(queue) #먼저 들어온 순서대로 출력
queue.reverse() #역순으로 바꾸기
print(queue) # 나중에 들어온 원소부터 출력

이 친구도 append와 popleft는 시간 복잡도 O(1)이니까 부담 없이 사용할 수 있습니다.
리스트를 이용하게 되면 pop에서 O(k)의 시간복잡도가 발생할 수 있으니 python은 되도록이면 deque라이브러리 사용합니다.

#include<bits/stdc++.h>

using namespace std;

queue<int> q;

int main(void) {
	q.push(5);
    q.push(2);
    q.pop();
    q.push(1);
    while(!q.empty()){
    	cout<<q.front()<<' ';
        q.pop();
    }
}

4. 재귀함수

재귀함수(Recursive Function) 자기 자신을 다시 호출하는 함수이다.
stack 안에 함수에 대한 정보가 담겨서 컴퓨터의 메모리가 계속 커진다. 함수가 종료되지 않고 계속 쌓아올린다면 메모리가 빠르게 가득 차서 재귀의 깊이 제한에 걸릴 수 있습니다.
즉 재귀함수를 문제풀이에 이용할 때, 재귀함수의 종료조건을 반드시 명시해야 합니다.

def recursive_function(i):
	#100번째 호출 종료
    if i==100:
    	return;
    print(i,'번째 재귀함수에서', i+1,'번째 재귀함수 호출합니다.')
    recursive_function(i+1)
    print(i, '번째 재귀함수를 종료합니다.')
recursive_function(1)

팩토리얼 구현 예제를 살펴봅시다.

#반복적으로 구현한 n!
def factorial_iterative(n):
	result = 1
    #1부터 n까지의 수를 차례대로 곱하기
    for i in range(1, n+1):
    	result *=i
    return result
#재귀적으로 구현한 n!
def factorial_recursive(n):
	if n <=1:
    	return 
    #n! n * (n-1)!그대로 코드로 작성
    return n*factorial_recursive(n-1)

최대공약수 계산(유클리드 호제법) 예제

유클리드 호제법
- 두 자연수 A,B에 대하여 (A>B) A를 B로 나눈 나머지를 R이라고 합니다.
- 이 때 A와 B의 최대공약수는 B와 R의 최대공약수와 같습니다.

def gcd(a,b):
	if a % b ==0:
    	return b
    else : 
    	return gcd(b, a%b)
print(gcd(192,162))

5. DFS(Depth-First Search)

-DFS는 깊이 우선 탐색이라고 하며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘
-DFS는 스택 자료구조(혹은 재귀 함수)를 이용하며, 다음 동작 과정을 가지고 있다.
1. 탐색 시작 노드를 스택에 삽입하고, 방문 처리를 합니다.
2. 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있다면 그 노드를 스택에 넣고 방 문처리합니다. 방문하지 않은 인접 노드가 없다면 스택에서 최상단 노드를 꺼냅니다.
3. 더이상 2번의 과정을 수행할 수 없을 때까지 반복합니다.

#DFS 메서드 정의
def dfs(graph, v, visited):
	#현재 노드를 방문 처리
    visited[v] = True
    print(v, end=' ') # 해당 노드의 인덱스 번호 출력
    #현재 노드와 연결된 다른 노드 재귀적 방문
    for i in graph[v]:
    	if not visited[i]:
        	dfs(graph, i, visited)

여기서 graph는 2차원 리스트를 사용합니다.
노드의 번호가 1번부터 시작하는 경우가 많아 인덱스 0은 비워두는 경우가 많다. 그리고 리스트에는 인접한 노드가 무엇인지에 대한 정보를 담아둡니다.

grah = [
		[],
        [2,3,8],
        [1,7],
        [1,4,5],
        [3,5],
        [3,4],
        [7],
        [2,6,8],
        [1,7],
]
#각 노드가 방문된 정보를 표현(1차원 리스트)
#우리가 1번 인덱스부터 사용하기 때문에 하나 더 큰 크기로 1차원 리스트 초기화
visited = [False] *9 

#정의된 dfs 함수 호출
dfs(graph, 1, visited)

아래는 C++ 코드입니다.

#include<bits/stdc++.h>
using namespace std;

bool visited[9];
vector<int> graph[9]; #얘도 1부터 보기 위해 9

void dfs(int x){
	visited[x] = true;
    cout<<x<<' ';
    for (int i =0; i<graph[x].size(); i++){
    	int y = graph[x][i];
        if (!visited[y]) dfs(y);
    }
}

6. BFS (Breadth-First Search)

너비 우선 탐색이라고 불리며, 그래프에서 가까운 노드부터 우선적으로 탐색하는 알고리즘입니다.
BFS는 큐 자료구조를 이용하며, 구체적인 동작 과정은 다음과 같습니다.

탐색 시작 노드를 큐에 삽입하고 방문처리를 합니다.
큐에서 노드를 꺼낸 뒤에 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문처리합니다.
더 이상 2번의 과정을 수행할 수 없을 때까지 반복합니다.

BFS는 거리가 먼 친구가 늦게 출력된다.
그래서 무게가 없다는 것에 가정되었을 때 가장 짧은 거리를 가진 친구를 출력하는 예제에 쓰일 수 있다.

from collections import deqqe

#BFS 메서드 정의
def bfs(graph, start, visited):
	#큐 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    #현재 노드를 방문 처리
    visited[start] = True
    #큐가 빌 때까지 반복
    while queue:
    	#큐에서 하나의 원소를 뽑아 출력
        v=queue.popleft()
        print(v, end=' ')
        #아직 방문하지 않은 원소 큐 삽입
        for i in graph[v]:
        	if not visited[i]:
            	queue.append(i)
                visited[i]=True

아래는 그래프 정의이다.

graph=[
		[],
       [2,3,8],
       [1,7],
       [1,4,5],
       [3,5],
       [3,4],
       [7],
       [2,6,8],
       [1,7]
 ]
 #각 노드가 방문된 정보를 표현(1차원 리스트)
 visited = [False] * 9
 
 #정의된 BFS 함수 호출
 bfs(graph, 1, visited)

7. 대표 문제 풀이

1. 음료수 얼려 먹기

N X M 크기의 얼음 틀이 있습니다. 구멍이 뚫려 있는 부분은 0, 칸막이가 존재하는 부분은 1로 표시됩니다. 구멍이 뚫려 있는 부분끼리 상,하,좌,우로 붙어있는 경우 서로 연결되어 있는 것으로 간주합니다. 이때 얼음 틀의 모양이 주어졌을 때 생성되는 총 아이스크림의 개수를 구하는 프로그램을 작성하세요.

입력 조건 : 첫번째 줄에 얼음 틀의 세로 길이 N과 가로 길이 M이 주어집니다. (1<=N, M<=1000) 두번째 줄에서부터 N+1번째 줄까지 얼음 틀의 형태가 주어집니다. 이때 구멍이 뚤린 부분은 0이고 그렇지 않은 부분은 1입니다.
시간 제한 : 1초, 메모리 제한 128MB
출력 조건 : 한번에 만들 수 있는 아이스크림의 개수

아이디어 : 0이라고 된 부분들은 서로 인접한 그래프 형태라고 하고 풀어볼까요? 1인 이동이 불가능한 노드로 생각하고, 0이라고 되어 있는 부분들은 방문처리를 하는 식으로 풀이를 해 봅시다.

<DFS 사용>
1. 특정한 지점의 주변 상,하,좌,우를 살펴본 뒤에 주변 지점 중에서 값이 '0'이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문합니다.
2. 방문한 지점에서 다시 상,하,좌,우를 살펴보면서 방문을 진행하는 과정을 반복하면, 연결된 모든 지점을 방문할 수 있다.
3. 모든 노드에 대하여 1~2번의 과정을 방문하며, 방문하지 않은 지점의 수를 카운트합니다.

n,m=map(int, input().split())

#2차원 리스트의 맵 정보 받기
graph=[]
for i in range(n):
	graph.append(list(map(int,input())))
    
# DFS로 특정 노드를 방문하고 모든 노드 방문
def dfs(x,y):
	#주어진 범위를 벗어나면 즉시 종료
    if x<=-1 or x>=n or y<=-1 or y>=m:
    	return False
    #현재 노드를 아직 방문하지 않았다면
    if graph[x][y] ==0:
    	#해당 노드 방문 처리
        graph[x][y] =1
        # 상,하,좌,우 위치 모두 재귀적 호출
        dfs(x-1, y)
        dfs(x, y-1) # 다 방문처리 해줘! 
        dfs(x+1, y)
        dfs(x,y+1)
        return True #상하좌우는 true 리턴X
    return False

#모든 노드에 대하여 읍료수 채우기
result=0
for i in range(n):
	for j in range(m):
    	#현재 위치에서 DFS 수행
        if dfs(i,j) == True:
        	result +=1
print(result)

2. 미로 탈출 문제

유진이는 N X M 크기의 직사각형 형태의 미로에 갇혔습니다. 미로에는 여러 마리의 괴물이 있어 이를 피해 탈출해야 합니다. 유진이의 위치는 (1,1)이며 출구는 (N,M)의 위치에 존재하며 한 번에 한 칸씩 이동할 수 있습니다. 이때 괴물이 있는 부분은 0, 괴물이 없는 부분은 1로 표시되어 있습니다. 미로는 반드시 탈출 가능합니다. 이때 유진이가 탈출하기 위해 움직여야 하는 최소 칸의 개수는? (칸을 셀 때는 시작 칸과 마지막 칸을 모두 포함하여 계산 필요)

입력 조건 : 첫째 줄에 두 정수 N,M이 주어진다. 다음 N개의 줄에는 각각 M개의 정수, 미로의 정보가 주어집니다. 공백 없이 입력 받음. 마지막 칸은 항상 1
시간 제한 : 1초, 메모리 128MB
출력 조건 : 첫째 줄에 최소 이동 칸의 개수 출력

아이디어 : BFS 출력. 간선의 비용이 모두 같을 때 최단 거리를 선택할 수 있는 원리를 가지고 있기 때문이다. (시작 지점에서 가장 가까운 노드부터 차례대로 그래프의 모든 노드 탐색하기 때문)

from collections import deque

#N,M을 공백을 기준으로 구분하여 입력 받기
n,m = map(int, input().split())
#2차원 리스트 만들기
graph=[]
for i in range(n):
	graph.append(list(map(int,input())))
    
#이동할 네 가지 방향 정의 (상,하,좌,우)
dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]

#BFS 소스코드 구현
def bfs(x,y):
	#큐 구현을 위해 deque 라이브러리 사용
    queue = deque()
    queue.append((x,y)) #튜플 담아!
    #큐가 빌 때까지 반복하기
    while queue:
    	x,y = queue.popleft()
        #현재 위치에서 4방향 위치 확인
        for i in range(4):
        nx = x + dx[i]
        ny = y+ dy[i]
        #미로 공간을 벗어난 경우 무시
        	if nx<0 or nx>=n or ny<0 or ny >=m:
        		continue
        #벽인 경우 무시
        	if graph[nx][ny] ==0:
        		continue
        #해당 노드를 처음 방문하는 경우만 최단 거리 기록
        if graph[nx][ny] ==1:
        	graph[nx][ny] = graph [x][y] +1
            queue.append((nx,ny))
       #가장 오른쪽 아래까지의 최단거리 반환
   return graph[n-1][m-1]
print(bfs(0,0))

김유진

이전 포스트

구현 알고리즘 (Implementation Algorithm)

다음 포스트