알고리즘- DFS/BFS

Jamwon·2021년 6월 4일

BFS DFS TIL 스택 자료구조

알고리즘

목록 보기

9/18

DFS와 BFS는 그래프를 탐색하기위한 대표적인 두 가지 알고리즘이다.

탐색이란 많은 데이터중에서 원하는 데이터를 찾는 과정을 의미한다. DFS와 BFS를 제대로 이해하려면 기본 자료구조인 stack/ queue에 대한 제대로된 이해가 있어야된다.

Stack

stack은 말그대로 자료를 밑에서부터 쌓는 형태이다. 박스를 쌓는다고 생각하자. 그러면 아래에 있는 박스를 치울려면 우선 위에있는 박스를 치워야한다!

이러한 방식을 FILO(first in last out) -선입후출이라고 한다.

파이썬에서는
stack = [] 와같이 list형으로 선언한다.

stack.append() - 리스트의 가장 뒤쪽에 데이터를 삽입한다.
stack.pop() - 리스트의 가장 뒤쪽에서 데이터를 꺼낸다.

Queue

Queue는 대기줄이라고 생각하면된다. 어딘가를 들어갈려고 줄을 서면 먼저온 사람이 먼저들어간다. 이를 FIFO(first in first out) 선입선출(편의점국룰) 구조라고 한다.

파이썬에서 queue를 선언할때는

from collections import deque
queue = deque()

위처럼 collections 모듈에서 제공하는 deque를 활용한다.

deque - 스택과 큐의 장점을 모두 채택한 것이다. 데이터를 넣고 빼는 속도가 리스트 자료형에 비해 효율적이며 queue라이브러리를 이용하는 것보다 더 간단하다.

Recursive Function

재귀함수 - 자기 자신을 다시 호출하는 함수

def recursive_function():
	print('재귀 함수를 호출합니다.')
    recursive_function()
    
recursive_function()

위 코드를 출력하면 print()문이 무한으로 반복된다.

재귀 함수로 문제를 풀때는 재귀함수가 언제 끝나는지 종료 조건을 꼭 명시해야된다.

반복적 vs 재귀

def factorial_iterative(n):
	result = 1
    for i in range(1,n+1):
    	result *=i
    return result

def factorial_recursive(n):
	if n<=1:
    	return 1
       	
	return n* factorial_recursive(n-1)

위의 식은 반복문을 사용 밑은 재귀함수를 이용해서 팩토리얼을 구하는 코드이다.

코드로만 봤을때 재귀함수를 이용한 방법이 코드가 더 간결하다.

이유는? 재귀함수가 수학의 점화식을 그래도 소스코드로 만들었기 때문이다.

점화식이란? 특정한 함수를 자신보다 더 작은 변수에 대한 함수와의 관계로 표현한것. -> DP에서도 사용됨

DFS

Depth-Fist Search. 깊이 우선 탐색.
그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘.

그래프는 Node와 Edge(간선)으로 표현한다.

프로그래밍에서 그래프는 크게 2가지 방식으로 표현하는데

인접행렬 - 2차원 배열로 그래프의 연결관계를 표현하는 방식
인접리스트 - 리스트로 그래프의 연결 관계를 표현하는 방식

인접행렬

위의 그림이 인접 행렬방식이다. 연결 되어있지 않은 노드끼리는 무한의 비용이라고 작성한다. 코드에서는 논리적으로 정답이 될 수 없는 큰값으로 초기화하는 경우가 많다.

graph = [[0,1,0,0,1],
		[1,0,1,1,1],
        [0,1,0,1,0],
        [0,1,1,0,1],
        [1,1,0,1,0]]

위와같이 정의하는데 문제를 풀때는 0이라는 값으로 연결되지 않음을 표현하지말고 따로 엄청큰 값을 지정해놓고 그값을 넣어주자.

인접리스트

인접리스트 방식에서는 데이터가 이런식으로 저장된다. 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결해서 저장한다.

인접리스트는 연결리스트라는 자료구조를 이용하지만 파이썬은 list자료형이 append()와 메소드를 제공하므로 list를 사용하고 그래프를 표현하고자 할때도 2차원리스트를 이용하면 된다!!

# 행이 5개인 2차원 리스트로 인접리스트 표현
graph = [[] for _ in range(5)] 

#노트 0에 연결된 노드 정보
graph[0].append(1)
graph[0].append(4)
...

위와같이 표현한다. 가령 edge사이에 가중치가 있다면
graph[0].append(노드, 가중치(거리))

이런식으로 추가해주면된다.

두 방식의 차이점

메모리 측면 - 인접행렬 방식은 모든 관계를 저장하므로 노드의 개수가 많을수록 메모리가 불필요하게 낭비된다. / 인접리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.

속도 측면 - 인접리스트 방식은 인접행렬 방식에 비해 특정한 두 노드가 연결되어이 있는지에 대한 정보를 얻는 속도가 느리다. (인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기때문)

DFS 구현

스택 자료구조를 이용한다.

탐색 시작 노드를 스택에 삽입하고 방문처리
스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
2번의 과정을 더 이상 수행할 수 없을 떄까지 반복한다.

코테에서는 관행적으로 node의 번호가 낮은 순서부터 처리

코드로 표현

def dfs(graph, v, visited):
	# 현재 노드를 방문 처리 
    vistied[v] =True
    print(v, end=' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문 
    for i in graph[v]:
    	if not visited[i]:
        	dfs(graph, i,visted)
            
graph =[[],
		[2,3,8],
        [1,7],
        [1,4,5],
        [3,5],
        [3,4],
        [7],
        [2,6,8],
        [1,7]]

visited = [False] * 9 
dfs(graph, 1, visited)

BFS 구현

bfs는 너비 우선 탐색이다. 즉 가까운 노드부터 탐색하는 알고리즘이다.
BFS는 FIFO인 큐를 이용하는 것이 정석이다. 인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행한다.

탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리 한다.
2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

deque 라이브러리를 사용하면 수행시간이 O(N)이다.

from collections import deque

#BFS 메서드 정의 
def bfs(graph, start, visited):
	#큐 구현을 위해 deque라이브러리 사용
    queue = deque([start])
    #현재 노드를 방문 처리 
    visited[start] = True
    
    #큐가 빌때 까지 반복
    while deque:
    	v= queue.popleft()
        print(v,end=' ')
        
        #해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입 
        for i in graph[v]:
        	if not visited[i]:
            	queue.append(i)
                visited[i] =True

graph =[[],
		[2,3,8],
        [1,7],
        [1,4,5],
        [3,5],
        [3,4],
        [7],
        [2,6,8],
        [1,7]]

visited = [False] * 9 

bfs(graph, 1, visited)