탐색이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 말함
대표적인 그래프 탐색 알고리즘으로는 DFS와 BFS가 있다
먼저 들어온 데이터가 나중에 나가는(LIFO)의 자료구조이다.
입구와 출구가 동일한 형태로 스택을 시각화할 수 있다.
스택 구현 예제
stack = []
# 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()
print(stack) # 최하단 원소부터 출력
print(stack[::-1]) # 최상단 원소부터 출력
먼저 들어 온 데이터가 먼저 나가는 형식(FIFO)의 자료구조이다
큐는 입구와 출구가 모두 뚫려 있는 터널과 같은 형태로 시각화 할 수 있다.
큐 구현 예제
from collections import deque
# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque()
# 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()
queue.append(1)
queue.append(4)
queue.popleft()
print(queue) # 먼저 들어온 순서대로 출력
queue.reverse() # 다음 출력을 위해 역순으로 바꾸기
print(queue) # 나중에 들어온 원소부터 출력
재귀 함수란 자기 자신을 다시 호출하는 함수를 의미한다
단순한 형태의 재귀 함수 예제
재귀 함수를 호출합니다 라는 문자열을 무한히 출력한다.
어느정도 출력하다가 최대 재귀 깊이 초과 메세지가 출력된다.
재귀함수 구현 예시
def recursive_function():
print('재귀 함수를 호출합니다')
recursive_function()
recursive_function()
재귀 함수를 문제 풀이에서 사용할 떄는 재귀 함수의 종료 조건을 반드시 명시해야함
종료 조건을 제대로 명시하지 않으면 함수가 무한히 호출될 수 있다
종료 조건을 포함한 재귀 함수 예제
def recursive_function(i):
# 100번째 호출을 했을 때 종료되도록 종료 조건 명시
if i== 100:
return
print(i, '번째 재귀함수에서', i + 1, '번째 재귀함수를 호출합니다')
recursive_function(i + 1)
print(i, '번째 재귀함수를 종료합니다')
recursive_function(1)
팩토리얼 구현 예제
# 반복적으로 구현한 n!
def factorial_iterative(n):
result = 1
# 1부터 n까지의 수를 차례대로 곱하기
for i in range(1, n + 1):
result *= i
return result
# 재귀적으로 구현한 n!
def factorial_recursive(n):
if n <= 1: # n이 1 이하인 경우 1을 반환
return 1
# n! = n * (n - 1)!를 그대로 코드로 작성하기
return n * factorial_recursive(n - 1)
# 각각의 방식으로 구현한 n! 출력(n = 5)
print('반복적으로 구현:', factorial_iterative(5))
print('재귀적으로 구현:', factorial_recursive(5))
최대공약수 계산 (유클리드 호제법) 예제
두 개의 자연수에 대한 최대공약수를 구하는 대표적인 알고리즘으로는 유클리드 호제법이 있다.
유클리드 호제법
두 자연수 A,B에 대해서 (A > B) A를 B로 나눈 나머지를 R이라고 하자
이 때 A와 BA의 최대공약수는 B와 R의 최대공약수와 같다
유클리드 호제법의 아이디어를 그대로 재귀 함수로 작성할 수 있다.
def gcd(a, b):
if a % b == 0:
return b
else:
return gcd(b, a % b)
print(gcd(192, 162))
재귀 함수를 잘 활용하면 복잡한 알고리즘을 간결하게 작성할 수 있다.
모든 재귀함수는 반복문을 이용하여 동일한 기능을 구현할 수 있다
재귀 함수가 반복문보다 유리한 경우도 있고 불리한 경우도 있다
컴퓨터가 함수를 연속적으로 호출하면 컴퓨터 메모리 내부의 스택 프레임에 쌓인다
그래서 스택을 사용할 때 구현상 스택 라이브러리 대신에 재귀 함수를 이용하는 경우가 많다.
DFS는 깊이 우선 탐색이라고도 부르며 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.
이동에 제약이 있거나 이동마다 가중치가 붙는 탐색문제는 DFS로 푸는 것이 유리하다.
DFS는 스택 자료구조(혹은 재귀 함수)를 이용하며, 구체적인 동작 과정은 다음과 같다.
1. 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
2. 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있으면 그 노드를 스택에 넣고 방문 처리한다.
3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복한다.
DFS 예제
# DFS 함수 정의
def dfs(graph, v, visited):
# 현재 노드를 방문 처리
visited[v] = True
print(v, end=' ')
# 현재 노드와 연결된 다른 노드를 재귀적으로 방문
for i in graph[v]:
if not visited[i]:
dfs(graph, i, visited)
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7]
]
# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9
# 정의된 DFS 함수 호출
dfs(graph, 1, visited)
BFS는 너비 우선 탐색이라고도 부르며, 그래프에서 가까운 노드로부터 우선적으로 탐색하는 알고리즘이다.
최소 비용 문제나 이동에 가중치가 없는 탐색 문제는 BFS로 푸는 것이 유리하다.
BFS는 큐 자료구조를 이용하며, 구체적인 동작 과정은 다음과 같다
1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 합니다.
2. 큐에서 노드를 꺼낸 뒤에 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리한다.
3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복한다.
BFS 예제
from collections import deque
# BFS 함수 정의
def bfs(graph, start, visited):
# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque([start])
# 현재 노드를 방문 처리
visited[start] = True
# 큐가 빌 때까지 반복
while queue:
# 큐에서 하나의 원소를 뽑아 출력
v = queue.popleft()
print(v, end=' ')
# 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
for i in graph[v]:
if not visited[i]:
queue.append(i)
visited[i] = True
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7]
]
# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9
# 정의된 BFS 함수 호출
bfs(graph, 1, visited)
음료수 얼려 먹기 문제
import sys
from collections import deque
n,m = map(int,sys.stdin.readline().split())
graph = [list(map(int,sys.stdin.readline().strip())) for _ in range(n)]
dx = [-1,1,0,0]
dy = [0,0,-1,1]
def bfs(a,b):
queue = deque()
visit= [[0 for i in range(m)] for _ in range(n)]
queue.append([a,b])
visit[a][b] = 1
while queue:
x,y = queue.popleft()
for i in range(4):
nx = x + dx[i]
ny = y + dy[i]
if 0 <= nx < n and 0 <= ny < m and visit[nx][ny] == 0:
if graph[nx][ny] == 0:
graph[nx][ny] = 1
queue.append([nx,ny])
visit[nx][ny] = 1
cnt = 0
for i in range(n):
for j in range(m):
if graph[i][j] == 0:
bfs(i,j)
cnt +=1
print(cnt)
미로 탈출 문제
from collections import deque
import sys
n,m = map(int,sys.stdin.readline().split())
li = []
for _ in range(n):
li.append(list(map(int,input())))
dx = [-1,1,0,0]
dy = [0,0,-1,1]
def bfs():
queue = deque()
queue.append((0,0)) # queue에 시작점 넣기
while queue:
x,y = queue.popleft() # 가장 먼저 들어온 순서대로 queue에서 나간다.
for i in range(4): # 상하좌우
nx = x + dx[i]
ny = y + dy[i]
if 0 <= nx < n and 0 <= ny < m:
if li[nx][ny] == 1:
li[nx][ny] = li[x][y] + 1
queue.append((nx,ny))
else:
continue
return li[n-1][m-1] # 가장 마지막 까지의 최단 거리 반환
print(bfs())