이진 탐색
[2021 이코테] 5. 이진 탐색
이진 탐색
- 순차 탐색: 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 확인하는 방법
- 이진 탐색: 정렬되어 있는 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법
- 이진 탐색은 시작점, 끝점, 중간점을 이용하여 탐색 범위를 설정
이진 탐색의 시간 복잡도
- 단계마다 탐색 범위를 2로 나누는 것과 동일하므로 연산 횟수는 log₂N에 비례
- 예를 들어 초기 데이터 개수가 32개일 때, 이상적으로 1단계를 거치면 16개 가량의 데이터만 남음
- 2단계를 거치면 8개 가량의 데이터만 남음
- 3단계를 거치면 4개 가량의 데이터만 남음
- 다시 말해 이진 탐색은 탐색 범위를 절반씩 줄이며, 시간 복잡도는 O(logN)을 보장
def binary_search(array, target, start, end):
if start > end:
return None
mid = (start + end) // 2
if array[mid] == target:
return mid
elif array[mid] > target:
return binary_search(array, target, start, mid - 1)
else:
return binary_search(array, target, mid +1, end)
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))
result = binary_search(array, target, 0, n - 1)
if result == None:
print("원소가 존재하지 않습니다.")
else:
print(result + 1)
>>> 10 7 ↲
>>> 1 3 5 7 9 11 13 15 17 19 ↲
>>> 4
>>> 10 7 ↲
>>> 1 3 5 6 9 11 13 15 17 19 ↲
>>> 원소가 존재하지 않습니다.
파이썬 이진 탐색 라이브러리
bisect_left(a, x)
- 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 왼쪽 인덱스를 반환
bisect_right(a, x)
- 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 오른쪽 인덱스를 반환
from bisect import bisect_left, bisect_right
a = [1, 2, 4, 4, 8]
x = 4
print(bisect_left(a, x))
print(bisect_right(a, x))
>>> 2
>>> 4
from bisect import bisect_left, bisect_right
def count_by_range(a, left_value, right_value):
right_index = bisect_right(a, right_value)
left_index = bisect_left(a, left_value)
return right_index - left_index
a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9]
print(count_by_range(a, 4, 4))
print(count_by_range(a, -1, 3))
>>> 2
>>> 6
파라메트릭 서치 (Parametric Search)
- 파라메트릭 서치란 최적화 문서를 결정 문제("예" 혹은 "아니오")로 바꾸어 해결하는 기법
- 예시: 특정한 조건을 만족하는 가장 알맞은 값을 빠르게 찾는 최적화 문제
- 일반적으로 코딩 테스트에서 파라메트릭 서치 문제는 이진 탐색을 이용하여 해결할 수 있음
문제: 떡볶이 떡 만들기
문제 해결 아이디어
- 적절한 높이를 찾을 때까지 이진 탐색을 수행하여 높이 H를 반복해서 조정하면 됨
- '현재 이 높이로 자르면 조건을 만족할 수 있는가?'를 확인한 뒤에 조건의 만족 여부("예" 혹은 "아니오")에 따라서 탐색 범위를 좁혀서 해결할 수 있음
- 절단기의 높이는 0부터 10억까지의 정수 중 하나
- 이렇게 큰 탐색 범위를 보면 가장 먼저 이진 탐색을 떠올려야 함
- 이진 탐색 과정을 반복하면 답을 도출할 수 있음
- 중간점의 값은 시간이 지날수록 '최적화된 값'이 되기 때문에, 과정을 반복하면서 얻을 수 있는 떡의 길이합이 필요한 떡의 길이보다 크거나 같을 때마다 중간점의 값을 기록하면 됨
n, m = list(map(int, input().split(' ')))
array = list(map(int, input().split()))
start = 0
end = max(array)
result = 0
while (start <= end):
total = 0
mid = (start + end) // 2
for x in array:
if x > mid:
total += x - mid
if total < m:
end = mid - 1
else:
result = mid
start = mid + 1
print(result)
문제: 정렬된 배열에서 특정 수의 개수 구하기
문제 해결 아이디어
- 시간 복잡도 O(logN)으로 동작하는 알고리즘을 요구
- 일반적인 선형 탐색(Linear Search)로는 시간 초과 판정을 받음
- 하지만 데이터가 정렬되어 있기 때문에 이진 탐색을 수행할 수 있음
- 특정 값이 등장하는 첫번째 위치와 마지막 위치를 찾아 위치 차이를 계산해 문제를 해결할 수 있음
from bisect import bisect_left, bisect_right
def count_by_range(array, left_value, right_value):
right_index = bisect_right(array, right_value)
left_index = bisect_left(array, left_value)
return right_index - left_index
n, x = map(int, input().split())
array = list(map(int, input().split())
count = count_by_range(array, x, x)
if count == 0:
print(-1)
else:
print(count)