*나동빈님의 이코테 2021강의 정리
이진 탐색 알고리즘
- 순차 탐색: 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 확인 하는 방법.
- 보통 정렬되지 않은 리스트에서 데이터를 찾아야할 때 사용, 데이터가 아무리 많아도 시간만 충분하다면 항상 원하는 데이터를 찾을 수 있음.
- 순차 탐색 코드
def sequential_search(n, target, array):
for i in range(n):
if array[i] == target:
return i + 1
return -1
print("생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.")
input_data = input().split()
n = int(input_data[0])
target = input_data[1]
print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.")
array = input().split()
print(sequential_search(n, target, array))
- 이진 탐색: 정렬되어 있는 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법.
- 이진 탐색은 시작점, 끝점, 중간점을 이용하여 탐색 범위 설정.
- 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있음.
시간복잡도
- 연산 횟수: log_2 N
- 시간복잡도: O(logN)
이진 탐색(Python) - 재귀적 구현
def binary_search(array, target, start, end):
if start>end:
return None
mid = (start+end) // 2
if array[mid] == target:
return mid
elif array[mid] > target:
return binary_search(array,target, start, mid-1)
else:
return binary_search(array,target, mid+1, end)
n, target = list(map(int,input().split()))
array = lsit(map(int,input().split()))
result = binary_search(array, target, 0, n-1)
if result == None:
print('원소가 존재하지 않음')
else:
print(result+1)
이진 탐색(Python) - 반복문 구현
def binary_search(array, target, start, end):
while start <= end:
mid = (start + end) // 2
if array[mid] == target:
return mid
elif array[mid] > target:
end = mid-1
else:
start = mid+1
return None
n, target = list(map(int,(input().split()))
array = list(map(int,input().split()))
result = binary_search(array, target, 0, n-1)
if result == None:
print("원소가 존재하지 않습니다")
else:
print(result + 1)
이진 탐색(Java) - 재귀적 구현
import java.util.*;
public class Main {
public static int binarySearch(int[] arr, int target, int start, int end) {
if (start > end) return -1;
int mid = (start + end) / 2;
if (arr[mid] == target) return mid;
else if (arr[mid] > target) return binarySearch(arr, target, start, mid - 1);
else return binarySearch(arr, target, mid + 1, end);
}
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
int n = sc.nextInt();
int target = sc.nextInt();
int[] arr = new int[n];
for (int i = 0; i < n; i++) {
arr[i] = sc.nextInt();
}
int result = binarySearch(arr, target, 0, n - 1);
if (result == -1) {
System.out.println("원소가 존재하지 않습니다.");
}
else {
System.out.println(result + 1);
}
}
}
이진 탐색(Python) - 반복문 구현
import java.util.*;
public class Main {
public static int binarySearch(int[] arr, int target, int start, int end) {
while (start <= end) {
int mid = (start + end) / 2;
if (arr[mid] == target) return mid;
else if (arr[mid] > target) end = mid - 1;
else start = mid + 1;
}
return -1;
}
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
int n = sc.nextInt();
int target = sc.nextInt();
int[] arr = new int[n];
for (int i = 0; i < n; i++) {
arr[i] = sc.nextInt();
}
int result = binarySearch(arr, target, 0, n - 1);
if (result == -1) {
System.out.println("원소가 존재하지 않습니다.");
}
else {
System.out.println(result + 1);
}
}
}
파이썬 이진 탐색 라이브러리
- bisect_left(a,x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 왼쪽 인덱스를 반환
- bisec_right(a,x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 오른쪽 인덱스를 반환
from bisect import bisect_left, bisect_right
a = [1,2,4,4,8]
x = 4
print(bisect_left(a,x))
print(bisect_rigth(a,x))
2
4
값이 특정범위에 속하는 데이터 개수 구하기
from bisect import bisect_left, bisect_right
def count_by_range(a, left_value, right_value):
right_index = bisect_right(a, right_value)
left_index = bisect_left(a, left_value)
return right_index - left_index
a = [1,2,3,3,3,3,4,4,8,9]
print(count_by_range(a,4,4)
print(count_by_range(a,-1,3))
Parametric Search (파라메트릭 서치)
- 최적화 문제를 결정 문제(yes or no)로 바꾸어 해결하는 기법
- e.g. 특정한 조건을 만족하는 가장 알맞은 값을 빠르게 찾는 최적화 문제
- 일반적으로 이진 탐색을 이용해서 해결 가능
문제 1: 떡볶이 떡 만들기
- 절단기 높이(H)를 지정하면 떡을 한번에 절단 -> 높이가 긴 떡은 H 위의 부분이 잘리고, 낮은 떡은 잘리지 않음
- e.g. 떡 높이: 19,14,10,17 / 절단기 높이: 15 / 잘린 떡 길이: 4,0,0,2 -> 손님은 6cm의 떡을 가져감
- 손님이 왔을 때 요청한 총 길이가 M일 때 적어도 M만큼의 떡을 얻기 위해 절단기에 설정할 수 있는 높이의 최댓값을 구하는 프로그램 작성
문제 해결 방법
- 적절한 높이를 찾을 때까지 이진탐색 수행 -> H를 반복해서 조정
- "현재 이 높이로 자르면 조건을 만족하느가?"를 확인한 뒤에 조건의 만족 여부(YES OR NO)에 따라서 탐색 범위를 좁혀서 해결
- 절단기의 높이는 0부터 10억까지의 정수 중 하나 -> 이렇게 큰 탐색범위는 먼저 이진탐색
- 중간점의 값은 시간이 지날수록 '최적화된 값'이 되기 때문에, 과정을 반복하면서 얻을 수 있는 떡의 길이 합이 필요한 떡의 길이보다 크거나 같을때마다 중간점의 값을 기록.
답안 (Python)
import sys
input = sys.stdin.readline
n,m = list(map(int,input().split(' ')))
array = list(map(int,input().split()))
start = 0
end = max(array)
result = 0
while(start<=end):
total = 0
mid = (start+end) // 2
for x in array:
if x>mid:
total += x - mid
if total < m:
end = mid-1
else:
result = mid
start = mid +1
print(result)
답안 (Java)
자바코드
문제 2: 정렬된 배열에서 특정 수의 개수 구하기
- N개의 원소를 포함하고 있는 수열이 오름차순으로 정렬되어있음
- 수열에서 x가 등장하는 횟수를 계산
- 시간복잡도 O(logN) 아니면 시간 초과
문제해결 방법
- 시간복잡도 O(logN) 요구 -> 선형 탐색(Linear Search)는 시간초과 판정
- 데이터가 정렬되어있기 때문에 이진탐색 수행 가능
답안 (Python)
import sys
from bisect import bisect_left, bisect_right
input = sys.stdin.readline
n,m = map(int,input().split())
array = list(map(int,input().split()))
def count_by_range(a,left_value, right_value):
right_idx = bisect_right(a,right_value)
left_idx = bisect_left(a,left_value)
return right_idx - left_idx
cnt = count_by_range(array,m,m)
if cnt == 0:
print(-1)
else:
print(cnt)