이진 탐색

jurin·2020년 12월 7일
0

알고리즘

목록 보기
7/8

이것이 취업을 위한 코딩 테스트다 with 파이썬 (나동빈 저) 의 책과 강의를 보고 정리한 글입니다.
강의 출처 : https://www.youtube.com/channel/UChflhu32f5EUHlY7_SetNWw

이진 탐색 알고리즘

순차 탐색 : 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 확인
이진 탐색 : 정렬되어 있는 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색. 시작점, 끝점, 중간점을 이용하여 탐색 범위 설정

ex) 정렬된 10개의 데이터 중 4 찾기
1. 시작점 0, 끝점 9, 중간점 4(소수점 이하 제거)

  1. 찾고자 하는 값과 중간점 비교해서 시작점 or 끝점을 옮김

  1. 2번과정 반복

시작점 = 중간점이고 위치를 찾아냈으므로 탐색을 마친다.

이진 탐색의 시간 복잡도

탐색 번위를 절반씩 줄이며 시간 복잡도는 O(logN)을 보장한다.

초기 데이터가 32개일 경우 1단계 후 16개, 2단계 후 8개, 3단계 후 4개의 데이터가 남음

이진 탐색 소스코드

  • 재귀 호출
# 이진 탐색 소스코드 구현 (재귀 함수)
def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    # 찾은 경우 중간점 인덱스 반환
    if array[mid] == target:
        return mid
    # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
    elif array[mid] > target:
        return binary_search(array, target, start, mid - 1)
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
    else:
        return binary_search(array, target, mid + 1, end)

# n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기
n, target = list(map(int, input().split()))
# 전체 원소 입력 받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n - 1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)
  • 반복문
# n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기
n, target = list(map(int, input().split()))
# 전체 원소 입력 받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n - 1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)
    
# 이진 탐색 소스코드 구현 (반복문)
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif array[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        else:
            start = mid + 1
    return None

파이썬 이진 탐색 라이브러리

bisect_left(a, d): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 왼쪽 인덱스를 반환

  • 값이 특정 범위에 속하는 데이터 개수 구하기
# 이진 탐색 라이브러리를 이용
# 값이 특정 범위에 속하는 데이터 개수 구하기
from bisect import bisect_left, bisect_right


def count_by_range(a, left_value, right_value):
    right_index = bisect_right(a, right_value)
    left_index = bisect_left(a, left_value)
    return right_index - left_index


a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9]

# 값이 4인 데이터 개수 출력
print(count_by_range(a, 4, 4))

# 값이 [-1, 3] 범위에 있는 데이터 개수 출력
print(count_by_range(a, -1, 3))

최적화 문제를 결정 문제('예' 혹은 '아니오')로 바꾸어 해결하는 기법. 파라메트릭 서치 문제는 이진 탐색을 이용하여 해결할 수 있다.
ex) 특정한 조건을 만족하는 가장 알맞은 값을 빠르게 찾는 최적화 문제

<문제> 떡볶이 떡 만들기

떡볶이 떡의 길이는 일정하지 않고 한 봉지 안에 들어가는 떡의 총 길이는 절단기로 잘라서 맞춰준다. 절단기에 높이(H)를 지정하면 줄지어진 떡을 절단하고 높이가 H보다 긴 떡은 H 위의 부분이 잘릴 것이고, 낮은 떡은 잘리지 않는다.

ex) 높이가 19, 14, 10, 17인 떡이 나란히 있고 H가 15일 경우 자른 뒤 떡은 15, 14, 10, 15가 된다. 잘린 떡의 길이는 차례대로 4, 0, 0, 2이고 총 6을 손님이 가져간다.

손님이 왔을 때 요청한 총 길이가 M일 때 적어도 M만큼의 떡을 얻기 위해 절단기에 설정할 수 있는 높이의 최댓값을 구하는 프로그램을 작성하시오.

[해결 아이디어]

  • 적절한 높이를 찾을 때까지 이진 탐색을 수행하여 높이 H를 반복해서 조정
  • 현재 이 높이가 만족하는가? 를 확인 후 조건의 만족 여부에 따라 탐색 범위 좁혀서 해결
  • 절단기의 높이는 0부터 10억까지의 정수 중 하나이므로 이렇게 큰 탐색 범위를 보면 가장 먼저 이진 탐색을 떠올려야 함

시작점을 중간점 +1 로 옮기고 새로 중간점을 설정한다.

이와 같은 과정 반복을 반복한다. 중간점의 값은 시간이 지날수록 '최적화된 값'이기 때문에 떡의 길이 합이 필요한 떡의 길이보다 크거나 같을 때마다 중간점의 값을 기록하면 된다.

# # 내풀이
# N, M = map(int, input().split())

# array = list(map(int, input().split()))

# array.sort(reverse=True)

# H = array[0]
# sum = 0

# for i in range(array[-1]):
#     for j in range(len(array)):
#         if H < array[j]:
#             sum += array[j] - H
#     if sum >= M:
#         break
#     else:
#         H -= 1
#         sum = 0
#         continue

# print(H)

# 떡의 개수, 요청한 떡의 길이
n, m = map(int, input().split())

# 각 떡의 개별 높이 정보를 입력
array = list(map(int, input().split()))

# 이진 탐색을 위한 시작점, 끝점 설정
start = 0
end = max(array)

# 이진 탐색(반복)
result = 0
while(start <= end):
    total = 0
    mid = ( start + end ) // 2
    for x in array:
        # 잘랐을 때 떡볶이 양
        if x > mid:
            total += x - mid
    # 떡볶이 양이 부족한 경우 오른쪽 부분 탐색
    if total < m:
        end = mid -1
    
    # 떡볶이 양이 충분한 경우 왼쪽 부분 탐색
    else:
        result = mid # 최대한 덜 잘랐을 때가 정답이므로, 여기서 result 기록
        start = mid + 1


print(result)

<문제> 정렬된 배열에서 특정 수의 개수 구하기

N개의 원소를 포함하고 있는 수열이 오름차순으로 정렬되어 있을 때 이 수열에서 x가 등장하는 횟수를 구하시오. 없다면 -1 출력. 단, 시간 복잡도 O(logN)으로 설계해야 한다.
ex) {1, 1, 2, 2, 2, 2, 3}일때 x = 2라면 4를 출력

입력 조건
첫째 줄 : N x
둘째 줄 : N개의 정수

[해결 아이디어]
시간 복잡도O(logN)을 요구하기 때문에 선형 탐색으로는 시간이 초과된다. 데이터가 정렬되어 있기 때문에 이진 탐색을 수행할 수 있다. 특정 값이 등장하는 첫 번째 위치와 마지막 위치를 찾아 위치 차이를 계산해 문제를 해결한다.

# # 나의 틀린 풀이

# # 정렬된 배열에서 특정 수의 개수 구하기
# N, x = map(int, input().split())

# array = list(map(int, input().split()))

# start = 0
# end = N - 1


# def count_x(array, start, end, target):
#     mid = (start + end) // 2
#     if start > end:
#         return None
#     elif array[mid] == target:
#         return array.count(array[mid])
#     elif array[mid] < target:
#         return count_x(array, mid + 1, end, target)
#     else:
#         return count_x(array, start, mid - 1, target)


# print(count_x(array, start, end, x))

from bisect import bisect_left, bisect_right

N, x = map(int, input().split())

array = list(map(int, input().split()))

def count_by_range(array, left_value, right_value):
    right_index = bisect_right(array, right_value)
    left_index = bisect_left(array, left_value)
    return right_index - left_index

count = count_by_range(array, x, x)

if count == 0:
    print(-1)
else:
    print(count)

count 함수는 시간복잡도가 N이다.

profile
anaooauc1236@naver.com

0개의 댓글

관련 채용 정보