이진 탐색 (Binary Search)

멋쟁이토마토·2024년 3월 10일
0

Algorithm

목록 보기
2/4
post-thumbnail

순차 탐색

리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법

✅ 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용

✅ 리스트 내에 데이터가 아무리 많아도 시간만 충분하다면 항상 원하는 데이터를 찾을 수 있음


💡순차 탐색 코드 구현

def sequential_search(n, target, array) :
	# 각 원소를 하나씩 확인
	for i in range(n) :
		# 현재의 원소가 찾고자 하는 원소와 동일할 경우
		if array[i] == target :
        	# 현재의 위치 반환(인덱스는 0부터 시작하므로 1 더하기)
			return i + 1       

input_data = input().split()
n = int(input_data[0]      # 원소의 개수
target = input_data[1]     # 찾고자 하는 문자열

array = input().split()

# 순차 탐색 수행 결과 출력
print(sequential_search(n, target, array))

✔ 순차 탐색의 시간복잡도
데이터 정렬 여부와 상관없이 가장 앞에 있는 원소부터 하나씩 확인해야 한다는 특징이 있다. 따라서 데이터 개수가 N개일 때 최대 N번의 비교 연산이 필요하므로 순차 탐색의 최악의 경우 시간 복잡도는 O(N)O(N)


이진 탐색

정렬되어 있는 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법

✅ 데이터가 무작위일 때는 사용❌

✅ 이미 정렬되어 있다면 매우 빠르게 데이터 찾을 수 있음

✅ 시작점, 끝점, 중간점을 이용하여 탐색 범위를 설정

  찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교하여 원하는 데이터 찾기!


📌 Example
정렬되어 있는 데이터에서 4 찾기!

📍 시작점 : 0 / 끝점 : 9 / 중간점 : 4 ((0+9)2\frac{(0 + 9)}2, 소수점 이하 제거)

중간점의 데이터는 8이므로 찾으려는 수 4보다 크다
➡ 끝점을 옮겨서 범위를 줄여야겠다!
➡ 8 이후의 값은 8보다 크므로 8보다 한 칸 앞으로 끝점을 옮긴다.
end = mid - 1

📍 시작점 : 0 / 끝점 : 3 / 중간점 : 1 ((0+3)2\frac{(0 + 3)}2, 소수점 이하 제거)

중간점의 데이터는 2이므로 찾으려는 수 4보다 작다
➡ 시작점을 옮겨서 범위를 줄여야겠다!
➡ 2 이하의 값은 2보다 작으므로 2보다 한 칸 뒤로 시작점을 옮긴다.
start = mid + 1

📍 시작점 : 2 / 끝점 : 3 / 중간점 : 2 ((2+3)2\frac{(2 + 3)}2, 소수점 이하 제거)

중간점의 데이터와 찾으려는 값이 같으므로 탐색을 종료한다!


💡이진 탐색 코드 구현

  ✏ 재귀 함수 사용

def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2

    # 찾은 경우 중간점 안덱스 반환
    if array[mid] == target:
        return mid
    
    # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
    elif array[mid] > target:
        return binary_search(array, target, start, mid - 1)
    
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
    else:
        return binary_search(array, target, mid + 1, end)

  ✏ 반복문 사용

def binary_search(array, target, start, end):
    while start <= end:
        mid = (start+end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif array[mid] > target:
            end = mid - 1

        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        else:
            start = mid + 1
    return None

✔ 이진 탐색의 시간복잡도

한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어듦 ➡ O(logN)O(logN)
이진 탐색은 한 단계를 고칠 때마다 확인하는 원소가 평균적으로 절반으로 줄어든다.


💡 백준 [1920] 수 찾기

이진 탐색 사용

n = int(input())
n_list = list(map(int, input().split()))
n_list.sort()

m = int(input())
m_list = list(map(int, input().split()))


def binary_search(target, data):
    start = 0
    end = n-1
    
    while start <= end:
        mid = (start + end) // 2
        
        if data[mid] == target:
            return 1
        elif data[mid] < target:
            start = mid + 1
        else:
            end = mid - 1
    return 0

for tg in m_list:
    if binary_search(tg, n_list):
        print(1)
    else:
        print(0)

별 다른 풀이없이 이진탐색 코드 그대로 사용해주면 되는데, 이진탐색을 사용할 때 꼭 sort()를 해야한다는 것만 기억하면 될 것 같다.

  • 찾는 값과 data[mid]가 같은 경우라면 값을 찾은 것!
  • data[mid] < target 이라면 내가 찾는 값이 더 크니까 범위를 mid 뒤로 바꿔주기 위해 start = mid + 1로 설정
  • data[mid] > target 이라면 내가 찾는 값이 더 작으니까 end 범위를 mid 앞으로 바꿔줘야 한다! end = mid - 1로 설정

이진 탐색 사용 ❌ (in 사용)

n = int(input())
n_list = set(map(int, input().split()))

m = int(input())
m_list = list(map(int, input().split()))

for num in m_list:
    if num in n_list:
        print(1)
    else:
        print(0)

n_list를 list로 한다면 시간 초과가 발생한다. list(map(int, input().split())
set(map(int, input().split())으로 하면 시간 초과없이 정답으로 처리된다!

profile
better than yesterday !

0개의 댓글