동빈나 알고리즘 정리3

송병훈·2022년 8월 21일

그리디 알고리즘

현재 상황에서 가장 좋은 것만 고르는 방법 을 의미한다.
일반적인 그리디 알고리즘은 문제를 풀기 위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구한다.
그리디 해법은 그 정당성 분석이 중요하다.
단순히 가장 좋아 보이는 것을 반복적으로 선택해도 최적의 해를 구할 수 있는지 검토한다.
일반적인 상황에서 그리디 알고리즘은 최적의 해를 보장할 수 없을 때가 많다.
하지만 코테에서의 그리디 문제는 최적의 해가 되는 상황에서 이를 추론하도록 출제된다.

구현

머릿속에 있는 알고리즘을 소스코드로 바꾸는 과정
코테에서 구현 문제란, 풀이를 떠올리는 것은 쉽지만 소스코드로 옮기기 어려운 문제를 말한다.
알고리즘은 간단한데 코드가 지나칠 만큼 길어지는 문제
실수 연산을 다루고, 특정 소수점 자리까지 출력해야 하는 문제
문자열을 특정한 기준에 따라서 끊어 처리해야 하는 문제
적절한 라이브러리를 찾아서 사용해야 하는 문제
일반적으로 알고리즘 문제에서의 2차원 공간은 행렬 의 의미로 사용된다.
시뮬레이션 및 완전탐색 문제에서는 2차원 공간에서의 방향벡터가 자주 활용된다.

# 동, 북, 서, 남 => 이런식으로 2차원 배열에서 공간을 이동하도록 할 수 있다.
dx = [0,-1,0,1]
dy = [1,0,-1,0]

# 현재 위치
x, y = 2, 2

for i in range(4):
    # 다음 위치
    nx = x + dx[i]
    ny = y + dy[i]
    print(nx, ny)

정렬 알고리즘

정렬(Sorting)이란 데이터를 특정한 기준에 따라 순서대로 나열하는 것을 말한다.
일반적으로 문제 상황에 따라서 적절한 정렬 알고리즘이 공식처럼 사용된다.

선택 정렬

처리되지 않은 데이터 중에서 가장 작은 데이터를 선택 해 맨 앞에 있는 데이터와 바꾸는 것을 반복한다.

arr = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(arr)):
    min_index = i	# 가장 작은 원소의 인덱스
    for j in range(i+1, len(arr)):
        if arr[min_index] > arr[j]:
            min_index = j	# 가장 작은 수를 찾아냄
    arr[i], arr[min_index] = arr[min_index], arr[i]	# 맨 앞의 원소와 가장 작은 원소의 값을 바꾼다.

print(arr)

선택정렬은 N번 만큼 가장 작은 수를 찾아서 맨 앞으로 보내야 한다.
구현방식에 따라서 사소한 오차는 있을 수 있지만, 전체 연산 횟수는 다음과 같다.

	N + (N-1) + (N-2) + ... + 2

이는 (N²+N-2) / 2 로 표현할 수 있는데, 빅오 표기법에 따라서 O(N²) 이라고 작성합니다.

삽입 정렬

처리되지 않은 데이터를 하나씩 골라 적절한 위치에 삽입한다.
선택정렬에 비해 구현 난이도가 높지만, 일반적으로 더 효율적으로 동작한다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1): # 인덱스 i부터 1까지 1씩 감소하며 반복하는 문법
        if array[j] < array[j - 1]: # 한 칸씩 왼쪽으로 이동
            array[j], array[j - 1] = array[j - 1], array[j]
        else: # 자기보다 작은 데이터를 만나면 그 위치에서 멈춤
            break

print(array)

삽입정렬의 시간복잡도는 O(N²) 이며, 선택정렬과 마찬가지로 반복문이 두 번 중첩되어 사용된다.
삽입정렬은 현재 리스트의 데이터가 거의 정렬되어 있는 상태라면 매우 빠르게 동작한다.
- 최선의 경우 O(N) 의 시간복잡도를 가진다.

퀵 정렬 (?????)

기준 데이터를 설정하고, 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸는 방법이다.
일반적인 상황에서 가장 많이 사용된다.
병합 정렬과 더불어 대부분의 프로그래밍 언어의 정렬 라이브러리의 근간이 되는 알고리즘이다.
가장 기본적인 퀵 정렬은 첫 번째 데이터를 기준 데이터로 설정한다.

array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
    if start >= end: # 원소가 1개인 경우 종료
        return
    pivot = start # 피벗은 첫 번째 원소
    left = start + 1
    right = end
    while(left <= right):
        # 피벗보다 큰 데이터를 찾을 때까지 반복 
        while(left <= end and array[left] <= array[pivot]):
            left += 1
        # 피벗보다 작은 데이터를 찾을 때까지 반복
        while(right > start and array[right] >= array[pivot]):
            right -= 1
        if(left > right): # 엇갈렸다면 작은 데이터와 피벗을 교체
            array[right], array[pivot] = array[pivot], array[right]
        else: # 엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
            array[left], array[right] = array[right], array[left]
    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
    quick_sort(array, start, right - 1)
    quick_sort(array, right + 1, end)

quick_sort(array, 0, len(array) - 1)
print(array)

# 파이썬의 장점을 살려(컴프리핸션) 짧게 구현하기
array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    # 리스트가 하나 이하의 원소만을 담고 있다면 종료
    if len(array) <= 1:
        return array

    pivot = array[0] # 피벗은 첫 번째 원소
    tail = array[1:] # 피벗을 제외한 리스트

    left_side = [x for x in tail if x <= pivot] # 분할된 왼쪽 부분
    right_side = [x for x in tail if x > pivot] # 분할된 오른쪽 부분

    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬을 수행하고, 전체 리스트를 반환
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

퀵 정렬은 평균의 경우 O(NlogN) 의 시간복잡도를 가진다.
하지만 최악의 경우 O(N²) 의 시간복잡도를 가진다.

계수 정렬

특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠르게 동작하는 정렬 알고리즘
- 계수 정렬은 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때 사용 가능하다.
데이터의 개수가 N, 데이터(양수) 중 최댓값이 K일 때 최악의 경우에도 수행시간 O(N+K)를 보장한다.

# 모든 원소의 값이 0보다 크거나 같다고 가정
array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
# 모든 범위를 포함하는 리스트 선언 (모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)

for i in range(len(array)):
    count[array[i]] += 1 # 각 데이터에 해당하는 인덱스의 값 증가

for i in range(len(count)):	# 리스트에 기록된 정렬 정보 확인. (가장 큰 수 K 만큼 반복)
    for j in range(count[i]):	# 그 인덱스에 기록되어 있는 값 만큼 반복 => 총, 데이터의 개수 N 만큼 반복한다. => N + K
        print(i, end=' ') # 띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력

계수 정렬의 시간 복잡도와 공간 복잡도는 모두 O(N+K)다.
계수 정렬은 때에 따라서 심각한 비효율성을 초래할 수 있다.
ex) 데이터가 0과 999,999 단 2개만 존재하는 경우 => 데이터는 2개지만, 백만개의 인덱스를 만들어야 한다.
계수 정렬은 동일한 값을 가지는 데이터가 여러 개 등장할 때 효과적으로 사용할 수 있다.
ex) 성적의 경우 동일한 점수를 맞은 학생이 여러 명일 수 있기 때문에 계수 정렬이 효과적이다.

송병훈

성실하고 꼼꼼하게

이전 포스트

동빈나 알고리즘 정리2

다음 포스트

동빈나 알고리즘 정리3

그리디 알고리즘

구현

정렬 알고리즘

선택 정렬

삽입 정렬

퀵 정렬 (?????)

계수 정렬

동빈나 알고리즘 정리2

동빈나 알고리즘 정리 4

0개의 댓글