정렬

hyejinkwon·2023년 2월 9일
0

Algorithm

목록 보기
2/5

정렬 알고리즘

정렬(Sorting)이란 데이터를 특정한 기준에 따라 순서대로 나열하는 것


선택 정렬

처리되지 않은 데이터 중 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸는 것을 반복

이중 반복문 활용하여 매번 가장 작은 데이터 탐색

7 5 9 0 3 1 6 2 4 8

0 5 9 7 3 1 6 2 4 8

0 1 9 7 3 5 6 2 4 8

0 1 2 7 3 5 6 9 4 8

0 1 2 3 7 5 6 9 4 8

0 1 2 3 4 5 6 9 7 8

0 1 2 3 4 5 6 9 7 8

0 1 2 3 4 5 6 9 7 8

0 1 2 3 4 5 6 7 9 8

0 1 2 3 4 5 6 7 8 9

선택정렬 소스코드

array = [7,5,9,0,3,1,6,2,4,8]

for i in range(len(array)) :
    min_index = i
    for j in range(i+1, len(array)) :
        if array[j] < array[min_index] :
            min_index = j    
    array[i], array[min_index] = array[min_index], array[i] # swap
    print(array)

선택정렬은 N번 만큼 가장 작은 수를 찾아 맨 앞으로 보내야 함.

구현 방식에 따라 사소한 오차가 있을 수 있지만, 전체 연산 횟수는

N+(N1)+(N2)++2N + (N-1) + (N-2) +… + 2

이므로 (N2+N2)(N^2+N-2)로 표현, 즉 빅오 표기법에 따라 O(N2)O(N^2)


삽입 정렬

처리되지 않은 데이터를 하나씩 골라 적절한 위치에 삽입
→ 앞쪽의 원소들 정렬되어 있다고 가정.

  • 선택 정렬에 비해 구현 난이도가 높지만, 일반적으로 더 효율적으로 동작함.

7 / 5 9 0 3 1 6 2 4 8

5 7 / 9 0 3 1 6 2 4 8

5 7 9 / 0 3 1 6 2 4 8

0 5 7 9 / 3 1 6 2 4 8

0 3 5 7 9 / 1 6 2 4 8

0 1 3 5 7 9 / 6 2 4 8

0 1 3 5 6 7 9 / 2 4 8

0 1 2 3 5 6 7 9 / 4 8

0 1 2 3 4 5 6 7 9 / 8

0 1 2 3 4 5 6 7 8 9

삽입정렬 소스코드

array = [7,5,9,0,3,1,6,2,4,8]

for i in range(len(array)) :
    for j in range(i,0, -1) : # index i부터 1까지 1씩 감소하며 반복하는 문법
        if array[j] < array[j-1] :
            print(array[j], j)
            array[j] , array[j-1] = array[j-1] , array[j]
        else : # 자신보다 작은 데이터 만나면 그 위치에서 멈춤
            break
print(array)

삽입 정렬의 시간 복잡도 O(N2)O(N^2)

선택정렬과 마찬가지로 2중 for문 이용

삽입 정렬현재 리스트의 데이터가 거의 정렬되어 있는 상태라면 매우 빠르게 동작 !

  • 최선의 경우 O(N)O(N)의 시간복잡도

퀵 정렬

기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸는 방법

  • 기준 데이터에서 오른쪽으로 큰 값 결정
  • 기준 데이터의 맨끝에서 왼쪽으로 작은 값 결정
  • 두 개를 서로 swap
  • 이때, 위치가 서로 엇갈린다면, 작은 데이터 값의 위치와 Pivot값의 위치를 바꿔줌

일반적인 상황에서 가장 많이 사용되는 정렬 알고리즘 중 하나
병합 정렬과 더불어 대부분의 프로그래밍 언어의 정렬 라이브러리의 근간이 되는 알고리즘
가장 기본적인 퀵 정렬은 첫 번째 데이터(Pivot)로 설정

5 7 9 0 3 1 6 2 4 8

5 4 9 0 3 1 6 2 7 8

5 4 2 0 3 1 6 9 7 8 (위치 엇갈림)

1 4 0 2 3 5 6 9 7 8 ( pivot 기준으로 왼쪽은 모두 작은 값, 오른쪽은 모두 큰 값)

  • 이를 분할, partition이라고 함.

왼쪽 데이터 묶음 정렬에 대해 다시 퀵정렬 수행


1 4 0 2 3

1 0 4 2 3 ( 위치 엇갈림)

0 1 4 2 3

….

퀵 정렬 소스코드 1

# 퀵 정렬

array = [5,7,9,0,3,1,6,2,4,8]

def quick_sort(array, start, end) :
    if start >= end : # 원소가 한 개라면 종료
        return
    pivot = start # 피벗 첫 번째 원소
    left = start + 1 # left 시작 한칸 옆
    right = end # right은 끝
    
    while left <= right : 
        # 피벗 보다 큰 데이터 찾을 때 까지
        while left<= end and array[left] <= array[pivot] :
            left += 1
        # 피벗 보다 작은 데이터 찾을 때 까지
        while right > start and array[right] >= array[pivot] :
            right -= 1
        
        # 위치가 엇갈린다면 작은 값과 pivot값 swap
        if left > right :
            array[right] , array[pivot] = array[pivot], array[right]
        else : # 엇갈리지 않았다면 작은 값 큰 값 swap
            array[left], array[right] = array[right], array[left]

    quick_sort(array, start, right - 1)
    quick_sort(array, right+1, end)

quick_sort(array, 0 , len(array) -1)
print(array)

퀵 정렬 소스코드 2

# 퀵 정렬

array = [5,7,9,0,3,1,6,2,4,8]

def quick_sort(array) :
    # 리스트가 하나의 원소만 담고 있다면 종료
    if len(array) <= 1 :
        return array
    pivot = array[0]
    tail = array[1:] # pivot 제외 리스트

    left_side = [x for x in tail if x <= pivot] # 분할 왼쪽 큰 값 찾기
    right_side = [x for x in tail if x > pivot] # 분할 오른쪽 작은 값 찾기

    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

퀵 정렬이 빠른 이유 : 직관적인 이해

이상적인 경우 분할이 절반씩 일어난다면 전체 연산 횟수로 O(NlogN)O(NlogN)

너비 X 높이 = NlogN=NlogNN * logN = NlogN 퀵 정렬은 평균 O(NlogN)O(NlogN) 시간 복잡도

이미 정렬되어 있는 배열의 경우, 분할이 계속해서 이루어지기 때문에
최악의 경우 O(N2)O(N^2)의 시간복잡도


계수 정렬

특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠르게 동작하는 정렬 알고리즘

  • 계수 정렬은 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때 사용 가능

데이터의 개수가 N 데이터(양수)중 최대값 K일 때 최악의 경우에도 O(N+K)O(N+K) 시간복잡도 보장

7 5 9 0 3 1 6 2 9 1 4 8 0 5 2

  • 인덱스 0 1 2 3 4 5 6 7 8 9
  • 갯수 2 2 2 1 1 2 1 1 1 2

결과확인 : 리스트의 첫 번째 데이터부터 하나씩 그 값 만큼 반복하여 인덱스 출력

출력결과 : 0 0 1 1 2 2 3 4 5 5 6 7 8 9 9

계수 정렬 소스코드

# 계수 정렬

array = [7,5,9,0,3,1,6,2,9,1,4,8,0,5,2]
count = [0] * (max(array)+1)

for i in range(len(array)) :
    count[array[i]] += 1 # 각 데이터에 해당하는 인덱스 값 증가

for i in range(len(count)) : # 각 index가 
    for j in range(count[i]) : # 몇 번 중복해서 등장했는지 출력
        print(i, end= " ")

계수 정렬의 시간 복잡도, 공간 복잡도 모두 O(N+K)O(N+K)

때에 따라 심각한 비효율성 초래..

  • 데이터가 0, 999,999 단 2개로 존재한다면..

계수 정렬은 동일한 값을 가지는 데이터가 여러 개 등장할 때 효과적으로 사용 가능

  • 성적, 100점 맞은 학생이 여러 명 → 계수 정렬 유리

정렬 알고리즘 총 정리

정렬 알고리즘평균 시간 복잡도공간 복잡도특징
선택 정렬O(N^2)O(N)아이디어가 매우 간단
삽입 정렬O(N^2)O(N)데이터가 거의 정렬되어 있을 때 가장 빠름
퀵 정렬O(NlogN)O(N)대부분의 경우에 적합하며, 충분히 빠름
계수 정렬O(N+K)O(N+K)데이터의 크기가 한정되어 있는 경우에만 사용가능 + 매우빠르게 동작

정렬 Library

from random import randint
import time

array = []
for _ in range(10000) :
    array.append(randint(1,100))

# 선택 정렬 프로그램 성능 측정
start_time = time.time()

# 선택 정렬
for i in range(len(array)) :
    min_index = i
    for j in range(i+1, len(array)):
        if array[min_index] > array[j] : 
            min_index = j
    array[i], array[min_index] = array[min_index], array[i]

# 종료
end_time = time.time()
print("선택 종료 수행 시간 : ", end_time - start_time)
# 4.1207435초
from random import randint
import time

array = []
for _ in range(10000) :
    array.append(randint(1,100))

# 선택 정렬 프로그램 성능 측정
start_time = time.time()

# 정렬 라이브러리
array.sort()

# 측정 종료
end_time = time.time()

print("라이브러리 성능 측정 : ",end_time-start_time) 
# 0.0009973초
from random import randint
import time

array = []
for _ in range(10000) :
    array.append(randint(1,100))

# 선택 정렬 프로그램 성능 측정
start_time = time.time()

# 정렬 라이브러리
array.sort()

# 측정 종료
end_time = time.time()

print("라이브러리 성능 측정 : ",end_time-start_time) 
# 0.0009973초
array = [("바나나",2) , ("사과",5), ("당근",3)]

def setting(data) :
	return data[1]

result = sorted(data, setting)
print(result)

0개의 댓글