기타 알고리즘 (소수 판별, 투 포인터, 구간 합)

shin·2022년 8월 2일

Python DataStructure & Algorithm

목록 보기

16/16

1. 하나의 수 소수 판별 알고리즘

1) 소수 판별 알고리즘 개요

소수 : 1보다 큰 자연수 중에서 1과 자기 자신을 제외한 자연수로는 나누어 떨어지지 않는 자연수
코딩 테스트에서는 어떠한 자연수가 소수인지 아닌지 판별해야 하는 문제가 자주 출제됨

2) 기본적인 알고리즘

# 소수 판별 함수 (2 이상의 자연수에 대하여)
def is_prime_number(x):
  # 2부터 x - 1까지의 모든 수를 확인하며
  for i in range(2, x):
    # x가 해당 수로 나누어 떨어진다면
    if x % i == 0:
      return False # 소수가 아님
  return True # 소수임

print(is_prime_number(4)) # False
print(is_prime_number(7)) # True

3) 기본적인 알고리즘 성능 분석

2부터 X - 1까지의 모든 자연수에 대하여 연산을 수행해야 함
모든 수를 하나씩 확인한다는 점에서 시간 복잡도는 O(X)

4) 약수의 성질

모든 약수가 가운데 약수를 기준으로 곱셈 연산에 대해 대칭을 이룸
- 예를 들어 16의 약수는 1, 2, 4, 8, 16임
- 이때 2 X 8 = 16은 8 X 2 = 16과 대칭
따라서 우리는 특정한 자연수의 모든 약수를 찾을 때 가운데 약수(제곱근)까지만 확인하면 됨
- 예를 들어 16이 2로 나누어 떨어진다는 것은 8로도 나누어 떨어진다는 것을 의미함
- 16의 제곱근인 4까지만 확인하면 됨

5) 개선된 알고리즘

import math

# 소수 판별 함수 (2 이상의 자연수에 대하여)
def is_prime_number(x):
  # 2부터 x의 제곱근까지의 모든 수를 확인하며
  for i in range(2, int(math.sqrt(x)) + 1):
    # x가 해당 수로 나누어 떨어진다면
    if x % i == 0:
      return False # 소수가 아님
  return True # 소수임

print(is_prime_number(4)) # False
print(is_prime_number(7)) # True

2. 다수의 소수 판별 알고리즘

1) 에라토스테네스의 체 알고리즘

특정한 수의 범위 안에 존재하는 모든 소수를 찾아야 할 때 에라토스테네스의 체 알고리즘을 사용함
다수의 자연수에 대하여 소수 여부를 판별할 때 사용하는 대표적인 알고리즘
에라토스테네스의 체는 N보다 작거나 같은 모든 소수를 찾을 때 사용함

2) 구체적인 동작 과정

2부터 N까지의 모든 자연수를 나열함
남은 수 중에서 아직 처리하지 않은 가장 작은 수 i를 찾음
남은 수 중에서 i의 배수를 모두 제거함 (i는 제거하지 않음)
더 이상 반복할 수 없을 때까지 2번과 3번 과정을 반복함

N = 26일 때, 최종적인 결과

3) 에라토스테네스의 체 알고리즘 구현

import math

n = 1000 # 2부터 1,000까지의 모든 수에 대하여 소수 판별
# 처음엔 모든 수가 소수(True)인 것으로 초기화(0과 1은 제외)
array = [True for i in range(n + 1)]

# 에라토스테네스의 체 알고리즘 수행
# 2부터 n의 제곱근까지의 모든 수를 확인하여
for i in range(2, int(math.sqrt(n)) + 1):
  if array[i] == True: # i가 소수인 경우(남은 수인 경우)
    # i를 제외한 i의 모든 배수를 지우기
    j = 2
    while i * j <= n:
      array[i * j] = False
      j += 1

# 모든 소수 출력
for i in range(2, n + 1):
  if array[i]:
    print(i, end = ' ')

2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 101 103 107 109 113 127 131 137 139 149 151 157 163 167 173 179 181 191 193 197 199 211 223 227 229 233 239 241 251 257 263 269 271 277 281 283 293 307 311 313 317 331 337 347 349 353 359 367 373 379 383 389 397 401 409 419 421 431 433 439 443 449 457 461 463 467 479 487 491 499 503 509 521 523 541 547 557 563 569 571 577 587 593 599 601 607 613 617 619 631 641 643 647 653 659 661 673 677 683 691 701 709 719 727 733 739 743 751 757 761 769 773 787 797 809 811 821 823 827 829 839 853 857 859 863 877 881 883 887 907 911 919 929 937 941 947 953 967 971 977 983 991 997

4) 에라토스테네스의 체 알고리즘 성능 분석

에라토스테네스의 체 알고리즘의 시간 복잡도는 사실상 선형 시간에 가까울 정도로 매우 빠름
- 시간 복잡도는 O(NloglogN)
에라토스테네스의 체 알고리즘은 다수의 소수를 찾아야 하는 문제에서 효과적으로 사용될 수 있음
하지만 각 자연수에 대한 소수 여부를 저장해야 하므로 메모리가 많이 필요함
- 10억이 소수인지 아닌지 판별해야 할 때 메모리 측면에서 매우 비효율적으로 동작할 수 있음

3. Two Pointers

1) 투 포인터 알고리즘

투 포인터 알고리즘은 리스트에 순차적으로 접근해야 할 때 두 개의 점의 위치를 기록하면서 처리하는 알고리즘을 의미함
흔히 2, 3, 4, 5, 6, 7번 학생을 지목해야 할 때 간단히 '2번부터 7번까지의 학생'이라고 부르곤 함
리스트에 담긴 데이터에 순차적으로 접근해야 할 때는 시작점과 끝점 2개의 점으로 접근할 데이터의 범위를 표현할 수 있음

2) 특정한 합을 가지는 부분 연속 수열 찾기 문제

N개의 자연수로 구성된 수열이 있습니다.
합이 M인 부분 연속 수열의 개수를 구해보세요.
수행 시간 제한은 O(N)입니다.

3) 문제 해결 아이디어

시작점(start)과 끝점(end)이 첫 번째 원소의 인덱스(0)를 가리키도록 함
현재 부분 합이 M과 같다면 카운트
현재 부분 합이 M보다 작다면 end를 1 증가시킴
현재 부분 합이 M보다 크거나 같다면 start를 1 증가시킴
모든 경우를 확인할 때까지 2번부터 4번까지의 과정을 반복

M = 5
[초기 단계] 시작점과 끝점이 첫 번째 원소의 인덱스를 가리키도록 함

현재의 부분합은 1이므로 무시함
현재 카운트 : 0

[Step 1] 이전 단계에서의 부분합이 1이었기 때문에 end를 1 증가시킴

현재의 부분합은 3이므로 무시함
현재 카운트 : 0

[Step 2] 이전 단계에서의 부분합이 3이었기 때문에 end를 1 증가시킴

현재의 부분합은 6이므로 무시함
현재 카운트 : 0

[Step 3] 이전 단계에서의 부분합이 6이었기 때문에 start를 1 증가시킴

현재의 부분합은 5이므로 카운트를 증가시킴
현재 카운트 : 1

[Step 4] 이전 단계에서의 부분합이 5이었기 때문에 start를 1 증가시킴

현재의 부분합은 3이므로 무시함
현재 카운트 : 1

[Step 5] 이전 단계에서의 부분합이 3이었기 때문에 end를 1 증가시킴

현재의 부분합은 5이므로 카운트를 증가시킴
현재 카운트 : 2

[Step 6] 이전 단계에서의 부분합이 5이었기 때문에 start를 1 증가시킴

현재의 부분합은 2이므로 무시함
현재 카운트 : 2

[Step 7] 이전 단계에서의 부분합이 2이었기 때문에 end를 1 증가시킴

현재의 부분합은 7이므로 무시함
현재 카운트 : 2

[Step 8] 이전 단계에서의 부분합이 7이었기 때문에 start를 1 증가시킴

현재의 부분합은 5이므로 카운트를 증가시킴
현재 카운트 : 3

4) 코드 예시

n = 5 # 데이터의 개수
m = 5 # 찾고자 하는 부분합
data = [1, 2, 3, 2, 5] # 전체 수열

count = 0
interval_sum = 0
end = 0

# start를 차례대로 증가시키며 반복
for start in range(n):
  # end를 가능한 만큼 이동시키기
  while interval_sum < m and end < n:
    interval_sum += data[end]
    end += 1
  # 부분합이 m일 때 카운트 증가
  if interval_sum == m:
    count += 1  
  interval_sum -= data[start]

print(count)

4. 구간 합 빠르게 계산하기

1) 구간 합 (Interval Sum)

구간 합 문제 : 연속적으로 나열된 N개의 수가 있을 때 특정 구간의 모든 수를 합한 값을 계산하는 문제
예를 들어 5개의 데이터로 구성된 수열 {10, 20, 30, 40, 50}이 있다고 가정하면, 두 번째 수부터 네 번째 수까지의 합은 20 + 30 + 40 = 90이 됨

2) 구간 합 빠르게 계산하기 문제

N개의 정수로 구성된 수열이 있습니다.
M개의 쿼리(Query) 정보가 주어집니다.
- 각 쿼리는 Left와 Right으로 구성됩니다.
- 각 쿼리에 대하여 [Left, Right] 구간에 포함된 데이터들의 합을 출력해야 합니다.
수행 시간 제한은 O(N + M)입니다.

3) 문제 해결 아이디어

접두사 합(Prefix Sum) : 배열의 맨 앞부터 특정 위치까지의 합을 미리 구해 놓은 것
N개의 수 위치 각각에 대하여 접두사 합을 계산하여 P에 저장
매 M개의 쿼리 정보를 확인할 때 구간 합은 P[Right] - P[Left - 1]이 됨

4) 코드 예시

# 데이터의 개수 N과 데이터 입력 받기
n = 5
data = [10, 20, 30, 40, 50]

# 접두사 합(Prefix Sum) 배열 계산
sum_value = 0
prefix_sum = [0] # 인덱스 1부터 사용하기 위해 인덱스 0에 0 값을 넣음
for i in data:
  sum_value += i
  prefix_sum.append(sum_value)

# 구간 합 계산(세 번째 수부터 네 번째 수까지)
left = 3
right = 4
print(prefix_sum[right] - prefix_sum[left - 1])

출처 : 이것이 취업을 위한 코딩 테스트다 with 파이썬

shin

Backend development

이전 포스트

기타 알고리즘 (소수 판별, 투 포인터, 구간 합)

Python DataStructure & Algorithm

1. 하나의 수 소수 판별 알고리즘

1) 소수 판별 알고리즘 개요

2) 기본적인 알고리즘

3) 기본적인 알고리즘 성능 분석

4) 약수의 성질

5) 개선된 알고리즘

2. 다수의 소수 판별 알고리즘

1) 에라토스테네스의 체 알고리즘

2) 구체적인 동작 과정

3) 에라토스테네스의 체 알고리즘 구현

4) 에라토스테네스의 체 알고리즘 성능 분석

3. Two Pointers

1) 투 포인터 알고리즘

2) 특정한 합을 가지는 부분 연속 수열 찾기 문제

3) 문제 해결 아이디어

4) 코드 예시

4. 구간 합 빠르게 계산하기

1) 구간 합 (Interval Sum)

2) 구간 합 빠르게 계산하기 문제

3) 문제 해결 아이디어

4) 코드 예시

기타 그래프 이론 (Disjoint Sets, 크루스칼, 위상 정렬)

0개의 댓글