CPU 스케줄링

david1-p·2025년 10월 29일

CS 지식 창고

목록 보기

12/25

CPU 스케줄링에 대해서

CPU 스케줄링은 운영체제(OS)가 여러 프로세스(실행 중인 프로그램)들에게 공정하고 합리적으로 CPU 자원을 배분하는 과정을 의미합니다.

만약 CPU 스케줄링이 없다면 어떻게 될까요?
하나의 프로세스가 CPU를 무한정 독점할 수 있습니다. 당장 처리해야 할 중요한 작업(예: 사용자 로그인 요청)이, 급하지 않은 백그라운드 작업(예: 로그 파일 압축) 때문에 무한정 기다려야 할 수도 있습니다. 즉, 시스템은 무질서한 상태가 되고 응답성과 효율성이 극도로 떨어지게 됩니다.

CPU 스케줄링은 크게 '선점형'과 '비선점형' 두 가지 방식으로 나뉩니다.

1. 스케줄링의 두 가지 핵심 방식

1) 비선점형 스케줄링 (Non-preemptive)

비선점형 스케줄링은 하나의 프로세스가 CPU 자원을 사용하기 시작하면, 해당 프로세스가 스스로 종료되거나 I/O 대기 상태로 전환되기 전까지는 다른 프로세스가 CPU를 차지할 수 없는 방식입니다.

특징:
- 장점: 흐름을 예측하기 쉽고, 문맥 교환(Context Switching) 비용이 적습니다.
- 단점: 응답 시간이 길어질 수 있습니다. 실행 시간이 긴 프로세스 하나가 전체 시스템의 반응성을 저해할 수 있습니다. (예: FCFS, SJF)

2) 선점형 스케줄링 (Preemptive)

선점형 스케줄링은 프로세스가 CPU를 사용하고 있더라도, 운영체제가 필요에 따라(예: 더 높은 우선순위의 작업이 들어오거나, 할당된 시간이 다 되거나) 해당 프로세스로부터 자원을 강제로 빼앗아 다른 프로세스에 할당할 수 있는 방식입니다.

특징:
- 장점: 응답 시간이 빠르고 대화형 시스템에 유리합니다.
- 단점: 잦은 문맥 교환으로 인한 오버헤드가 발생할 수 있으며, 여러 프로세스가 자원을 동시에 접근하려 할 때 경쟁 상태(Race Condition)가 발생할 수 있습니다. (예: RR, SRT, MLQ)

💡 [보충] 문맥 교환 (Context Switching) 비용이란?

문맥 교환은 현재 실행 중인 프로세스의 상태(예: 레지스터 값, 프로그램 카운터)를 PCB(Process Control Block)에 저장하고, 다음에 실행할 프로세스의 상태를 PCB에서 불러와 CPU에 적재하는 과정을 말합니다.

이 과정 자체는 CPU가 실질적인 작업을 처리하는 시간이 아니기 때문에 '오버헤드(Overhead)' 즉, 비용으로 간주됩니다. 선점형 스케줄링은 이 문맥 교환이 빈번하게 발생할 수 있으므로, 이 비용을 고려해야 합니다.

2. 핵심 CPU 스케줄링 알고리즘

이제 가장 대표적인 CPU 스케줄링 알고리즘들을 살펴보겠습니다.

1) FCFS (First Come First Served)

방식: 비선점형
설명: 준비 큐(Ready Queue)에 도착한 순서대로 CPU를 할당받는, 가장 단순한 방식입니다. (은행 창구에서 번호표 뽑고 기다리는 것과 같습니다.)
문제점: 호위 효과 (Convoy Effect)
- 실행 시간이 매우 긴 프로세스(A)가 CPU를 먼저 점유하면, 뒤따르는 실행 시간이 짧은 프로세스들(B, C)이 A가 끝날 때까지 하염없이 기다려야 하는 현상입니다.
- 예시: A(30초), B(2초), C(1초) 순으로 도착 시, B는 30초, C는 32초를 기다려야 합니다. B와 C의 평균 대기 시간은 매우 길어집니다.

2) SJF (Shortest Job First)

방식: 비선점형
설명: 준비 큐에 있는 프로세스 중 CPU 실행 시간이 가장 짧은 프로세스에게 CPU를 먼저 할당합니다.
장점: 호위 효과를 해결하고, 시스템의 평균 대기 시간을 최소화할 수 있습니다.
문제점:
1. 기아 현상 (Starvation): 실행 시간이 긴 프로세스는, 실행 시간이 짧은 프로세스들이 계속 큐에 도착할 경우 무한정 대기하게 되어 CPU를 할당받지 못할 수 있습니다.
2. 실행 시간 예측의 어려움: 가장 큰 현실적 한계입니다. OS는 프로세스가 미래에 얼마나 오래 실행될지 정확히 알 수 없습니다. (보통 과거의 실행 기록을 바탕으로 예측합니다.)

3) SRT (Shortest Remaining Time)

방식: 선점형
설명: SJF 알고리즘의 선점형 버전입니다. 현재 실행 중인 프로세스의 남은 실행 시간보다 더 짧은 실행 시간을 가진 프로세스가 준비 큐에 도착하면, 즉시 CPU를 빼앗아 새 프로세스에 할당합니다.
특징: SJF의 장점을 가지면서 응답성을 높였습니다. 하지만 SJF와 동일하게 '기아 현상'과 '실행 시간 예측'의 문제를 안고 있습니다.

4) 라운드 로빈 (Round Robin, RR)

방식: 선점형
설명: FCFS에 타임 슬라이스 (Time Slice) 또는 타임 퀀텀 (Time Quantum) 개념을 도입한 방식입니다. 모든 프로세스는 정해진 타임 슬라이스만큼 CPU를 사용하고, 시간이 만료되면 준비 큐의 맨 뒤로 이동합니다.
특징:
- 모든 프로세스가 공평하게 CPU 시간을 보장받아 응답 시간이 빠릅니다. 현대 시분할 시스템의 근간이 됩니다.
- 타임 슬라이스 크기가 중요합니다.
  - 너무 크면: FCFS와 비슷해져 호위 효과가 발생하고 응답성이 떨어집니다.
  - 너무 작으면: 문맥 교환이 너무 빈번하게 발생하여 오버헤드가 커집니다.

3. 고급 스케줄링과 '기아 현상' 해결

SJF, SRT 등 우선순위를 기반으로 하는 스케줄링은 '기아 현상'이라는 고질적인 문제를 안고 있습니다. 이를 해결하기 위한 고급 기법들을 알아봅니다.

1) 다단계 큐 (Multilevel Queue)

설명: 우선순위별로 준비 큐를 여러 개 두는 방식입니다.
작동 방식:
1. 우선순위가 가장 높은 큐(예: 시스템 프로세스 큐)에 있는 프로세스들을 먼저 처리합니다.
2. 가장 높은 큐가 비어있을 때만, 그 다음 우선순위 큐(예: 대화형 작업 큐)의 프로세스를 처리합니다.
장점: 프로세스 유형별(예: 대화형 vs. 배치)로 다른 스케줄링 정책(예: 상위 큐는 RR, 하위 큐는 FCFS)을 적용할 수 있습니다.
문제점: 여전히 하위 큐의 프로세스들은 상위 큐에 작업이 계속 들어오면 기아 현상을 겪을 수 있습니다.

2) '기아 현상'의 해결책: 에이징 (Aging)

SJF, SRT, 다단계 큐 등에서 발생하는 기아 현상을 해결하기 위한 대표적인 기법이 바로 에이징(Aging)입니다.

에이징 (Aging): 오랫동안 준비 큐에서 대기한 프로세스의 우선순위를 시간이 지남에 따라 점차 높여주는 기법입니다.

아무리 우선순위가 낮은 작업이라도, 충분히 오래 기다리면 결국 우선순위가 높아져 언젠가는 실행될 기회를 보장받게 됩니다.

3) 다단계 피드백 큐 (Multilevel Feedback Queue, MLFQ)

다단계 큐의 기아 현상 문제를 에이징 기법을 적용해 해결한, 가장 정교하고 현대적인 스케줄링 방식 중 하나입니다.

작동 방식:
1. 새 프로세스는 일단 가장 높은 우선순위 큐에 들어갑니다. (빠른 응답 기대)
2. 해당 큐의 타임 슬라이스 내에 작업이 끝나지 않으면, 한 단계 낮은 우선순위 큐로 강등됩니다. (CPU를 오래 쓰는 작업은 우선순위가 낮아짐)
3. 낮은 우선순위 큐일수록 보통 더 긴 타임 슬라이스를 할당받습니다.
4. (에이징 적용) 만약 가장 낮은 큐에서 너무 오래 대기한 프로세스가 있다면, 다시 상위 큐로 승급시켜 기아 현상을 방지합니다.

MLFQ는 CPU 실행 시간을 예측할 필요 없이, 실행 패턴(짧은 작업/긴 작업)에 따라 동적으로 프로세스의 우선순위가 조정되므로 매우 효율적이고 유연합니다.

4. 마치며: 개발자가 스케줄링을 알아야 하는 이유

CPU 스케줄링은 운영체제 깊숙한 곳에서 일어나지만, 백엔드 애플리케이션의 응답 시간(Latency)과 처리량(Throughput)에 직접적인 영향을 줍니다.

SJF 계열은 처리량을 극대화하려 하지만 기아 현상이 발생할 수 있습니다.
RR 계열은 응답성을 보장하려 하지만 문맥 교환 비용이 발생합니다.
MLFQ는 이 둘의 균형을 맞추려는 현대적인 해법입니다.

어떤 스케줄링 알고리즘이 사용되느냐에 따라, 애플리케이션의 특정 요청이 왜 늦게 응답하는지, 혹은 서버 리소스가 특정 작업에 몰리는 이유를 어렴풋이나마 짐작할 수 있게 됩니다. 이는 시스템의 성능 병목을 파악하고 최적화하는 데 중요한 기초 지식이 되어줄 것입니다.

david1-p

DONE IS BETTER THAN PERFECT.

이전 포스트

디스크 접근 시간

다음 포스트