[OS] 프로세스 및 CPU 스케줄링

Cherry·2024년 4월 16일
0

프로세스

프로세스란 프로그램을 실행한 것이다

프로세스의 문맥(context)

  • CPU : 수행 상태를 나타내는 하드웨어 문맥
    • Program Counter
    • 각종 register
  • 프로세스의 주소 공간
    • code, data, stack
  • 운영체제가 프로세스를 관리 - 프로세스 관련 커널 자료 구조
    • PCB(Process Control Block)
    • Kernel stack

프로세스의 상태

  • New : 프로세스가 생성중인 상태
  • Running : CPU를 잡고 instruction을 수행중인 상태
  • Ready : CPU를 기다리는 상태(메모리 등 모든 조건을 만족하고)
  • Blocked : CPU를 주어도 수행할 수 없는 상태. 예를들면 요청한 event(예를들면 I/O)가 만족되지 않아서 이를 기다리는 상태거나 디스크에서 file을 읽어와야하는 경우처럼 오래걸리는 작업을 하고있을때.
  • Suspended : Suspended(Stopped) ← 중기스케쥴러의 도입으로 추가된 개념
    • 프로세스가 메모리를 아에 잃어버리는 상태를 일컫는다
    • 외부적인 이유로 프로세스의 수행이 정지된 상태
    • 프로세스는 통째로 디스크에 swap out된다
      e.g. 사용자가 프로그램을 일시정지 시킨경우(break key) 시스템이 여러 이유로 프로세스를 잠시 중단시킴(메모리에 너무많은 프로세스가 올라와 있을때)
  • Terminated : 수행이 끝났지만 정리할 게 남은 상태

Process Control Block(PCB)

운영체제가 각 프로세스를 관리하기 위해 프로세스당 유지하는 정보를 PCB라고 한다

구성요소

  • OS가 과리상 사용하는 정보
    • process stae, process ID
    • scheduling information, priority
  • CPU 수행 관련 하드웨어 값
    • program counter, registers
  • 메모리 관련
    • Code, data, stack의 위치 정보
  • 파일 관련
    • open file descriptors

문맥 교환(Context Switch)

  • CPU를 한 프로세스에서 다른 프로세스로 넘겨주는 과정
  • CPU가 다른 프로세스에게 넘어갈 때 운영체제는 다음을 수행
    • CPU를 내어주는 프로세스의 상태를 그 프로세스의 PCB에 저장
    • CPU를 내어주는 프로세스의 상태를 PCB에서 읽어옴
  • Interupt나 system call은 OS에게 CPU 권한이 넘어가지만 이를 문맥교환이라 정의하지는 않는다.

프로세스를 스케줄링 하기 위한 큐

  • job queue : 현재 시스템 내에 있는 모든 프로세스의 집합
  • ready queue : 현재 메모리 내에 있으면서 CPU를 잡아서 실행되기를 기다리는 프로세스의 집합
  • device queue : I/O device의 처리를 기다리를 프로세스의 집합
    프로세스들은 각 큐들을 오가며 수행된다.

스케줄러(Scheduler)

  1. Long-term scheduler(장기 스케줄러 or job scheduler)
  • 시작 프로세스 중(new상태의 프로세스) 어떤 것들을 ready queue로 보낼지 결정(메모리를 줘야 비로소 Ready로 올라감)
  • 프로세스에 메모리 및 각종자원을 주는 문제
  • Degree of Multiprogramming(메모리에 몇개의 프로그램이 올라갈지)을 제어
    time sharing system에는 보통 장기 스케줄러가 없음(무조건 Ready)
  1. Short-term scheduler(단기 스케줄러 or CPU scheduler)
  • 어떤 프로세스를 다음번에 running시킬지 결정
  • 프로세스에 CPU를 주는 문제
  • 충분히 빨라야 함(millisecond 단위)
  1. Medium-Term Scheduler(중기 스케줄러 or Swapper)
    → 이 스케쥴러의 도입으로 Process의 Suspended상태 개념이 추가됨
  • 여유 공간 마련을 위해 프로세스를 통째로 메모리에서 디스크로 쫓아냄
  • 프로세스에게서 메모리를 뻇는 문제
  • Degree of Multiprogramming을 제어

Thread

💡 “A thread(or lightweight process) is a basic unit of CPU utilization”
-> 프로세스 내부에 CPU 수행 단위가 여러개 있는 경우
Thread의 구성

  • Program Counter
  • Register Set
  • Stack Space

Thread가 동료 Thread와 공유하는 부분(=Task)

  • Code Section
  • Data Section
  • OS resources

전통적인 개념의 heavyweight process는 하나의 thread를 가지고 있는 task로 볼 수 있다.

  • 다중 스레드로 구성된 태스크 구조에서는 하나의 서버 스레드가 blocked(wating) 상태인 동안에도 동일한 태스크 내의 다른 쓰레드가 실행(Running)되어 빠른 처리를 할 수 있다.
  • 동일한 일을 수행하는 다중 쓰레드가 협력하여 높은 처리율(throughput)과 성능 향상을 얻을 수 있다.(주소공간=메모리 를 공유하므로 자원절약을 할 수 있어 효율이 좋음!)
  • 쓰레드를 사용하면 병렬성을 높일 수 있다.(CPU가 여러개 달린 컴퓨터에서만 가능)

쓰레드의 장점

  1. Responsiveness
    e.g. multi-threaded Web - if one thread is blocked (e.g. Network) another thread continues (e.g. Display)

  2. Resource Sharing
    n threads can share binary code, data, resource of the process

  3. Economy
    creating & CPU switching thread(rather than a process)
    Solaris의 경우 위 두가지 overhead가 각각 30배, 5배(프로세스를 생성하는 경우가)

  4. Utilization of MP Architectures(CPU가 여러개 있는 환경에서만)
    MP = multi-processor
    each thread may be running in parallel on a different processor

Process Management

프로세스 생성(Process Creation)

Copy-on-write(COW) - write가 발생할때 Copy를 하겠다.

  • 부모 프로세스가 자식 프로세스를 생성
  • 프로세스의 트리(계층 구조) 형성
  • 프로세스는 자원을 필요로 함
    • 운영체제로부터 받는다.
    • 부모와 공유한다
  • 자원의 공유
    • 공유하는게 좋으나 별개의 프로세스이기 때문에 독립적으로 가지고 있는게 원칙이다
    • 부모와 자식이 모든 자원을 공유하는 모델
    • 일부를 공유하는 모델
    • 전혀 공유하지 않는 모델
  • 수행(Execution)
    • 부모와 자식은 공존하며 수행되는 모델
    • 자식이 종료(terminate)될 때까지 부모가 기다리는(wait=blocked) 모델
  • 주소공간(Address space)
    • 자식은 부모의 공간을 복사함(binary and OS data)
    • 자식은 그 공간에 새로운 프로그램을 올림
  • 유닉스의 예
    • fork() 시스템 콜이 새로운 프로세스를 생성
      • 부모를 그대로 복사(OS data except PID + Binary)
      • 주소 공간 할당
    • fork 다음에 이어지는 exec() 시스템 콜을 통해 새로운 프로그램을 메모리에 올림

프로세스 종료(Process Termination)

  • 프로세스가 마지막 명령을 수행한 후 운영체제에게 이를 알려줌(exit)
    • 자식이 부모에게 output data를 보냄(via wait)
    • 프로세스의 각종 자원들이 운영체제에게 반납됨
  • 부모 프로세스가 자식의 수행을 종료시킴(abort)
    • 자식이 할당 자원의 한계치를 넘어섬
    • 자식에게 할당된 태스크가 더 이상 필요하지 않음
    • 부모가 종료(exit)하는 경우
      • 운영체제는 부모 프로세스가 종료되는 경우 자식이 더 이상 수행되도록 두지 않는다.
      • 단계적인 종료

프로세스와 관련한 시스템 콜 4가지

1. fork()

  • create a child(copy)
  • creates a new address space that is a duplicate of the caller
  • 프로그램카운터가 fork()메서드 줄에 있는 상황에서 자식 프로세서가 생성되었으므로 문맥이 복사되어 자식 프로세서는 그 밑에 줄 부터 실행한다.
  • 부모프로세스와 자식프로세스를 어떻게 구별할까? → 부모프로세스는 자식프로세스의 ID(PID)가 리턴결과로(양수) 나오고 자식프로세스는 0이 나옴
  • 위 그림을 두개로 놓고 한쪽은 부모 한쪽은 자식으로 생각하면 이해가 쉽다.

2. exec()

  • overlay new image
  • Replaces the memory image of the caller with a new program.

3. wait()

  • sleep until child is done
  • 프로세스 A가 wait() 시스템 콜을 호출하면
    • 커널은 child가 종료될 때까지 프로세스 A를 sleep시킨다.(block 상태)
    • Child process가 종료되면 커널은 프로세스 A를 깨운다.(ready 상태)

4. exit()

  • frees all the resources, notify parent
  • 프로세스의 종료
    • 자발적 종료
      • 마지막 statement 수행 후 exit() 시스템 콜을 통해
      • 프로그램에 명시적으로 적어주지 않아도 main 함수가 리턴되는 위치에 컴파일러가 넣어줌
    • 비자발적 종료
      • 부모 프로세스가 자식 프로세스를 강제 종료시킴
        • 자식 프로세스가 한계치를 넘어서는 자원 요청
        • 자식에게 할당된 태스크가 더 이상 필요하지 않음
      • 키보드로 kill, break등을 친 경우
      • 부모가 종료하는 경우
        • 부모 프로세스가 종료하기 전에 자식들이 먼저 종료됨

프로세스 간 협력

  • 독립적 프로세스(Independent)
    • 프로세스는 각자의 주소 공간을 가지고 수행되므로 원칙적으로 하나의 프로세스는 다른 프로세스의 수행에 영향을 미치지 못함
  • 협력 프로세스(Cooperating process)
    • 프로세스 협력 매커니즘을 통해 하나의 프로세스가 다른 프로세스의 수행에 영향을 미칠 수 있음
  • 프로세스 간 협력 매커니즘(IPC: Interprocess Communication)
    • 메시지를 전달하는 방법
      • message passing: 커널을 통해 메시지 전달
    • 주소 공간을 공유하는 방법
      • shared memory: 서로 다른 프로세스간에도 일부 주소 공간을 공유하게 하는 shared memory 매커니즘이 있음
      • 💡 thread: thread는 사실상 하나의 프로세스 이므로 프로세스 간 협력으로 보기는 어렵지만 동일한 process를 구성하는 thread간에는 주소 공간을 공유하므로 협력이 가능

Message Passing

  • Message System
    • 프로세스 사이에 공유변수(shared variable)를 일체 사용하지 않고 통신하는 시스템
  • Direct Communication
    - 통신하려는 프로세스의 이름을 명시적으로 표시
  • Indirect Communication
    • mailbox(or Port)를 통해 메시지를 간접 전달

0개의 댓글