프로세스와 스레드 (1)

Ryu·2023년 6월 9일
0

프로세스(process)는 컴퓨터에서 실행되고 있는 프로그램을 말하며 CPU 스케줄링의 대상이 되는 작업(task)이라는 용어와 거의 같은 의미로 쓰입니다.
스레드는 프로세스 내 작업의 흐름을 지칭합니다.

프로그램이 메모리에 올라가면 프로세스가 되는 인스턴스화가 일어나고, 이후 운영체제의 CPU 스케줄러에 따라 CPU가 프로세스를 실행합니다.

프로세스와 컴파일 과정

[프로그램의 컴파일 과정]

전처리

소스 코드의 주석을 제거하고 헤더 파일을 병합하여 매크로를 치환합니다.

컴파일러

오류 처리, 코드 최적화 작업을 하며 어셈블리어로 변환합니다.

어셈블러

어셈블리어는 목적 코드(object code)로 변환됩니다.

링커

프로그램 내에 있는 라이브러리 함수 또는 다른 파일들과 목적 코드를 결합하여 실행 파일을 만듭니다. 실행 파일의 확장자는 .exe 또는 .out이라는 확장자를 갖습니다.

정적 라이브러리와 동적 라이브러리

라이브러리는 정적 라이브러리와 동적 라이브러리로 나뉩니다.

정적 라이브러리는 프로그램 빌드 시 라이브러리가 제공하는 모든 코드를 실행 파일에 넣는 방식으로 라이브러리를 쓰는 방법입니다. 시스템 환경 등 외부 의존도가 낮은 장점이 있지만 코드 중복 등 메모리 효율성이 떨어지는 단점이 있습니다.

동적 라이브러리는 프로그램 실행 시 필요할 때만 DLL이라는 함수 정보를 통해 참조하여 라이브러리를 쓰는 방법입니다. 메모리 효율성에서의 장점을 지니지만 외부 의존도가 높아진다는 단점이 있습니다.


프로세스의 상태

프로세스의 상태는 여러 가지 상태 값을 갖습니다.

생성 상태

생성 상태(create)는 프로세스가 생성된 상태를 의미하며 fork() 또는 exec() 함수를 통해 생성합니다. 이때 PCB가 할당됩니다.

fork()

fork()는 부모 프로세스의 주소 공간을 그대로 복상하여 새로운 자식 프로세스를 생성하는 함수입니다.

exec()

exec()는 새롭게 프로세스를 생성하는 함수입니다.

대기 상태

대기 상태(ready)는 메모리 공간이 충분하면 메모리를 할당받고 아니면 아닌 상태로 대기하고 있으며 CPU 스케줄러로부터 CPU 소유권이 넘어오기를 기다리는 상태입니다.

대기 중단 상태

대기 중단 상태(ready suspended)는 메모리 부족으로 일시 중단된 상태입니다.

실행 상태

실행 상태(running)는 CPU 소유권과 메모리를 할당받고 인스트럭션을 수행 중인 상태를 의미합니다. 이를 CPU burst가 일어났다고도 표현합니다.

중단 상태

중단 상태(blocked)는 어떤 이벤트가 발생한 이후 기다리며 프로세스가 차단된 상태입니다. I/O 디바이스에 의한 인터럽트로 이런 현상이 많이 발생하기도 합니다.

일시 중단 상태

일시 중단 상태(blocked suspended)는 대기 중단과 유사합니다. 중단된 상태에서 프로세스가 실행되려고 했지만 메모리 부족으로 일시 중단된 상태입니다.

종료 상태

종료 상태(terminated)는 메모리와 CPU 소유권을 모두 놓고 가는 상태를 말합니다.
종료는 자연스럽게 종료되는 것도 있지만 부모 프로세스가 자식 프로세스를 강제시키는 비자발적 종료(abort)로 종료되는 것도 있습니다. 자식 프로세스에서 할당된 자원의 한계치를 넘어서거나 부모 프로세스가 종료되거나 사용자가 process.kill 등 여러 명령어로 프로세스를 종료시킬 때 발생합니다.


프로세스의 메모리 구조


위에서부터 스택, 힙, 데이터 영역(BSS segment, Data segment), 코드 영역으로 나눠집니다. 스택은 위 주소부터 할당되고 힙은 아래 주소부터 할당됩니다.

스택과 힙

스택과 힙은 동적 할당이 되며, 동적 할당은 런타임 단계에서 메모리를 할당받는 것을 말합니다. 스택은 지역 변수, 매개변수, 실행되는 함수에 의해 늘어나거나 줄어드는 메모리 영역입니다. 함수가 호출될 때마다 호출될 때의 환경 등 특정 정보가 스택에 계속해서 저장됩니다.
또한, 재귀 함수가 호출된다고 했을 때 새로운 스택 프레임이 매번 사용되기 때문에 함수 내의 변수 집합이 해당 함수의 다른 인스턴스 변수를 방해하지 않습니다.

힙은 동적으로 할당되는 변수들을 담습니다. malloc(), free() 함수를 통해 관리할 수 있으며 동적으로 관리되는 자료 구조의 경우 힙 영역을 사용합니다.

데이터 영역과 코드 영역

이 영역은 정적 할당되는 영역입니다. 정적 할당은 컴파일 단계에서 메모리를 할당하는 것을 말합니다. 데이터 영역은 BSS segment와 Data segment, code/text segment로 나뉘어서 저장됩니다.

BSS segment는 전역 변수 또는 static, const로 선언되어 있고 0으로 초기화 또는 초기화가 어떠한 값으로도 되어있지 않은 변수들이 이 메모리 영역에 할당됩니다.
Data segment는 전역 변수 또는 static, const로 선언되어 있고 0이 아닌 값으로 초기화된 변수가 이 메모리 영역에 할당됩니다.
code segment는 프로그램의 코드가 들어갑니다.


PCB

PCB(Process Control Block)는 운영체제에서 프로세스에 대한 메타데이터를 저장한 데이터를 말하며 프로세스 제어 블록이라고도 합니다.
프로세스의 상태 정보를 저장하는 구조체이며 프로세스의 상태 관리와 문맥교환을 위해 필요합니다.

PCB는 프로세스 생성 시 만들어지며 주기억장치에 유지됩니다.

PCB에 데이터가 저장되는 과정은 다음과 같습니다.
프로그램이 실행되면 프로세스가 생성되고 프로세스 주소 값들이 스택, 힙 등의 구조로 메모리가 할당됩니다. 그리고 이 프로세스의 메타데이터들이 PCB에 저장되어 관리됩니다. 이는 프로세스의 중요한 정보를 포함하고 있기 때문에 일반 사용자가 접근하지 못하도록 커널 스택의 가장 앞부분에서 관리됩니다.

메타데이터 : 데이터에 관한 구조화된 데이터이자 데이터를 설명하는 작은 데이터

PCB의 구조

PCB는 프로세스 스케줄링 상태, 프로세스 ID 등의 다음과 같은 정보로 이루어져 있습니다.

  • 프로세스 스케줄링 상태 : 준비, 대기, 실행 등의 상태
  • 프로세스 ID(PID) : 프로세스 ID, 해당 프로세스의 자식 프로세스 ID
  • 프로세스 권한 : 컴퓨터 자원 또는 I/O 디바이스에 대한 권한 정보
  • 프로그램 카운터 : 프로세스에서 실행해야 할 다음 명령어의 주소에 대한 포인터
  • CPU 레지스터 : 프로세스를 실행하기 위해 저장해야 할 레지스터에 대한 정보
  • CPU 스케줄링 정보 : CPU 스케줄러에 의해 중단된 시간 등에 대한 정보
  • 계정 정보 : 프로세스 실행에 사용된 CPU 사용량, 실행한 유저의 정보
  • I/O 상태 정보 : 프로세스에 할당된 I/O 디바이스 목록

컨텍스트 스위칭

컨텍스트 스위칭(context switching)은 앞서 설명한 PCB를 교환하는 과정을 말합니다. 한 프로세스에 할당된 시간이 끝나거나 인터럽트에 의해 발생합니다.
컴퓨터는 많은 프로그램을 동시에 실행하는 것처럼 보이지만 어떠한 시점에서 실행되고 있는 프로세스는 단 한 개이며, 많은 프로세스가 동시에 구동되는 것처럼 보이는 것은 다른 프로세스와의 컨텍스트 스위칭이 아주 빠른 속도로 실행되기 때문입니다.

위 그림을 보면 P0이 실행하다 멈추게 되면 운영체제는 프로세스 P0의 PCB를 먼저 저장을 합니다. 실행중이던 프로세스 P0이 대기 상태가 되면 프로세스 P1을 로드하여 실행합니다. 이후 프로세스 P1이 멈추게 되면 똑같이 P1의 PCB를 저장하고 프로세스 P0의 PCB를 로드합니다.

정리하면 컨텍스트 스위칭이란 CPU가 이전에 실행 중이던 프로세스 상태 및 정보를 PCB에 저장하고, 다음에 실행할 프로세스의 상태 및 정보를 PCB에서 읽어 레지스터에 옮기는 과정이라고 할 수 있습니다.

컨텍스트 스위칭이 일어날 때 유휴 시간(idle time)이 발생하고 컨텍스트 스위칭에는 캐시미스가 발생합니다.

유휴 시간 : 컴퓨터가 작동 가능한데도 작업을 하지 않는 시간
캐시미스 : 구성 요소 또는 애플리케이션이 처리하도록 요청한 데이터가 캐시 메모리에 없는 상태

비용: 캐시미스

컨텍스트 스위칭이 일어날 때 프로세스가 가지고 있는 메모리 주소가 그대로 있으면 잘못된 주소 변환이 생기므로 캐시클리어 과정을 겪게 되고 이 때문에 캐시미스가 발생합니다.

스레드에서의 컨텍스트 스위칭

컨텍스트 스위칭은 스레드에서도 일어나며 스레드는 스택 영역을 제외한 모든 메모리를 공유하기 때문에 비용이 더 적고 시간도 더 적게 걸립니다.

profile
나는야 머찐 개발자

0개의 댓글