[OS] Process vs Thread

천호영·2023년 11월 4일
0

ComputerScience

목록 보기
1/10

레퍼런스들을 기반으로 내용을 정리했습니다.

Process, Thread란

프로세스(Process): 프로그램을 메모리 상에서 실행중인 작업(=running Program)
스레드(Thread): 프로세스 안에서 실행되는 여러 흐름 단위(=segment of a process)

기본적으로 프로세스마다 최소 1개의 스레드 소유 (메인 스레드 포함)

프로세스는 각각 별도의 주소공간 할당 (독립적)

  • Code: 코드 자체를 구성하는 메모리 영역(프로그램 명령)
  • Data: 전역변수, 정적변수, 배열 등 (초기화된 데이터는 data 영역에, 초기화되지 않은 데이터는 bss 영역에 저장)
  • Heap: 동적 할당 시 사용 (new(), malloc() 등)
  • Stack: 지역변수, 매개변수, 리턴값 (임시 메모리 영역)

스레드는 Stack, PC register만 따로 할당 받고 나머지 영역은 서로 공유합니다.

스레드가 Stack만 따로 할당 받는 이유는?

  • 스레드는 독립적인 동작을 수행하기 위해 존재한다.
  • 즉 독립적으로 함수를 호출할 수 있어야 한다.
  • 때문에 함수의 매개변수, 지역변수 등을 저장하는 스택 메모리 영역은 독립적으로 할당받아야 한다.

스레드가 PC register를 따로 할당 받는 이유는?

  • PC값은 스레드가 명령어의 어디까지 수행했는지를 나타낸다.
  • 스레드마다 독립적으로 수행되기 위해서는 PC값이 각각 할당되어야 한다.

하나의 프로세스가 생성될 때, 기본적으로 하나의 스레드가 같이 생성됩니다.

프로세스는 자신만의 고유 공간과 자원을 할당받아 사용하는데 반해, 스레드는 다른 스레드와 공간, 자원을 공유하면서 사용하는 차이가 존재합니다.

멀티 프로세스, 멀티 스레드


멀티 프로세스: 하나의 프로그램을 여러 개의 프로세스로 구성하여 각 프로세스가 병렬적으로 작업을 수행하는 것

  • 장점: 안정성(메모리 침범 문제를 OS 차원에서 해결)
  • 단점: 각각 독립된 메모리 영역을 갖고 있어, 작업량 많을수록 오버헤드 발생. Context Switching으로 인한 성능 저하

Context Switching이란?

프로세스의 상태 정보를 저장하고 복원하는 일련의 과정

즉, 동작(Running) 중인 프로세스가 대기(Ready)하면서 해당 프로세스의 상태를 보관하고, 대기(Ready)하고 있던 다음 순번의 프로세스가 동작(Running)하면서 이전에 보관했던 프로세스 상태를 복구하는 과정을 말함

→ 프로세스는 각 독립된 메모리 영역을 할당받아 사용되므로, 캐시 메모리 초기화와 같은 무거운 작업이 진행되었을 때 오버헤드가 발생할 문제가 존재함

PCB(Process Control BlocK)으로 프로세스에 대한 중요한 정보들을 저장하고, Context Switching에서 이용한다.

멀티 스레드: 하나의 응용 프로그램에서 여러 스레드를 구성해 각 스레드가 하나의 작업을 처리하는 것. 스레드들이 공유 메모리를 통해 다수의 작업을 동시에 처리하도록 해줌.

  • 장점: 독립적인 프로세스에 비해 공유 메모리만큼의 시간, 자원 손실이 감소. 전역변수와 정적변수에 대한 자료 공유 가능
  • 단점: 안전성 문제. 하나의 스레드가 데이터 공간 망가뜨리면, 모든 스레드가 작동 불능 상태 (공유 메모리를 갖기 때문)

멀티스레드의 안전성에 대한 단점은 Critical Section 기법을 통해 대비함

하나의 스레드가 공유 데이터 값을 변경하는 시점에 다른 스레드가 그 값을 읽으려할 때 발생하는 문제를 해결하기 위한 동기화 과정
(상호 배제(Mutual Exclusion), 진행(Progress), 한정된 대기(Bounded Waiting)를 충족해야함)

cf.

I/O intensive task -> multithreading가 좋다
CPU intensive task -> multiprocessing가 좋다

1 core이고 전부 CPU bound 작업이면 multiprocessing해도 성능의 증가는 없고, 오히려 context switch 비용으로 인해 성능 저하가 발생할 수 있다.
(I/O bound가 섞여있으면 이득이 있을 수 있지만, I/O bound가 매우 많으면 차라리 multithreading을 쓰는게 context switching 비용을 줄여서 더 낫다)

Reference

profile
성장!

0개의 댓글