프로세스 & 스레드

Hyeonjeong Jeon·2022년 10월 25일
0

프로세스와 스레드

프로세스(Process)란?

💬 사전적 의미

  • 컴퓨터에서 연속적으로 실행되고 있는 프로그램

    프로그램(Program): 어떤 작업을 하기 위해 실행할 수 있는 파일

  • 메모리에 올라와 실행되고 있는 프로그램의 인스턴스(독립적인 개체)
  • 운영체제(OS)로부터 자원을 할당받은 작업의 단위
  • 즉, 동적인 개념으로는 실행된 프로그램을 의미한다.

💬 할당받는 시스템 자원의 예

  • CPU 시간
  • 운영되기 위해 필요한 주소 공간
  • Code, Data, Stack, Heap의 구조로 되어있는 독립된 메모리 영역

💬 특징

  • 각각 독립된 메모리 영역(Code, Data, Stack, Heap)을 할당받는다.
  • 기본적으로 프로세스당 최소 1개의 스레드(메인 스레드)를 가지고 있다.
  • 각 프로세스는 별도의 주소 공간에서 실행되며, 한 프로세스는 다른 프로세스의 변수나 자료구조에 접근할 수 없다.
  • 한 프로세스가 다른 프로세스의 자원에 접근하려면 프로세스 간의 통신(IPC, inter-process communication)을 사용해야 한다.
    • e.g. 파이프, 파일, 소켓 등을 이용한 통신 방법

스레드(Thread)란?

💬 사전적 의미

  • 프로세스 내에서 실행되는 여러 흐름의 단위
  • 프로세스의 수행 경로
  • 프로세스가 할당받은 자원을 이용하는 실행의 단위

💬 특징

  • 프로세스 내에서 각각 Stack만 따로 할당받고 Code, Data, Heap 영역은 공유한다.
  • 같은 프로세스 안에 있는 여러 스레드들은 같은 힙 공간을 공유한다. 반면에 프로세스는 다른 프로세스의 메모리에 직접 접근할 수 없다.
  • 한 스레드가 프로세스 자원을 변경하면, 다른 이웃 스레드도 그 변경 결괄르 즉시 볼 수 있다.

싱글 스레드와 멀티 스레드

싱글(Single) 스레드란?

: 프로세스가 단일 스레드로 동작하는 방식이다. 하나의 레지스터, 스택으로 표현한다.

💬 장점

  • 자원 접근에 대한 동기화를 신경쓰지 않아도 된다.
  • 문맥 교환(Context Switching) 작업을 하지 않아도 된다.

    문맥 교환(Context Switching): 하나의 프로세스(process) 가 CPU 를 사용하다가 다른 프로세스가 사용할수 있도록 이젠 프로세스의 상태(context) 를 PCB(Process Control Block)에 저장하고 새로운 프로세스의 상태를 CPU 에 적재하는 것을 의미한다.

💬 단점

  • CPU 코어를 모두 활용하지 못한다.
    • Cluster 모듈을 이용하여 여러 프로세스를 사용할 수 있다. 하지만 프로세스끼리의 자원 공유가 어렵기 때문에 Redis와 같은 부가 인프라가 필요하다.

멀티(Multi) 스레드란?

: 하나의 응용프로그램을 여러 개의 스레드로 구성하고 각 스레드로 하여금 하나의 작업을 처리하도록 하는 것이다. 대표적인 멀티스레드 응용 프로그램으로는 웹서버가 있다.

💬 장점

  • 시스템 자원 소모 감소(자원의 효율성 증대)
    • 프로세스를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리할 수 있다.
  • 시스템 처리량 증가(처리 비용 감소)
    • 스레드 간 데이터를 주고 받는 것이 간단해지고 시스템 자원 소모가 줄어들게 된다.
    • 스레드 사이의 작업량이 작아 Context Switching이 빠르다.
  • 프로그램 응답 시간 단축
    • 스레드는 프로세스 내의 Stack 영역을 제외한 모든 메모리를 공유하기 때문에 통신의 부담이 적다.

💬 단점

  • 자원을 공유하기에 동기화 문제가 발생할 수 있다. (병목현상, 데드락 등)
  • 하나의 스레드에 문제가 발생하면 전체 프로세스가 영향을 받는다.
  • 다른 프로세스에서 스레드를 제어할 수 없다. (즉, 프로세스 밖에서 스레드 각각을 제어할 수 없다.)
  • 주의 깊은 설계가 필요하며, 디버깅이 까다롭다.

멀티 프로세스와 멀티 스레드

멀티 프로세스란?

: 하나의 응용프로그램을 여러 개의 프로세스로 구성하여 각 프로세스가 하나의 작업을 처리하도록 하는 것(병렬처리)이다. 각 프로세스 간 메모리 구분이 필요하거나 독립된 주소 공간을 가져야 할 경우 사용한다.

💬 장점

  • 여러 개의 자식 프로세스 중 하나에 문제가 발생하면 그 자식 프로세스만 죽는 것 이상으로 다른 영향이 확산되지 않는다.

💬 단점

  • 독립된 메모리 영역이기 때문에 작업량이 많을수록( Context Switching이 자주 일어나서 주소 공간의 공유가 잦을 경우) 오버헤드가 발생하여 성능저하가 발생 할 수 있다.
  • 각각의 독립된 메모리 영역을 할당받았기 때문에 하나의 프로그램에 속하는 프로세스들 사이의 변수를 공유할 수 없다.

✨멀티 프로세스 대신 멀티 스레드를 사용하는 이유✨

프로그램을 여러 개 실행시키는 것(멀티 프로세스)이 아닌 하나의 프로그램 안에서 여러 작업을 해결(멀티 스레드)한다.

💬 장점

  • 자원의 효율성 증대
    • 멀티 프로세스로 실행되는 작업을 멀티 스레드로 실행할 경우, 프로세스를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리할 수 있다.
    • 스레드는 프로세스 내의 메모리를 공유하기 때문에 독립적인 프로세스와 달리 스레드 간 데이터를 주고 받는 것이 간단해지고 시스템 자원 소모가 줄어들게 된다.
  • 처리 비용 감소 및 응답 시간 단축
    • 프로세스 간의 통신(IPC)보다 스레드 간의 통신 비용이 적으므로 작업들 간의 통신 부담이 줄어든다. (Stack 영역을 제외한 모든 메모리를 공유하기 때문)
    • 프로세스 간의 전환 속도보다 스레드 간의 전환 속도가 빠르다. (Stack 영역만 처리하기 떄문)

💬 주의할 점

  • 스레드 간의 자원 공유는 전역 변수(데이터 세그먼트)를 이용하므로 동기화 문제가 발생할 수 있다.

참고
https://net-gate.tistory.com/87
https://student513.tistory.com/74
https://you9010.tistory.com/136

profile
👩🏻‍🌾기억을 기록하고 공유하자📚

0개의 댓글