Process vs Thread

leephoter·2021년 12월 7일
0

CS

목록 보기
1/2
post-thumbnail

🔥 Process

👉 정의

  • 컴퓨터에서 연속적으로 실행되고 있는 컴퓨터 프로그램
  • 메모리에 올라와 실행되고 있는 프로그램의 인스턴스(독립적인 개체)
  • 운영체제로부터 시스템 자원을 할당받는 작업의 단위
    동적인 개념으로는 실행된 프로그램을 의미

👉 할당 받는 시스템 자원의 예

  • CPU 시간
  • 운영되기 위해 필요한 주소 공간
  • Code, Data, Stack, Heap의 구조로 되어 있는 독립된 메모리 영역

👉 특징

  • Process는 각각 독립된 메모리 영역(Code, Data, Stack, Heap의 구조)을 할당받음
  • 기본적으로 Process당 최소 1개의 Thread(Main thread)를 가짐
  • 각 Process는 별도의 주소 공간에서 실행되며, 한 Process는 다른 Process의 변수나 자료구조에 접근 불가
  • 한 Process가 다른 Process의 자원에 접근하려면, Process 간의 통신(IPC, inter-process communication)을 사용
    Ex) pipe, socket 등을 이용한 통신 방법 이용

🔥 Thread

👉🏻 정의

  • CPU 입장에서의 최소 작업 단위
  • 프로세스 내에서 실행되는 흐름의 단위
  • 프로세스의 특정한 수행 경로
  • 프로세스가 할당받은 자원을 이용하는 실행의 단위

👉🏻 특징

  • Thread는 Process 내에서 각각 Stack만 따로 할당받고 Code, Data, Heap 영역은 공유
  • Process 내의 주소 공간이나 자원들(힙 공간 등)같은 Process 내에 Thread끼리 공유하면서 실행
  • 같은 Process 안에 있는 여러 Thread들은 같은 Heap 공간을 공유. 반면에 Process는 다른 Process의 메모리에 직접 접근 불가
  • 각각의 Thread는 별도의 Register와 Stack을 갖고 있지만, Heap 메모리는 서로 읽고 쓸 수 있음
  • 한 Thread가 Process 자원을 변경하면, 다른 이웃 Thread(sibling thread)에도 그 변경 결과를 즉시 공유

👉🏻 Java Thread

  • Java에는 Process가 존재하지 않고 Thread만 존재하며, Java Thread는 JVM에 의해 스케줄되는 실행 단위 코드 블록
    <JVM : JVM은 자바 바이트코드 실행기>
  • Java에서 Thread 스케줄링은 전적으로 JVM에 의해 이루어짐
  • 아래와 같은 Thread와 관련된 많은 정보들도 JVM이 관리
    • Thread가 몇 개 존재하는지
    • Thread로 실행되는 프로그램 코드의 메모리 위치는 어디인지
    • Thread의 상태는 무엇인지
    • Thread 우선순위는 얼마인지
      개발자는 Java Thread로 작동할 Thread Code를 작성하고, Thread Code가 동적으로 실행하도록 JVM에 요청하는 일.

🔥 Multi Process vs Multi Thread

🐶 Multi Process

👉🏻 정의

  • 하나의 응용프로그램여러 Process로 구성하여 각 Process가 하나의 작업(Task)을 처리하도록 하는 것

👉🏻 장점

  • 여러 개의 자식 Process 중 하나에 문제가 발생하면 그 자식 Process만 죽는 것 이상으로 다른 영향이 확산되지 않음

👉🏻 단점
여기 잘 모르겠음
참고 : https://nesoy.github.io/articles/2018-11/Context-Switching

- Context Switching에서의 오버헤드
  - Context Switching 과정에서 캐쉬 메모리 초기화 등 무거운 작업이 진행되고 많은
  시간이 소모되는 등의 오버헤드가 발생
  - Process는 각각의 독립된 메모리 영역을 할당받았기 때문에 Process 사이에서 
  공유하는 메모리가 없어, Context Switching가 발생하면 캐쉬에 있는 모든 데이터를
  모두 리셋하고 다시 캐쉬 정보를 불러와야 함

단일 스레드 :
context Switching : 작업1 - context Switching - 작업2 - context Switching - 작업1 - context Switching - 작업3 ...
context Switching의 기간이 길다 : (이유) core에서 사용하던 Code, Data, Heap를

멀티 스레드 :
context Switching : 작업1 - context Switching - 작업2 - context Switching - 작업1 - context Switching - 작업3 ...
context Switching의 기간이 짧다 - Core에 있는 Code, Data, Heap을 공유하기 때문에 빼고 집어넣을 필요가 없다

  • Process 사이의 어렵고 복잡한 통신 기법(IPC)
    • Process는 각각의 독립된 메모리 영역을 할당받았기 때문에 하나의 프로그램에 속하는 Process들 사이의 변수를 공유 불가

🐶 Multi Thread

👉🏻 정의

  • 하나의 응용프로그램을 여러 개의 Thread로 구성하고 각 Thread는 하나의 작업을 처리
  • 윈도우, 리눅스 등 많은 운영체제들이 멀티 프로세싱을 지원하고 있지만 기본은 멀티 스레딩
  • 웹 서버는 대표적인 멀티 스레드 응용 프로그램

👉🏻 장점

  • 시스템 자원 소모 감소 (자원의 효율성 증대)
    • Process를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리
  • 시스템 처리량 증가 (처리 비용 감소)
    • Thread 간 간단한 데이터 공유, 시스템 자원 소모가 줄어들게 된다.
    • Thread 사이의 작업량이 작아 Context Switching이 빠름
  • 간단한 통신 방법으로 인한 프로그램 응답 시간 단축
    • Thread는 Process 내의 Stack 영역을 제외한 모든 메모리를 공유하기 때문에 통신이 수월함

👉🏻 단점

  • 주의 깊은 설계가 필요
  • 디버깅이 까다롭움
  • Single Thread 시스템의 경우 효과👇
  • 다른 Process에서 Thread를 제어할 수 없음 (Process 밖에서 Thread각각 제어 불가)
  • Multi Thread의 경우 자원 공유의 문제가 발생 (동기화 문제)
  • 하나의 Thread에 문제가 발생하면 전체 Process에 영향

🔥 Multi Process 대신 Multi Thread를 사용하는 이유 🔥

👉🏻 프로그램을 여러 개 사용하는 것보다 하나의 프로그램 안에서 여러 작업을 해결

👉🏻 자원의 효율성 증대

  • Process를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리 가능
  • Process 간의 Context Switching시 단순히 CPU register 교체 뿐만 아니라 RAM과 CPU 사이의 캐쉬 메모리에 대한 데이터까지 초기화되므로 오버헤드가 크기 때문
  • Thread는 Process 내의 메모리를 공유하기 때문에 독립적인 Process와 달리 Thread간의 데이터 공유가 간단, 시스템 자원 소모 저하

👉🏻 처리 비용 감소 및 응답 시간 단축

  • 또한 Process 간의 통신(IPC)보다 Thread 간의 통신의 비용이 적다 👉🏻 작업들 간의 통신 부담 저하
    • Thread는 Stack 영역을 제외한 모든 메모리를 공유하기 때문
  • Process간의 전환 속도보다 Thread 간의 전환 속도가 빠름
    • Context Switching시 Thread는 Stack 영역만 처리하기 때문

🔥 주의
👉🏻 동기화 문제
Thread간의 자원 공유는 전역 변수(데이터 세그먼트)를 이용하므로 함께 상용할 때 충돌 발생 가능

출처 : https://gmlwjd9405.github.io/2018/09/14/process-vs-thread.html HeeJeong Kwon님

profile
🔥 🧑🏾‍💻 🔥

0개의 댓글