스레드(Thread)와 프로세스(Process)

A Code AM·2020년 5월 11일
0

수업(20200212~)

목록 보기
10/12

프로그램(Program)

: "어떤 작업을 위해 실행할 수 있는 파일"

프로세스(Process)

: "컴퓨터에서 연속적으로 실행되고 있는 컴퓨터 프로그램"

  • 메모리에 올라와 실행되고 있는 프로그램의 인스턴스(독립적 개체)
  • 운영체제로부터 시스템 자원을 할당받는 작업의 단위
  • 동적인 개념으로는 실행된 프로그램을 의미

할당 받는 시스템 자원의 예
- CPU 시간 (CPU 사용률)
- 운영되기 위해 필요한 주소 공간
- Code, Data, Stack, Heap의 구조로 되어있는 독립된 메모리 영역

👀 특징

  • 프로세스는 각각 독립된 메모리 영역(Code, Data, Stack, Heap의 구조)을 할당 받는다
  • 기본적으로 프로세스당 최소 1개의 스레드(메인 스레드)를 가지고 있다.
  • 각 프로세스는 별도의 주소 공간에서 실행되며, 한 프로세스는 다른 프로세스의 변수나 자료 구조에 접근할 수 없다.
  • 한 프로세스가 다른 프로세스의 자원에 접근하려면 프로세스 간의 통신(IPC, inter-process communication)을 사용해야 한다
    ex) 파이프, 파일, 소켓 등을 이용한 통신 방법 이용

📢
우리가 OS에서 작업을 할 때 (보통)웹 브라우저, 음악 플레이어 동시에 켜둔 상태에서 작업한다.
이런 작업이 동시에 이루어 질 수 있는 건 CPU가 시간을 분할해서 CPU 사용 할 수 있는 제어권을 각각 프로그램에게 한 번씩 나눠주고 있기 때문이다. 보통 이 하나의 작업, 즉 운영체제에서 실행중인 하나의 프로그램을 프로세스라고 하며 작업이 여러 개 이루어 진다는 것은 프로세스 여러개가 동시에 동작한다는 의미. 두 개 이상의 프로세스가 실행되는 것을 멀티 프로세스라 하고, 이 멀티 프로세스를 실행해서 일을 처리하는 것을 멀티 태스킹이라고 한다.

스레드(Thread)

: "프로세스 내에서 실행되는 여러 흐름의 단위"

  • 프로세스의 특정한 수행 경로
  • 프로세스가 할당받은 자원을 이용하는 실행의 단위
  • Light Weight Process라고도 함

👀 특징

  • 스레드는 프로세스 내에서 각각 Stack만 따로 할당받고, Code, Data, Heap 영역은 공유한다.
  • 스레드는 한 프로세스 내에서 동작되는 여러 실행의 흐름으로, 프로세스 내의 주소 공간이나 자원들 (힙 공간 등)을 같은 프로세스 내에서 스레드끼리 공유하면서 실행된다.
  • 같은 프로세스 안에 있는 여러 스레드들은 같은 힙공간 공유. 반면에 프로세스는 다른 프로세스의 메모리에 직접 접근할 수 없다.
  • 각각 스레드는 별도의 레지스터와 스택을 갖고 있지만, 힙 메모리는 서로 읽고 쓸 수 있다.
  • 한 스레드가 프로세스 자원을 변경하면, 다른 이웃 스레드(sibling thread)도 그 변경 결과를 즉시 볼 수 있다.
  • 1개의 프로세스를 3개의 스레드로 구성한 것은 3개의 프로세스와 같은 처리속도를 낸다.

📢
스레드는 프로세스 내에서 실행되는 세부 작업의 단위. 여러개의 스레드가 모여 하나의 프로세스를 구성하며, 이 하나의 프로세스를 구성하는 여러개의 스레드를 멀티스레드라고 부른다. 스레드는 한 번에 하나씩 밖에 동작 할 수 없으며, 어떤 스레드가 먼저 실행 될 지는 아무도 알 수 없다.
운영체제에서 프로그램을 실행하게 되면 하나의 프로세스가 동작하게 되며, 이 프로세스는 자신을 구성하고 있는 스레드를 하나씩 CPU에게 아주 빠르게 실행시키도록 한다.

멀티 태스킹? 멀티 프로세싱? 멀티 스레드?

- 멀티 태스킹(= 멀티 프로그래밍)

: CPU가 하나 있고, 수시로 프로세스를 변경하면서 프로그램을 실행하는 것 (결과적으로 사람 눈에는 모든 프로세스가 동시에 실행되는 것처럼 보임)

- 멀티 프로세싱

: 하나의 작업을 여러 개의 CPU를 사용해서 실행시키는 행위 (여러 프로세스가 작업을 병렬처리 하는 것) + 여러 작업을 여러 개의 CPU를 사용해서 처리하는 행위 - 프로그램이 여러개 띄워져 있는 형식.

- 멀티 스레드

: 스레드를 여러개 만들어, 멀티 코어를 통해 활용도를 높임

💘 장점

  1. 사용자에 대한 응답성 향상
  2. 자원 공유 효율
  3. 작업이 분리되어 코드가 간결

💔 단점

  1. 스레드 중 한 스레드만 문제가 있어도 전체 프로세스가 영향 받음
  2. 스레드를 많이 생성하면 context switching이 많이 일어나서 성능 저하 (모든 스레드를 스케쥴링해 해야하므로, context switching이 빈번할 수 밖에 없다)

context switching : CPU가 여러 프로세스를 돌아가면서 작업을 처리하는 과정. 동작 중인 프로세스가 대기하면서 해당 프로세스의 상태(context)를 보관하고, 대기하고 있던 다음 순서의 프로세스가 동작하면서 이전에 보관했던 프로세스의 상태를 복구하는 작업을 말한다.

스레드의 동기화(synchronization)

: 여러 개의 스레드가 같은 프로세스 내 자원 공유해서 작업하다 보면 서로의 작업이 다른 작업에 영향을 주기 때문에 동기화가 필요 -> 임계영역(critical section)과 잠금(lock)을 사용

  • 임계영역(critical section) : 멀티 스레드에 의해 공유 자원이 참조할 수 있는 코드의 범위. 한 번에 한 스레드만 접근이 가능한 영역.
  • 잠금(lock) : 공유 객체에 여러 스레드가 동시에 접근하지 못하도록 하기 위한 것. 모든 객체가 힙 영역에 생성될 때 자동으로 만들어진다.

동기화 필요 예제

  • 프로세스 안에는 여러개의 스레드가 형성
  • 프로세스 안에 있는 영역 공유
  • 스레드 A, B, C가 있다고 가정하면, 공유하고 있는 프로세스 자원에 동기화 문제가 발생할 수 있음
  • 스레드 A, B, C의 실행순서는 스케쥴러가 상황에 맞게 결정되기 때문에 동기화 문제 발생

방법

  1. 메서드 전체를 임계영역으로 설정
  2. 특정한 영역을 임계영역으로 설정(객체의 참조변수)

프로세스와 스레드 둘 다 교착상태(Deadlock)기아상태(Starvation)이 일어날 수 있다.

기아상태(Starvation) : 특정 프로세스의 우선순위가 낮아서 원하는 자원을 계속 할당받지 못하는 상태

⚔ 프로세스 vs 스레드

  • 프로세스는 독립적, 스레드는 프로세스의 서브셋
  • 프로세스는 각각 독립적 자원을 가지는 반면 스레드는 프로세스의 자원 공유
  • 프로세스는 자신만의 주소영역을 가지나 스레드는 주소영역을 공유
  • 프로세스간에는 ipc기법으로 통신. 스레드는 필요 없음
  • 프로세스는 context switchng 할 경우 캐쉬 메모리를 초기화 하게되지만, 스레드는 메모리를 공유하므로 꽤 큰 처리 비용이 드는 초기화 할 필요 없음.

참고 : https://12bme.tistory.com/65?category=682904

profile
배움기록

0개의 댓글