프로세스 사이의 통신 방법

프로세스보다 크기가 작아서 프로세스보다
생성 및 소멸이 빠르고, 컨텍스트 스위칭이 빠르며, 통신이 빠른 실행 단위
가벼운 프로세스(Light-Weight Process, LWP)라고도 부름
스레드는



응용프로그램은 스레드가 실행할 작업을 함수로 작성
스레드를 만들어줄 것을 운영체제에 요청하면 스레드 생성
운영체제는 TCB 생성, 함수의 주소를 스레드 시작 주소로 TCB에 등록
스레드 생성이란, 곧 TCB 생성
스레드는 운영체제 뿐만 아니라 스레드 라이브러리에 의해 구현되기도 한다.
스레드 라이브러리에 의해 구현되는 경우, 스레드를 다루지 않은 운영체제에서도 멀티스레딩 응용프로그램을 작성할 수 있음
운영체제는 TCB 리스트로 스레드 관리
스레드 스케줄: TCB 중에서 하나 선택, 스레드 단위로 스케줄
TCB에 기록된 스레드의 시작 주소를 CPU에 옮기면 실행 시작됨
#include <pthread.h> // pthread 라이브러리를 사용하기 위해 필요한 헤더 파일
#include <stdio.h>
#include <stdlib.h>
void* calcThread(void *param); // 스레드로 작동할 코드(함수)
int sum = 0; // main 스레드와 calcThread가 공유하는 전역 변수
int main() {
pthread_t tid; // 스레드의 id를 저장할 정수형 변수
pthread_attr_t attr; // 스레드 정보를 담을 구조체
pthread_attr_init(&attr); // 디폴트 값으로 attr 초기화
pthread_create(&tid, &attr, calcThread, "100"); // calcThread 스레드 생성
// 생성된 calcThread 스레드는 커널에 의해 언젠가 스케줄되어 실행
pthread_join(tid, NULL); // tid 번호의 스레드 종료를 기다림
printf("calcThread 스레드가 종료하였습니다.\n");
printf("sum = %d\n", sum);
}
void* calcThread(void *param) { // param을 통해 "100"을 전달 받음
printf("calcThread 스레드가 실행을 시작합니다.\n");
int to = atoi(param); // to = 100
int i;
for(i=1; i<=to; i++) // 1에서 to까지 합 계산
sum += i; // 전역 변수 sum에 저장
}
실행 과정


함수는 다른 함수에 의해 호출되어 실행되지만,
스레드 함수의 코드는 CPU가 바로 실행하도록 커널에 의해 직접 제어된다.
동시성(concurrency)

병렬성(parallelism)

스레드가 실행 중에 사용하는 메모리 공간으로
스레드의 코드, 데이터, 힙, 스택 영역이며,
이들은 모두 프로세스의 주소 공간에 형성된다.
스레드 사적 공간
스레드 스택
스레드 로컬 스토리지(Thread Local Storage, TLS)
운영체제에 따라 다르지만, 대체로 힙이나 스택 영역에 할당됨
스레드 사이의 공유 공간
프로세스의 코드(스레드 코드 포함)/데이터/힙 공간

스레드 코드 영역
스레드 데이터 영역
스레드 힙
malloc()를 호출하면 프로세스의 힙 공간에서 메모리 할당스레드 스택
스레드 로컬 스토리지(Thread Local Storage, TLS)
스레드마다 안전하게 다루고자 하는 데이터를 저장하기 위한 별도의 영역
프로세스의 데이터 영역은 모든 스레드들의 공용 공간이기 때문
스레드가 자신만 사용할 변수들을 선언할 수 있는 영역
지역 변수와는 달리, TLS 변수는 스레드가 어떤 함수에서든 접근이 가능함
(해당 스레드 한정, 전역 변수처럼 활용 가능)
운영체제마다 다르지만, 대체로 프로세스의 힙이나 스택 영역에 할당됨
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
void printsum(); // 모든 스레드에 의해 호출되는 함수
void* calcThread(void *param); // 스레드 코드(함수)
static __thread int tsum = 5; // 스레드 로컬 스토리지(TLS)에 tsum 변수 선언
int total = 0; // 프로세스의 전역 변수, 모든 스레드에 의해 공유
int main() {
char *p[2] = {"100", "200"};
int i;
pthread_t tid[2]; // 스레드의 id를 저장할 정수 배열
pthread_attr_t attr[2]; // 스레드 정보를 담을 구조체
// 2개의 스레드 생성
for(i=0; i<2; i++) {
pthread_attr_init(&attr[i]); // 구조체 초기화
pthread_create(&tid[i], &attr[i], calcThread, p[i]); // 스레드 생성
printf("calcThread 스레드가 생성되었습니다.\n");
}
// 2개 스레드의 종료를 기다린 후에 total 값 출력
for(i=0; i<2; i++) {
pthread_join(tid[i], NULL); // 스레드 tid[i]의 종료대기
printf("calcThread 스레드가 종료하였습니다.\n");
}
printf("total = %d\n", total); // 2개 스레드의 합이 누적된 total 출력
return 0;
}
void* calcThread(void *param) { // 스레드 코드
printf("스레드 생성 초기 tsum = %d\n", tsum); // TLS 변수 tsum의 초기값 출력
int i, sum = 0; // 지역 변수
for(i=1; i<= atoi(param); i++) sum += i; // 1~param까지 더하기
tsum = sum; // TLS 변수 tsum에 합 저장
printsum();
total+=sum; // 전역 변수 total에 합 누적
}
void printsum() { // 모든 스레드가 호출할 수 있는 공유 함수
printf("계산 후 tsum = %d\n", tsum);
}


Q1. 이 프로그램이 실행되는 동안 총 몇개의 스레드가 실행되는가?
main() 스레드를 포함하여 총 3개의 스레드가 실행된다.
Q2. tsum은 무슨 변수라고 부르며, total 변수와의 차이점은 무엇인가?
TLS(Thread Local Storage) 변수.
모든 스레드가 공유하는 total 변수와는 다르게,
각 스레드의 독립적인 공간에 할당되는 변수이다.

응용프로그램이 스레드에 대해 할 수 있는 운용의 종류
스레드 생성
스레드 종료
exit() 시스템 호출을 부르면main() 함수 종료) - 모든 스레드 종료pthread_exit()와 같이 스레드만 종료하는 함수 호출 시main() 함수에서 pthread_exit()를 부르면 main() 스레드만 종료main() 스레드에서 return이나 exit()를 호출하면 프로세스가 종료되지만, pthread_exit()를 호출하면 main() 스레드만 종료된다.
종료가 되면 TCB의 연결이 해제되며 TCB와 스레드 스택은 사라지지만,
스레드가 실행했던 코드는 그대로 존재한다.
스레드 조인
다른 스레드가 종료할 때 까지 대기
주로 부모 스레드가 자식 스레드의 종료 대기

스레드 양보
스레드가 자발적으로 yield() 와 같은 함수 호출을 통해 스스로 실행을 중단하고 다른 스레드를 스케줄하도록 요청
스레드 컨텍스트 정보
PC 레지스터
다음에 실행할 코드 주소
SP 레지스터
실행 중인 함수의 스택 톱 주소
상태 레지스터
현재 CPU의 상태 정보
이러한 정보들이 컨텍스트 스위치 될 때 TCB에 저장이 됨
스레드를 실행 단위로 다루기 위해 스레드에 관한 정보를 담은 구조체
스레드 엔터티(thread entity) 또는 스케줄링 엔터티(scheduling entity)
커널 영역에 만들어지고 커널에 의해 관리됨
스레드가 생성될 때 커널에 의해 만들어지고, 스레드 소멸되면 사라짐


준비 리스트
블록 리스트

운영체제에게 스레드는 TCB이다
스레드 스케줄링 후,
현재 실행중인 스레드를 중단시키고, 선택된 스레드에게 CPU 할당
현재 실행중인 스레드의 컨텍스트를 TCB에 저장 후,
선택된 스레드의 TCB에서 컨텍스트를 적재, CPU는 선택된 스레드 실행

시스템 호출이나 인터럽트 서비스 도중에 발생
1) 스레드가 자발적으로 다른 스레드에게 양보하는 경우(시스템 호출 내)
yield() 시스템 호출을 불러 다른 스레드에게 양보sleep()이나 wait() 등의 시스템 호출을 하는 경우2) 스레드가 I/O 작업을 요청하는 시스템 호출 시 블록되는 경우(시스템 호출 내)
read(), sleep(), wait() 등 I/O가 발생하거나 대기할 수 밖에 없는 경우3) 스레드의 타임 슬라이스를 소진한 경우(인터럽트 서비스 루틴 내)
4) I/O 장치로부터 인터럽트가 걸린 경우(인터럽트 서비스 루틴 내)
1) CPU 레지스터 저장 및 복귀
2) 커널 정보 수정

별도의 스케줄링 스레드는 존재하지 않으며,
스케줄링 코드가 존재하여 시스템 호출이나 인터럽트 과정에서 호출된다.
컨텍스트 스위칭 작업은 모두 CPU 작업 → CPU 시간 소모
컨텍스트 스위칭의 시간을 최소화 할 필요가 있음
다른 프로세스로 교체되면, CPU가 실행하는 주소 공간이 바뀌는 큰 변화로 인해 추가적인 오버헤드가 발생
컨텍스트 스위칭은 CPU 시간이 소모되는 CPU 집중(CPU intensive) 작업
프로세스를 특정 CPU 코어에 배치하여,
CPU가 여러 프로세스에 걸쳐 스레드를 실행하지 않도록 함
CPU에 별도 레지스터 셋을 두어
CPU의 레지스터들을 TCB에 저장하지 않는 방법을 사용하기도 함
스레드는 스케줄링 주체에 따라 2종류로 구분됨
순수 커널 레벨 스레드(pure kernel level thread)
부팅할 때부터 커널 공간에서 실행되도록 작성된 커널 레벨 스레드


개요: 프로세스 2개, 커널 레벨 스레드 4개, 사용자 레벨 스레드 3개,
2개의 순수 커널 레벨 스레드
TCB1, TCB2
2개의 커널 레벨 스레드
프로세스당 하나의 커널 레벨 스레드(main) 자동 생성
3개의 사용자 레벨 스레드
스레드 스케줄링
커널에 의한 스케줄
프로세스2에서의 사용자 스레드 스케줄링
스레드 라이브러리가 3개의 사용자 레벨 스레드 스케줄
초기에는 커널 레벨 스레드만 존재
→ 컨텍스트 스위칭에 많은 시간 소요
→ 커널의 도움 없이 스레드를 만들 수 있는 스레드 라이브러리 등장
스레드를 지원하지 않는 운영체제에서도 스레드 라이브러리를 이용하여 멀티스레드 응용프로그램을 작성할 수 있는 장점이 있음

사용자 레벨 스레드 > 커널 레벨 스레드
커널 레벨 스레드
사용자 레벨 스레드
사용자 레벨 스레드 > 커널 레벨 스레드
사용자 레벨 스레드
사용자 레벨 스레드 < 커널 레벨 스레드
커널 레벨 스레드
사용자 레벨 스레드
read()나 write() 시스템 호출을 실행하여 블록 상태가 될 때, 응용프로그램 내 모든 사용자 레벨 스레드가 실행될 수 없게 됨사용자 레벨 스레드 < 커널 레벨 스레드
커널 레벨 스레드
사용자 레벨 스레드
응용프로그램에서 작성한 스레드가 시스템에서 실행되도록 구현하는 방법
pthread 라이브러리의 pthread_create() 함수를 호출하여 스레드를 생성하는데, 생성되는 스레드가 사용자 레벨 스레드인지, 커널 레벨 스레드인지 생각하지 않고 프로그램을 작성함.응용프로그램에서 생성된 사용자 레벨 스레드의 코드가
CPU에 의해 실행되려면 커널에 의해 스케줄되어야 함
→ 사용자 레벨 스레드와 커널 레벨 스레드가 연계(매핑, mapping)되어야 함


장점
단점
멀티 코어 CPU가 보편화된 현대 컴퓨터에서 비효율적
프로세스에 속한 여러 사용자 레벨 스레드들의 병렬 처리 안됨
하나의 사용자 레벨 스레드가 블록되면 프로세스 전체 블록(병렬성이 없음)
프로세스 내 다른 사용자 레벨 스레드로 스위칭되지 못함


장점
단점

장점
단점