운영체제는 코드와 데이터를 메모리에 가져오고, 프로세스 제어 블록을 생성하고, 작업에 필요한 메모리 영역을 확보한 후, 준비된 프로세스를 준비 큐에 삽입한다.
프로세스가 생성되면 CPU 스케줄러는 프로세스가 해야 할 일을 CPU에 전달하고 실제 작업은 CPU가 수행한다. 이때 CPU 스케줄러가 CPU에 전달하는 일 하나가 스레드이다. 그러므로 CPU가 처리하는 작업의 단위는 프로세스로부터 전달받은 스레드이다.
운영체제 입장에서의 작업 단위는 프로세스이고 CPU 입장에서의 작업 단위는 스레드인 것이다. 프로세스 입장에서는 스레드를 다음과 같이 정의할 수 있다.
💡 스레드는 프로세스의 코드에 정의된 절차에 따라 CPU에 작업 요청을 하는 실행 단위이다.프로세스끼리는 약하게 연결되어 있는 반면, 스레드끼리는 강하게 연결되어 있다.
여러 개의 프로세스로 구성된 멀티태스크와 하나의 프로세스에 여러 개
의 스레드로 구성된 멀티스레드의 차이는 다음과 같다.
프로세스를 여러 개 띄워놓고 여러 작업을 하려는 경우, fork() 시스템 호출로 문서 편집기 프로세스를 여러 개 만들게 된다. 하지만 이렇게 하면 프로세스의 코드 일부, PCB, 공유 변수가 메모리의 여러 곳에 중복되어 메모리가 낭비된다.
멀티스레드는 이러한 멀티태스킹의 낭비 요소를 제거하기 위해 사용한다. 비슷한 일을 하는 2개의 프로세스를 만드는 대신 코드, 데이터 등을 공유하면서 여러 개의 일을 하나의 프로세스 내에서 하는 것이다.
프로세스는 크게 정적인 영역과 동적인 영역으로 구분된다. 정적인 영역은 프로세스가 실행되는 동안 바뀌지 않는 영역이고, 동적인 영역은 스레드가 작업을 하면서 값이 바뀌거나 새로 만들어지거나 사라지는 영역이다.
동적인 영역의 대표적인 예는 레지스터 값, 스택, 힙 등이 있다.
💡 과거에는 프로세스 하나에 스레드가 하나였기 때문에 여러 작업을 하려면 fork()를 통해 여러 개의 프로세스를 만들어 사용했으나 오늘날에는 멀티스레드를 사용한다.이미지와 같이 하나의 프로세스 내에 여러 개의 스레드를 생성하는 멀티스레드는 코드, 파일 등의 자원을 공유함으로써 자원의 낭비를 막고 효율성을 향상한다.
다음은 java로 작성된 스레드 코드의 예제이다.
class TH_test extends Thread {
public void run() {
for (int i=0; i<100; i++)
System.out.println("Th_Test\n");
}
}
public class test_main {
public static void main(String[] args) {
TH_test TH_print=new TH_test();
TH_print.start();
for (int i=0; i<100; i++)
System.out,println("Test_Main\n");
}
}
위의 코드가 스레드를 사용하지 않은 일반 코드라면 ‘testmain’이 백 번 출력된 후 ‘TH test’가 백 번 출력될 것이다. 그러나 위의 코드는 2개의 스레드가 독립적으로 실행되기 때문에 ‘TH_test’와 ‘test_main’이 섞여서 출력된다.
다음은 C언어에서 2개의 프로세스를 사용하는 코드의 예제이다.
#include <stdio.h>
#include <unistd.h>
int main()
{
int i=0, pid;
pid=fork();
if(pid<0){
printf("Error");
exit(-1);
}
else if(pid==0){
for(i=0; i<100; i++)
printf("Th_Test\n");
exit(0);}
else {
for(i=0; i<100; i++)
/* parent */
printf("Test_Main\n");
exit(0);
}
}
이 코드는 자바 코드와 작업 결과가 같지만, fork() 시스템 호출을 사용하여 프로세스 제어 블록, 코드, 데이터 등이 모두 2배가 됨으로써 스레드를 사용하는 것보다 낭비가 심하다.
비디오 플레이어를 예로 들면, 재생할 파일을 저장장치로부터 가져오는 부분(입출력)과 데이터를 화면에 재생하는 부분으로 나뉜다.
이러한 기능을 단일 스레드로 구현하면 입출력을 요청한 프로세스는 입출력이 끝날 때까지 대기 상태로 전환된다. 단일 스레드는 프로세스 전체의 입출력이 끝날 때까지 대기 상태에 머무르며 요청한 입력이 끝나야만 다시 재생할 수 있다.
비디오 플레이어의 입출력과 재생을 멀티스레드로 구현하면 스레드가 독립적으로 작동하기 때문에 입출력 스레드가 대기 상태에 있더라도 재생 스레드는 실행 상태에 있게 된다. 따라서 멀티스레드의 경우 입출력과 상관없이 재생이 가능하다.
멀티스레드의 장점은 다음과 같이 요약할 수 있다.
멀티스레드는 장점뿐만이 아니라 단점도 있다.
여러 개의 프로세스를 사용하는 것은 낭비 요소가 있어 멀티스레드를 사용한다고 설명했는데 이는 단점으로 작용하기도 한다. 멀티스레드의 경우 모든 스레드가 자원을 공유하기 때문에 한 스레드에 문제가 생기면 전체 프로세스에 영향을 미친다.
반면 프로세스를 여러 개 만드는 방식의 경우 각 프로세스가 독립적이기 때문에 한 프로세스의 문제가 다른 프로세스로 전달되지 않는다.
애플리케이션을 예로 들어 설명하면 마이크로소프트의 인터넷 익스플로러(IE)는 멀티스레드를 사용하기 때문에 특정 화면에 문제가 생겨 해당 화면을 강제로 종료하는 경우 인터넷 익스플로러 전체가 종료된다.
반면, 크롬은 각 화면이 독립적인 프로세스이므로 그 중 하나에 문제가 생겨 종료하더라도 다른 화면에 미치는 영향이 적다.
최근에는 과거와 달리 메모리가 넉넉하고 멀티코어 CPU가 다중화되어 여러 개의 프로세스를 여러 개의 CPU에서 동시에 실행할 수 있게 되었다. 크롬은 멀티스레드의 사용으로 인해 다른 스레드가 영향을 받는 것을 최소화하기 위해 낭비 요소가 있더라도 멀티스레드 대신 멀티태스킹을 이용한다.
프로세스는 커널 프로세스와 사용자 프로세스로 나뉘며 스레드에도 커널 스레드(kernel thread)와 사용자 스레드(user thread)가 있다.
사용자 스레드가 커널 스레드를 사용하려면 시스템 호출로 커널 기능을 이용해야 한다.
사용자 스레드(user-level thread)는 운영체제가 멀티스레드를 지원하지 않을 때 사용하는 방법으로 초기의 스레드 시스템에서 이용되었다.
사용자 스레드는 사용자 레벨에서 스레드를 구현하기 때문에 관련 라이브러리를 사용해 구현하며 커널이 지원하는 스케줄링이나 동기화 같은 기능을 라이브러리가 대신 구현해준다.
사용자 스레드는 커널 입장에서는 일반 프로세스이지만 커널이 하는 일을 라이브러리가 대신 처리하여 여러 개의 스레드를 작동한다.
커널 스레드는 커널이 멀티스레드를 지원하는 방식으로, 하나의 사용자 스레드가 하나의 커널 스레드와 연결되어 1 to 1 모델이라고도 부른다.
커널 스레드는 독립적으로 스케줄링이 되므로 특정 스레드가 대기 상태에 들어가도 다른 스레드는 작업을 계속할 수 있다.
또한 커널이 제공하는 보호 기능과 같은 모든 기능을 사용할 수도 있다.
커널 스레드의 장단점은 사용자 스레드의 장단점과 정 반대라고 볼 수 있다.
멀티레벨 스레드multi-level thread 또는 하이브리드 스레드hybrid thread는 사용자 스레드와 커널 스레드를 혼합한 방식이므로 M to N 모델이라고 부른다.
멀티레벨 스레드는 사용자 스레드와 커널 스레드의 장단점을 모두 가지고 있다.