[운영체제] 프로세스 주소 공간

림예·2024년 3월 14일

운영체제

CS_운영체제

목록 보기

3/11

앞에서 프로세스를 다루면서, 우리는 프로세스에 대해 운영체제가 자원을 할당하는 단위 라고 언급했었다.

프로세스가 메모리를 할당 받으면, 자신만의 방법으로 메모리를 관리하기 위해 이 공간들을 어떤 구조로 관리하는데, 우리는 이를 프로세스 주소 공간이라고 부른다.

프로세스의 주소 공간은 대략적으로 다음과 같이 생겼으며, 각각의 구역을 살펴보면 다음과 같다.

Stack 영역

프로그램이 자동으로 사용하는 임시 메모리 영역이며, 함수의 호출과 관계되는 지역 변수와 매개변수가 저장되는 영역이다.

Stack 영역의 값은 함수의 호출과 함께 할당되며, 함수의 호출이 완료되면 소멸한다.
원시타입의 데이터가 값과 함께 할당된다.
Heap 영역에 생성된 Object 타입의 데이터 참조값이 할당된다.
메모리의 상위 주소에서 하위 주소 방향으로 할당된다.
컴파일 타임에 크기가 결정되어 무한히 할당 할 수 없다. 재귀 함수가 너무 깊게 호출되거나 함수가 지역변수를 너무 많이 가지고 있어 stack 영역을 초과하면 stack overflow 에러가 발생한다.

프로그램의 함수와 지역 변수는, LIFO(가장 나중에 들어간게 먼저 나옴)특성을 가진 스택에서 실행된다. 
따라서 이 함수들 안에서 공통으로 사용하는 '전역 변수'는 따로 지정해주면 메모리를 아낄 수 있다.

Heap 영역

런타임에 크기가 결정되는 영역이다.

사용자에 의해 공간이 동적으로 할당 및 해제된다.
주로 참조형 데이터 (ex. 클래스) 등의 데이터가 할당된다.
메모리의 하위 주소에서 상위 주소의 방향으로 할당된다.

Data 영역

전역 변수나 Static 변수 등 프로그램이 사용할 수 있는 데이터를 저장하는 영역이다.

프로그램의 시작과 함께 할당되며, 프로그램이 종료되면 소멸한다.
초기화 된 데이터는 data 영역에 저장되고, 초기화 되지 않은 데이터는 BSS (Block Stated Symbol) 영역에 저장된다.
함수 내부에 선언된 Static 변수는 프로그램이 실행 될 때 공간만 할당되고, 그 함수가 실행 될 때 초기화 된다.
전역변수, static 값을 참조한 코드는 컴파일 후 Data 영역의 주소값을 가르키도록 변경된다.

Text (Code) 영역

프로그램이 실행될 수 있도록 CPU가 해석 가능한 기계어 코드가 저장되어 있는 공간으로, 프로그램이 수정되면 안 되므로 ReadOnly 상태로 저장 되어있다.

왜 이렇게 구역을 나눈건가요?

최대한 데이터를 공유하여 메모리 사용량을 줄여야 한다.

Stack 영역과 Data 영역을 구분한 이유는 무엇일까?
가장 큰 이유는 역할의 분배이다. 우리는 Stack 영역을 통해 함수의 흐름을 관리하고, Data 영역 (+BSS 영역)을 통해 전역 변수, static 변수를 관리한다.

만약 한 프로세스가 여러개의 스레드를 갖는다면, 각각의 스레드는 자신만의 Stack 영역을 갖는다. 이는 스레드 내에서 수행되는 함수의 흐름을 각각 관리하기 위함이다.

여기에서 영역을 구분한 또 다른 중요한 이유가 나오는데, 바로 Data 영역의 공유이다. 각각의 스레드는 Stack 영역을 갖긴 하지만 Data 영역은 공유한다. 즉, 각각의 스레드가 사용하기 위해 Data 영역의 동일한 내용을 공유함으로써, 똑같은 공간을 여러개 만들지 않고 메모리를 절약할 수 있다. (이는 Code 영역에서도 마찬가지다!)