컴퓨터마다 물리 메모리, 즉 실제 메모리의 크기가 다르다. 가상 메모리(virtual memory)는 크기가 다른 물리 메모리에서 일관되게 프로세스를 실행할 수 있는 기술이다. 예를들어 2GB 메모리에서 동작하는 프로그램이 1GB 메모리에서는 동작하지 않을 수 있다.
즉 가상 메모리는 물리 메모리 크기와 상관없이 프로세스에 커다란 메모리 공간을 제공하는 기술이다. 프로세스는 운체가 어딨는지, 물리 메모리 크기가 어느정도인지 신경쓰지 않고 마음대로 사용한다.
가상 메모리 시스템의 프로세스는 물리 메모리와 별개로 어디있든지 0번지부터 시작하는 연속된 메모리를 가진다. 논리주소와 유사하지만 논리 주소는 물리 메모리의 주소 공간에 비례하지만, 가상 주소는 물리 메모리가 아니라 진짜 가상의 주소 공간이다.
가상 메모리에서 메모리 관리자가 사용할 수 있는 메모리의 전체 크기는 물리 메모리(실제 메모리)와 스왑 영역을 합한 크기이다. 메모리 관리자는 물리 메모리와 스왑 영역을 합쳐서 프로세스가 사용하는 가상 주소를 실제 메모리의 물리 주소로 변환하는데 이러한 작업을 동적 주소 변환(Dynamic Address Translation, DAT)라고 한다. 동적 주소 변환을 거치면 프로세스가 아무 제약 없이 사용자의 데이터를 물리 메모리에 배치할 수 있다. 이 과정에서 메모리 관리자는 물리 메모리를 어떤 방법으로 나눌지, 사용자 프로세스를 어디에 배치할지, 부족한 물리 메모리를 어떻게처리할지 등의 복잡한 문제를 처리한다.
메모리 분할 방식은 가변 분할 방식과 고정 분할 방식으로 나뉜다고 했는데 가상 메모리 시스템도 마찬가지다. 가상 메모리 시스템에서 가변 분할 방식을 이용한 메모리 관리 기법은 세그먼테이션, 고정 분할 방식을 이용한 메모리 관리 기법은 페이징이라고 한다.
이 중 세그멘테이션 기법은 외부 단편화 등의 문제로 잘 사용되지 않는다. 또한 페이징 기법은 페이지 관리에 어려움이 있다. 따라서 가상 메모리 시스템에서는 두 기법의 단점을 보완한 세그먼테이션-페이징 혼용 기법을 주로 사용한다.
구분 | 가상 메모리 | 물리 메모리 |
---|---|---|
최대 메모리 크기 | CPU의 비트 값에 의존 | CPU의 비트 값에 의존 |
메모리 분할 방식 | 세그먼테이션 | 가변 불항 방식 |
페이징 | 고정 분할 방식 | |
세그먼테이션-페이징 혼용 기법 | ||
주소 지정 방식 | 가상 주소 | 절대 주소, 상대 주소 |
메모리 관리는 매핑 테이블을 사용한다. 가상 메모리 시스템에서 가상 주소는 실제로 물리 주소나 스왑 영역 중 한 곳에 위치하며, 메모리 관리자는 가상 주소와 물리 주소를 일대일 매핑 테이블로 관리한다.
예를들어
프로세스(가상 주소 공간) | 위치(물리 메모리) |
---|---|
A | 0 |
B | 1 |
C | 2 |
D | 스왑 |
..
과 같은 형식이다.페이지 매핑 테이블, 세그먼테이션 매핑 테이블(세그먼테이션 테이블)로 나뉜다.
페이징 기법은 고정 분할 방식을 이용한 가상 메모리 관리 기법이다. 물리 주소 공간을 같은 크기로 나눠 쓴다.
가상 주소의 분할된 각 영역은 페이지라고 부르며 첫 번째 영역은 페이지 0, 두 번째는 1과 같이 번호를 매겨 관리한다. 물리메모리의 각 영역은 가상 주소의 페이지와 구분하기 위해 프레임(frame)이라고 부른다. 프레임도 번호를 매겨 관리한다. 페이지와 프레임의 크기는 같다.
페이지와 프레임의 크기가 같기 때문에 페이지는 어떤 프레임에도 배치될 수 있다. 그래서 매핑하기 쉽다. 모든 페이지의 위치 정보(매핑 정보)는 페이지 테이블에 담겨있다.
페이지 테이블은 하나의 열로 구성된다. 모든 페이지의 정보를 순서대로 가지고 있기 때문에 위에서부터 차례대로 페이지0, 페이지1과 같은 프레임 번호를 가지고 있어 추가열이 필요없다. 즉 그냥 0번부터 숫자 세면 돼서 인덱스가 필요없다. 물리메모리에 없고 스왑영역에 있다면 invalid라고 표시된다.
가상주소 -> 페이지 테이블 -> 물리주소 식으로 되어있다.
그렇다면 저런식으로 할 때 변환은 어떻게 하면될까?
1. 가상 주소 n번지가 테이블에서 어느 페이지인지 찾는다.
2. 가상 주소가 찾은 페이지가 페이지 테이블에서 어느 프레임을 가리키는지 찾는다.
3. 최종적으로 찾은 프레임에 값을 저장한다. 즉 가상 주소를 물리주소로 매핑하게 된다.
페이징 기법에서 가상 주소를 VA(virtual address) = <P(page),D(distance)> 로 표현하는데 VA는 가상 주소, P는 페이지, D는 페이지의 처음 위치에서 해당 주소까지의 거리를 나타낸다.(D를 offset(변위)라고 정의하기도 한다.)
예를들어 페이지3이 30~39의 주소를 저장하고(페이지 하나의 크기를 10B로 한다고 했을때) 가상 주소 30번지를 접근한다고 하면 VA = <3,0> , 즉 페이지3에 0번째 주소라는 의미이다. 물리 주소는 PA(physical address) = <F(frame),D>로 표현한다.
페이징 기법에서의 주소 변환은 가상 주소 VA = <P,D>를 물리 주소 PA = <F, D>로 변환하는 것이다.
즉 VA = <P, D> -> PA = <F,D>로 정의된다.
페이지와 프레임의 크기가 같기 때문에 D는 그대로 사용한다. 이처럼 페이지 테이블에서 번호를 찾아 해당 프레임의 번호를 쫓아 가면 간단하게 가상 주소를 물리 주소로 변환할 수 있다. 페이지 테이블은 페이지 번호, 프레임 번호로 구성되며, 각각의 한 줄은 페이지 테이블 엔트리(Page Table Entry, PTE)라고 부른다.
P = 가상주소/한페이지의크기의 몫
D = 가상주소/한페이지의크기의 나머지
VA = <P,D>만 구한다면 매핑하는 것은 P로 프레임을 찾은 뒤 해당 프레임에서 D만큼 떨어진 곳에 접근하여 데이터를 가져오면 된다.
페이지 테이블 관리가 복잡한 이유는 시스템에 여러 개의 프로세스가 존재하고 프로세스마다 페이지 테이블이 하나씩 있기 때문이다. 그리고 페이지 테이블관리의 가장 큰 문제는 페이지 테이블의 크기가 작지 않다는 것이다. 만약 CPU에 한 페이지가 512B인 페이징 시스템이 있다고 하자. 만약 물리 메모리의 최대 크기가 4GB라면 , 512B로 페이지를 나누면 최대 24MB가 나온다. 즉 페이지 테이블당 최대 24MB가 나올수 있다는 말이다. 프로세스가 40개라면 1GB가 되는데 이는 1/4에 해당하는 메모리이다. 따라서 페이지 테이블의 크기를 적당하게 유지하는 것이 페이지 테이블 관리의 핵심이다. 이러한 문제 때문에 물리 메모리의 크기가 작을때 프로세스 뿐만 아니라 페이지 테이블의 일부도 스왑영역으로 옮겨진다.
그리고 페이지 테이블에 빠르게 접근하기 위해 레지스터가 존재한다. 각 프로세스가 메모리에 접근하려고 할 때 메모리 관리자는 페이지 테이블의 위치를 빠르게 파악해야한다. 그래서 각 페이지 테이블의 시작 주소를 페이지 테이블 기준 레지스터(Page Table Base Register, PTBR)에 보관한다.이는 각 PCB에 저장되는 데이터로, 물리 메모리 내에 페이지 테이블의 시작 주소를 가지고 있다.
페이지 테이블 전체를 메모리에서 관리하냐, 일부를 스왑 영역에서 관리하느냐에 따라 가상 주소를 물리 주소로 변환하는 방법이 달라진다.
페이지 테이블 매핑 방식에는 직접 매핑, 연관 매핑, 집합-연관 매핑, 역매핑이 있다.
TLB(Translation Lock-aside Buffer, 변환 색인 버퍼) : 페이지 번호와 프레임 번호로 구성된 작은 크기의 테이블이다.
Associate Register : 연관 버퍼
가변 분할 방식을 이용한 가상 메모리 관리 기법으로, 물리 메모리를 프로세스 크기에 따라 가변적으로 나누어 사용한다.
마찬가지로 매핑 테이블을 사용하는데 이를 세그먼테이션 테이블(segmentation table) or 세그먼테이션 매핑 테이블(segmentation mapping table) 이라고 한다. 세그먼테이션 테이블에는 세그먼테이션의 크기를 나타내는 limit와 물리 메모리상의 시작 주소를 나타내는 address가 있다.
세그먼테이션도 물리 메모리가 부족하면 스왑 영역을 사용한다. 스왑영역에 있으면 address에 I로 표시한다.
세그먼테이션 기법은 가변 분할 방식의 장점과 단점을 모두 가지고 있다. 장점은 메모리를 프로세스 단위로 관리하기 때문에 페이지 테이블이 작고 단순하고, 단점은 물리 메모리의 외부 단편화로 인해 물리 메모리 관리가 복잡하다.
세그먼테이션 기법은 가상 주소를 VA=<S,D>로 표현한다.S는 세그먼트 번호(segment number),D는 세그먼트 시작 지점에서 해당 주소까지의 거리(distance)를 의미한다. 가상 메모리 시스템에서 사용자에게 보이는 메모리는 항상 0부터 시작하므로 D는 사용자가 지정한 주소 그 자체이다.
만약 프로세스 A의 32번지에 접근할 때 주소 변환 과정이 있다고 하자. VA=<0,32>라고 하자.
1. 가상 주소를 구한다. VA=<0,32>
2. 세그먼테이션 테이블에서 세그먼트 0의 시작 주소를 알아낸 후 시작 주소(세그먼테이션 테이블의 address) 120에 거리 32를 더하여 물리 주소 152를 구한다. 이때 메모리 관리자는 거리가 세그먼트의 크기보다 큰지 점검해야 한다. 크다면 메모리 오류, 작다면 물리 주소를 구한다.
3. 물리주소 152번지에 접근하여 원하는 데이터를 읽거나 쓴다.
세그먼테이션 테이블의 limit는 메모리를 보호하는 역할을 한다. A의 크기보다 더 큰 주소에 접근하려고 하면 메모리 관리자는 프로세스를 강제 종료하는데, 이를 이 오류를 트랩(trap)이라고 한다. 트랩은 의도치 않게 일으키는 인터럽트를 말한다. 트랩 발생시 segmentation fault를 보낸다. 따라서 VA=<S,D>에서 D는 메모리 보호의 의미가 있다.
앞에서 본 기법들은 각각 장단점을 가지고 있다. 페이징은 같은 크기로 관리해 메모리 관리가 쉽운 반면 테이블의 크기가 크다. 반대로 세그먼테이션은 관리는 어렵지만 테이블의 크기가 작다. 이러한 장점만 취한게 이 기법이다.
메모리 접근 권한은 읽기(read), 쓰기(write), 실행(execute), 추가(append) 권한이 있다. 일반적인 데이터는 읽기 및 쓰기 권한, 상수나 읽기 전용파일에는 읽기 권한이 적용된다. 따라서 메모리 제어 방식(access control modes)가 나오는데 아래와 같다.
구분 | 읽기 | 쓰기 | 실행 | 비고 |
---|---|---|---|---|
모드0 | X | X | X | 접근 불가 |
모드1 | X | X | O | 실행만 가능 |
모드2 | X | O | X | 실제로 사용하지 않음 |
모드3 | X | O | O | 실제로 사용하지 않음 |
모드4 | O | X | X | 읽기 전용 |
모드5 | O | X | O | 읽고 실행 가능 |
모드6 | O | O | X | 읽고 쓰기 가능 |
모드7 | O | O | O | 제한 없음 |
메모리 접근 권한 검사는 가상 주소에서 물리 주소로 주소 변환이 일어날 때마다 시행된다. 만약 읽기만 가능한 메모리 영역에서 쓰기를 하려고 하면 트랩이 발생한다. 어떤 기법이든 메모리 접근 권한에 대한 정보를 가지고 있으며, 주소 변환이 일어날 때마다 유용한 접근인지 아닌지 검사한다.
페이지마다 접근 권한이 다르기 때문에 메모리 페이지 테이블의 모든 행에는 접근 권환과 관련된 권한 비트(right bit)가 추가된다. 주소 변환마다 유용한 접근인지 확인한다. 이런 권한이 추가되면 당연하게 페이지 테이블의 크기가 커진다. 이러한 문제를 완화하려면 반복되는 권한 비트를 줄여아 한다.
이는 세그먼테이션 테이블을 이용하여 해결 가능하다. 페이지로 분할된 가상 주소 공간에서 서로 관련 있는 영역을 하나의 세그먼트로 묶어 세그먼테이션 테이블로 관리하고, 각 세그먼트를 구성하는 페이지를 해당 테이블로 관리하는 방식이다. 각 세그먼테이션 테이블은 자신과 연결된 페이지 테이블의 시작 주소를 가진다. 현재 대부분의 운영체제는 이 방식을 사용하고 있다.
세그먼테이션-페이지 혼용 기법을 사용함에 따라 줄어드는 데이터는 권한 비트만 있는것이 아니다. 유닉스는 소유 권환과 접근 권한이 같이 명시되어 있다. 어떤 파일이든 소유자가 지닌 권한 외에 자신이 속한 그룹이 지닌 권한, 자신의 그룹에 속하지 않은 다른사람이 지닌 권한이 명시되어 있다. 순수 페이징 기법은 이러한 특성을 모든 페이지 테이블에 새로운 속성 필드를 추가하지만, 혼용 기법은 세그테이블에서 관리함으로 추가되는 데이터의 양을 줄일 수 있다.
가상 주소를 VA = <S,P,D>로 표현한다. S는 세그먼트 번호, P는 페이지 번호, D는 페이지의 처음 위치에서 해당 주소까지의 거리이다.
1. 사용자가 어떤 주소에 있는 데이터를 요청하면 해당 주소가 몇 번째 세그먼트의 몇 번째 페이지로부터 얼마나 떨어져 있는지 계산하여 가상 주소 VA = <S,P,D>를 구한다.
2. 세그먼테이션 테이블의 해당 세그먼트 번호로 가서 자신의 영역을 벗어나는 불법 접근이 아닌지, 권한이 없는지 등을 확인한다. 만약 비정상적인 접근이면 트랩을 발생시킨다.
3. 페이지 테이블에서 해당 페이지가 어느 프레임에 저장되었는지 찾는다. 없으면 스왑영역에 가서 해당 페이지를 물리 메모리로 가져온다.
4. 물리 메모리에 있는 프레임의 처음 위치에서 D만큼 덜어진 곳에 접근하여 데이터를 읽거나 쓴다.