[컴퓨터구조] Procedure

노유성·2023년 9월 29일
0
post-thumbnail

Procedure란?

프로시저는 특정 작업을 수행하는 명령어의 모음 또는 코드 블럭을 의미한다. 쉽게 생각하면 함수라고 생각할 수 있다.

Procedure Calling


프로시저를 호출하면 위 그림과 같은 과정을 거친다.

먼저 인자들을 x0에서 x7까지 배치하고 통제 권한을 호출한 함수(프로시저)에게 넘긴다. 프로시저는 현재 레지스터에 할당된 다른 부모 스코프에 할당된 값들을 스택에 저장하기 위해서 저장공간을 획득하고 데이터를 저장한다. 명령어를 수행한 다음에는 결과를 레지스터에 저장하고 x30(Link Register)에 저장된 값으로 리턴한다.ㄴ

Procedure Call Instruction

프로시저를 콜하기 위한 명령어들이 있다. BLBR인데 알아보자.

BL은 프로시저를 호출할 때 사용하는 명령어이다. 프로시저의 라벨을 주어서 분기를 함과 동시에 프로시저를 종료하고 나서 수행할 다음 명령어를 LR에 저장한다.

BRLR에 저장된 다음 명령어의 주소를 PC에 저장하고 분기한다.

예시


Leaf Procedure의 예시를 한 번 보자.
4개의 long long type의 데이터를 인자로 받고 각각 x0~x3 레지스터에 저장한다. f는 x19 레지스터에 저장하는데 x19는 temporary register가 아니므로 기존의 값을 stack 저장 후에 사용해야 한다. 그리고 일시 저장소는 x9 x10을 사용할 것이다.

일단 제일 머저 기존에 x9, x10에 저장된 값들이 있을 수 있고 또 x19에 저장된 값도 저장을 해놓아야 하니 stack에 3개의 데이터를 저장할 수 있는 공간을 마련해야한다.
스택은 사용할 수록 번지 수가 낮아진다는 점을 감안하자.

전체적인 어셈블리 코드 절차는 위와 같다. 레지스터의 크기는 8바이트이므로 3개의 레지스터를 저장하기 위해 24바이트의 공간을 확보한다. 그리고 x9 x10 x19를 스택에 저장한다.

그 다음 인자로 넘어온 값을 이용해서 연산을 하고 x0 레지스터에 최종 결과를 저장ㅎ나다. 그리고 스택에 있는 값들을 복구한다음 LR에 적힌 주소로 브랜치한다.

다음은 Non-leat Procedure를 봐보자.

n값은 인자로 x0레지스터에 들어오고 결과는 x1레지스터에 저장하라고 한다.


어셈블리 코드는 위와 같다.
먼저 fact함수를 싦행을 하면 이전 스코프에서 사용했던 LR값과 N값을 저장할 스택 공간을 확보하고 저장한다. 그 다음 첫번째 조건문을 검사하기 위해서 n과 1을 빼는 SUBIS 연산을 한다. S가 붙었으므로 Condition code가 생기고 뺄셈 연산을 xZR에 저장한다는 것은 연산 결과를 사용하지 않겠다는 뜻이다. B.GE는 >= 이므로 조건문을 만족하지 않을 때이다. 그러 때는 L1 라벨로 이동하고 조건문을 만족하면 x1(리턴 값을 저장할 레지스터)에 1을 저장하고 SP를 원래대로 되돌리며 LR로 분기한다.

L1 라벨로 이동을 하면은 또 fact 함수를 호출해야하므로 n에서 1을 빼고 fact로 분기한다. 새로운 프로시저를 호출하는 것이므로 BL 명령어를 사용한다. 그러면 다으멩 수행할 LDUR x0. [SP, #0]의 주소가 LR에 담기고 프로시저가 호출된다.
그렇게 해서 callee가 종료되면은 x1에 데이터를 담고 스택 포인터를 원래대로 되돌리고 LR값으로 분기가 될 것이다.

분기가 된 이후 즉, L1 라벨의 2번째 줄에서는 스택에 저장한 자기 자신의 값(LR과 n의 값)을 가져오고 스택 포인터를 되돌리며 x1(callee가 리턴해준 값)과 x0(자신이 인자로 받은 값)을 곱해서 리턴할 레지스터 x1에 저장하고 LR(caller의 명령어)로 리턴한다.

Memory Layout


메모리는 4개의 구조로 이루어져 있다.

  • Text: 프로그램의 코드
  • Static data: 전역 변수나 java의 static 변수처럼 프로그램이 시작되고 종료될 때까지 메모리 주소가 변하지 않는 변수
  • Dynamic Data(heap): malloc()이나 new처럼 동적 할당된 데이터가 저장되는 공간
  • Stack: 프로시저 호출 등 다양한 이유로 레지스터의 데이터가 저장되는 공간

스택과 힙은 서로 공간을 공유하고 있고 힙은 아래에서 위로, 스택은 위에서 아래로 쌓인다. 그래서 힙은 사용할 수록 메모리 번지가 커지고, 스택은 사용할 수록 메모리 번지가 낮아진다.

Byte/Halfword Operations

LEGv8에서 데이터를 불러올 때 사용하는 명령어들을 알아보자.!

LDURB, STURB 모두 8bit 즉, 1바이트의 데이터를 가져오는 명령어이다. 각 데이터는 가장 오른쪽 8비트에 저장되거나, 가장 오른쪽 8비트를 가져와서 저장한다.

LDURH, STURH 또한 같은 메커니즘이지만 16비트, 즉 2바이트의 데이터를 가져온다.

예제


문자열을 복사하는 예제이다. 먼저 i를 사용할 건데 i는 x19 레지스터에 저장될 것이기 때문에 기존에 x19에 저장된 값을 스택에 저장하기 위해 스택에 8byte의 공간을 확보한 후 저장한다.

그리고 i에 0을 할당하기 위해 x19에 xZR, xZR을 저장한다. (이러면 0이 할당된다.)
그 다음 x1(y의 base address)에 x19(i)를 더해서 데이터의 위치를 확보한 후에 x10에 가져온다. 그 다음 x10 위치에 있는 데이터를 x11에 저장한다. 마찬가지로 x1에 x19를 더해서 저장할 x변수의 위치 x12에 저장한다.그리고 STURB 명령어를 이용해서 x11에 저장된 값을 x12에 저장한다. 여기서 중요한점은 STURB는 1byte의 데이터를 가져와서 저장하는 명령어이다. 문자를 복사하는 예제이고 문자는 1byte이므로 1byte만 가져와서 저장한다.

그 다음 x11에 저장된 데이터가 널 종료 문자인지 아닌지를 확인하고 맞아면 L2로 분기하고 아니면은 i에 1을 더하고 반복한다. 여기서 i는 index를 의미하지만 또 char은 단위가 1byte이기 때문에 memory address를 의미하기도 한다.

L2로 분기된 이후에는 i로 사용했던 x19 레지스터의 값은 원복하고 스택 포인터도 제자리로 위치시킨다. 그리고 LR로 분기한다.

32비트를 넘는 Constants

대부분의 contants는 작으나 12비트의 immediate가 부족한 경우가 있을 것이다.

그럴 때는 레지스터를 이용하고 MOVZ, MOVK 명령어를 이용한다. MOVZ 명령어는 주어진 범위만큼 숫자를 이동함과 동시에 나머지 비트를 0으로 초기화하고 MOVK 명령어는 초기화는 하지 않는다.

마지막 필드가 0이나 16이냐 32냐 48이냐에 따라서 어디에 값이 저장되는 지가 결정된다.

두 명령어는 IM-format이며 순서대로 코드는 무슨 코드인지, 몇 번째에 값을 기입할 것인지 몇을 기입할 것인지 어느 레지스터에 기입할 것인지를 저장한다.

예제


64비트의 constant를 레지스터에 저장할 때 어떻게 하면 되는지에 대한 예제이다. 먼저 MOVZ 명령어를 이용해서 나머지 필드를 초기화 하면서 데이터를 입력하고 MOVk 명령어를 이용해서 나머지를 입력하는 방식이다. MOVZ는 지나간 모든 자리를 0으로 초기화하므로 더 높은 비트를 먼저 초기화해주어야 한다.

Branch Addressing


B타입은 26비트를 이용해서 메모리 위치를 지정할 수 있고 CB타입은 19비트를 이용해서 메모리 위치를 지정해줄 수 있다. 그래서 실질적으로 메모리를 표현할 수 있는 범위가 그렇게 크지 않다. 이를 보완하기 위해 2가지 정책이 있다.

  1. 메모리를 상대적으로 바라보자. 다음에 분기해야할 명령어의 위치는 일반적으로 현재 명령어의 위치 근처에 있으므로 상대적 위치를 메모리 주소로 지정하면 좀 더 효율적이다.
  2. 명령어는 32bit 단위이므로 주소를 표현할 때 1byte가 아니라 명령어에 맞는 4byte단위로 주소를 지정하자. 그러면은 더 많은 주소를 나타낼 수 있다.

Synchronization

동기화 문제는 어떻게 해결할 수 있을까? 바로 STXR, LDXR명령어를 이용하면 된다. 일단 동기화는 하드웨어의 지원이 필요하다.


동기화를 하는 두 예제이다. 먼저 atomic swap을 하는 방법은 LDXR과 STXR을 바로 연달아서 사용하는 것이다. 그러면은 race condition의 여부를 레지스터에 담겨서 race condition의 여부를 알 수 있따.

두번째는 특정 sector를 lock/unlock하는 부분이다. 이 경우에도 1. lock을 읽어들이는 과정, 2. lock이 0이면 1로 저장하는 두 과정을 LDXR, STXR을 이용해서 race condition을 확인해서 락을 걸고 해제할 수 있다.

profile
풀스택개발자가되고싶습니다:)

0개의 댓글