이 프로젝트는 어셈블리어와 친숙해지는 것을 목표로 한다.
어셈블리어가 뭔지 모른다면? 이 유튜브 시청을 강추. 아주 쉽게 잘 소개되어 있다.
기계어는 실제로 컴퓨터의 CPU가 읽어서 실행할 수 있는 0과 1로 이루어진 명령어의 조합이다. 이러한 각 명령어에 대해 사람이 알아보기 쉬운 니모닉 기호(mnemonic symbol)를 정해 사람이 좀 더 쉽게 컴퓨터의 행동을 제어할 수 있도록 한 것이 어셈블리 언어이다.
예를 들어,
10110000 01100001
는 x86 계열 CPU의 기계어 명령이고, 이것을 어셈블리어로 옮겨쓰면 다음과 같다.
mov al, 061h
명령어 mov는 영어 move를 변형한 니모닉이고, al은 CPU안에 있는 변수를 저장하는 레지스터
의 하나이다. 그리고, 061h는 16진수 61 (즉 십진수 97, 이진수 01100001)이다. 이 한 줄의 뜻은 '16진수 61을 al 레지스터에 넣으라'는 뜻이며, 1과 0의 반복인 기계어보다 사람이 혼동없이 이해하기 한결 쉽다. 어셈블리어는 이러한 문장들로 구성된다.
지금까지 우리가 작성한 C언어(고급어) 파일을
GCC(GNU Compiler Collection)
를 이용해 '전처리, 컴파일, 어셈블, 링크' 하는 과정을 거쳐 실행파일을 만들어 왔다. 지금까지는GCC
가 C언어를 어셈블리어로 컴파일 해주었지만, 이 프로젝트는 우리가 직접 어셈블리 파일을 만드는 것이다!
C나 Java 등과 다르게 어셈블리어는 정해진 표준이 없다.
그래서 여러 종류의 문법이 존재하는데, 그 중 가장 대표적인 문법이 AT&T 문법과 Intel 문법이다.
두 문법의 공통점은 opcode(명령어)와 operand(인자값)로 나뉜다는 점이다.
예)
ADD EAX, 9
(ADD operand 1, operand 2)
다만 두 문법의 차이점은 Intel 문법은 operand 1이 destination
이고 operand 2가 source
인 반면,
AT&T 문법은 operand 1이 source
, operand 2가 destination
이라는 점이다.
또 다른 차이점은 *Intel 문법은 숫자를 그냥 숫자 그대로(0,1,2,3..)
표기하지만,
AT&T 문법은 숫자 앞에 $를 붙여($0,$1,$2,$3..)
표기한다는 점이 있다.
레지스터를 표기할 때도 다른데, 레지스터가 무엇인지는 아래에서 설명할 것이다.
아무튼 Intel 문법은 레지스터를 레지스터 이름 그대로 (rax, rbx, rcx, rdx)
표기하지만,
AT&T 문법은 앞에 %를 붙여 (%rax, %rbx, %rcx, %rdx)
표기한다.
이외에도 메모리 주소를 참조할 때 Intel은 대괄호를 씌워서 [EAX]
이렇게 표기하고 At&T는 괄호를 씌워 (EAX)
이렇게 표기하는 등의 차이가 있다.
Offset(오프셋)의 경우도 Intel은 EAX 레지스터에서 +4 만큼 떨어진 메모리 주소를 표기할 때는 [EAX + 4]
와 같이 표현한다.
어셈블리어를 들여다보면 대충 Intel 식인지 AT&T 식인지 알아볼 수 있을 듯...
어쨌든 우리는 Intel 문법을 쓸 것이기 때문에 Intel 문법을 알아가면 되겠다.
CPU가 요청을 처리하는 데 필요한 데이터를 일시적으로 저장하는 기억장치가 이 그림의 가운데에 있는 레지스터이다.
실제로 컴퓨터에서 데이터를 영구적으로 저장하기 위해서는 하드디스크를 이용해야하고, 임시적으로 저장하는 장소를 메모리(RAM)라고 알고있을 것이다.
하지만 메모리로 연산의 결과를 보내고 영구적으로 저장할 데이터를 하드디스크에 저장하는 등의 명령을 처리하기 위해서는 이들에 대한 주소와 명령의 종류를 저장할 수 있는 기억 공간이 하나 더 필요하다.
그리고 이 공간은 무리없이 명령을 수행하기 위해 메모리보다 빨라야 한다. 바로 이런 역할을 하는 것이 레지스터이다.
레지스터는 공간은 작지만 CPU와 직접 연결되어 있으므로 연산 속도가 메모리보다 수십 배에서 수백 배까지 더 빠르다.
때문에 연산을 위해서는 반드시 레지스터를 거쳐야 하며, 이를 위해서 레지스터는 특정 주소를 가리키거나 값을 읽어올 수 있다.
CPU에서 변수랑 비슷한 역할을 하는 것이라 생각하면 쉽다.
몇가지 레지스터를 살펴보자.
레지스터는 CPU 당 한개만 존재하는 것이 아니라 필요와 용도에 따라 여러 종류가 있고, 각 레지스터의 사용 방식에 따라 이름을 구분해 사용해왔다.
범용 레지스터 (64bit - 32bit - 16bit - up 8bit - down - 8bit)
포인터 레지스터
인덱스 레지스터
세그먼트 레지스터
우리 프로젝트에서는 범용 레지스터와 인덱스 레지스터만 사용된다고 한다. 그런데 왜 데이터 크기별로 이름이 다른거지? -> 2.3을 참고!
32 비트, 혹은 64비트 시스템 컴퓨터라는 말을 많이 들어봤을 것이다.
여기서 말하는 비트 수는 명령을 한 번에 처리할 수 있는 레지스터의 비트 수를 말한다.
쉽게 말해 하나의 레지스터가 저장 가능한 공간의 크기가 32비트인지 64비트인지를 나타내는 거라 보면 된다.
계속적으로 멀티미디어가 발전하고 사용자가 늘어남에 따라 프로그램의 용량은 커져야 했고 더욱 많은 메모리 공간을 필요로 하게 되었다.
그래서 나온 것인 64비트 체제이다.
네트워크 주소에서의 IPv4와 IPv6의 경우를 생각하면 이해가 쉽다.
어셈블리 변수의 자료형으로 사용된다.
data type (자료형) | 크기 |
---|---|
BYTE | 부호 없는 1 byte (= 8 bit) |
WORD | 부호 없는 2 byte |
DWORD | 부호 없는 4 byte |
QWORD | 부호 없는 8 byte |
AL, AH, AX, EAX, RAX가 모두 다른 레지스터라고 이해하는 경우가 있는데, RAX가 EAX를 포함하고, EAX가 AX를 포함하고.. 이런 형태이다. AX의 상위 8 bit를 al이 사용하고, 하위 8 bit를 ah가 사용하는 식.
이는 하위 비트 시스템(32비트, 16비트 시스템) 호환을 위한 설계이기도 하고, 레지스터 공간의 낭비를 없애기 위함이기도 하며, 효율적인 알고리즘을 위한 설계이기도 하다.
어셈블리 프로그램을 짜려면 먼저 함수 호출 규약을 알아야 한다.
우리에게 필요한 x86_64 calling convention은 여기에 정리되어 있다.
arch | syscall NR | return | arg0 | arg1 | arg2 | arg3 | arg4 | arg5 |
---|---|---|---|---|---|---|---|---|
x86_64 | rax | rax | rdi | rsi | rdx | r10 | r8 | r9 |
즉, x86_64 아키텍처에서의 syscall 넘버(NR)와 리턴값은 rax
에 담기고, 함수에서 매개변수(arg0, arg1, ...)는 rdi, rsi, rdx, rcx, r8, r9
순으로 넘어오게 된다.
call
: 함수 호출
ret
: call로 호출된 함수를 종료하고 그 다음 명령줄로 이동
nop
: 아무것도 하지 않음
jmp
: 분기(라벨) 실행.
조건 점프 명령어 : cmp 연산 결과에 따라 jmp
je
: cmp A B 에서 A = B 일때 특정 라벨로 jmpjne
: cmp A B 에서 A != B 일때 특정 라벨로 jmpja
: cmp A B 에서 A > B 일때 특정 라벨로 jmpjb
: cmp A B 에서 A < B 일때 특정 라벨로 jmpjae
: A >= Bjbe
: A <= B플래그 점프 명령어: flag의 값을 확인하고 그에 따라 jmp
jc
: Jump If Carry, CF = 1 이면 jmpjnc
: Jump If No Carry CF, CF = 0 이면 jmppush
: 스택에 값을 넣음pop
: 스택에서 값을 가져옴mov
: 인자2 값을 인자1에 대입(전달)lea
: 인자2 주소를 인자1에 대입(전달)inc
: 인자의 값을 1 증가dec
: 인자의 값을 1 감소add
: 인자2 값을 인자1에 더함sub
: 인자2 값을 인자1에서 뺌cmp
: 인자1,2의 값을 비교. 주로 위의 조건점프 명령어와 세트로 사용한다.test
: 인자1과 인자2를 AND 연산한다. 이 연산의 결과는 ZF(zero flag)
에만 영향을 미치고 Operand 자체에는 영향을 미치지 않는다.ZF는 1
로, 연산결과가 1이라면 ZF는 0
으로 세트된다.rax
에 미리 넣어줘야한다.rax
에 저장된다.0x2000001 - exit()
0x2000002
0x2000003 - read()
0x2000004 - write()
0x2000005 - open()
0x2000006 - close()
/Library/Developer/CommandLineTools/SDKs/MacOSX.sdk/System/Library/Frameworks/Kernel.framework/Versions/A/Headers/sys/syscall.h
테이블 상 1,2,3… 이라고 넘버링 되어있는데 실제로 사용할 때는 0x2000003 (=read) 호출하는 이유?
Mac은 syscall 번호를 여러 클래스로 나눠 뒀다. write, read는 unix 클래스로 분류, 최상단 비트를 2로 설정해둠.
rax
에 작은 음수(-1 ~ -4095)를 반환하며 동시에 CF(carry flag)가 참이 된다. 따라서 jc
(carry flag가 1일 때 점프)를 활용하면 에러 처리 구문(err)으로 넘어갈 수 있다.rax
에는 -errno(-4095 ~ -1)가 반환된다.예를 들어... 아래 write.s 예제를 살펴보자.
section .text
global _ft_write
extern ___error
_ft_write:
mov rax, 0x2000004 ; rax에 write함수(0x2000004) 담음
syscall ; rax 값을 보고 해당하는 함수를 시스템콜
jc _err ; CF = 1(오류 발생 시) 이면, _err 함수로 점프
; syscall 함수는 오류가 있을 경우 rax에 해당하는 오류(음의 정수)값 반환하며
; 동시에 CF = 1이 된다.
ret
_err:
push rax ; rax 값을 스택에 백업
call ___error ; ___error 함수 호출(rax = 에러 주소값)
pop rdx ; 스택에 저장된 값을 rdx로 꺼내옴
mov [rax], rdx ; rax가 가리키는 주소의 값으로 rdx 값을 대입
mov rax, -1 ; 반환할 값(-1)
ret
잘못된 파일 번호에 의한 에러
가 생겼을 경우, (잘못된 파일 번호의 errno
는 9
이다) CF = 1
이 되면서, rax = -9
가 된다.[rax]
에 -9
를 담아야 하고, rax
에는 write 함수의 오류 반환값인 -1
를 담아야 한다.mov [rax], rdx
해준다. rax에 []를 씌워주면 주소는 건들지 않고 값만 바꿀 수 있다.에러넘버는 여기에 정리되어 있다. (혹은 man 2 errno)
c언어 파일에서는 #include <errno.h>를 선언하면 errno라는 변수(별도의 선언 x)를 사용할 수 있으며 이 변수를 통해 에러코드를 불러 올 수 있게 된다.
어셈블리 언어는 NASM, MASM 등과 같은 어셈블러
라고하는 유틸리티 프로그램에 의해 실행 가능한 기계어 코드로 변환된다.
그 중 넷와이드 어셈블러(Netwide Assembler, NASM)은 인텔 x86 아키텍처용 어셈블러이자 역어셈블러이다.
쉽게 말해 어셈블리 파일(.s)을 컴파일해주는 프로그램이라 할 수 있겠다.
이제 NASM을 설치해보자.
curl -fsSL https://rawgit.com/kube/42homebrew/master/install.sh | zsh
brew install nasm
설치를 완료했다면, 이제 어셈블리 파일(.s)을 작성하고 컴파일 해보자.
어셈블리파일은 세 부분으로 나뉜다.
section .text
section.bss
section.data
helloworld.s
라는 파일을 만들고 아래와 같이 코드를 작성해보자.
section .text
global _main ; _main함수를 global로 설정하여, 전역에서 접근 가능하도록 함.
_main :
mov rax, 0x2000004 ; syscall(시스템콜)쓰기 위해 rax에 syscall 번호 넣어줌
; 0x2000004 : write 함수
; 매개변수 순서대로 넣어줌, 순서 정해져있음.(rdi - rsi - rdx - r10 - r8 - r9)
mov rdi, 1 ; rdi : arg0 fd = 1
mov rsi, msg ; rsi : arg1 buf에 들어가는 변수 명
mov rdx, 11 ; rdx : arg2 출력할 문자열(hello world)의 바이트 수
syscall ; syscall 호출(write)
/* 아래는 return 0과 비슷함. 종료된 것을 알려줘야 함.*/
mov rax, 0x2000001 ; exit
mov rdi, 0 ; rdi: arg0 = 0
syscall ; exit 호출
section .data
msg db "Hello World"
어셈블리 파일 내부 함수에 _(언더바)를 붙이는 이유?
일종의 약속(코딩 컨벤션)으로, 언더바를 붙이지 않으면 C에서 어셈블리어로 작성한 함수를 사용할 수 없다.
어셈블리에서는 기본적으로 모든 코드가 private이다. 이때 다른 모듈이 해당 코드에 접근할 수 있게 하기 위해서 global instruction을 이용하여 심볼에 다른 코드가 접근할 수 있도록 해 준다. 이렇게 명시하지 않는다면 링커에서 아무런 심볼을 찾을 수 없다는 오류가 발생한다.
$ nasm -f macho64 hello.s
$ ld -lSystem hello.o
$ ./a.out
출처
https://dongdd.tistory.com/862
NASM 튜토리얼
레지스터 내용 블로그
어셈블리 명령어 정리
42 wiki - Libasm
https://yechoi.tistory.com/17