[혼공학습단 9기] 혼공컴운: 2주차

오늘은·2023년 1월 13일

혼공 혼공컴운 혼공학습단

혼공학습단

목록 보기

5/14

기본미션

선택미션 05-1. 정리

Ch. 04 CPU의 작동 원리

04-1 ALU와 제어장치

ALU 레지스터를 통해 피연산자를 받아들이고 제어장치로부터 수행할 연산을 알려줄 제어신호를 받아들임.

ALU는 레지스터와 제어장치로부터 받아들인 피연산자, 제어 신호로 산술, 논리 연산등을 수행.
-> ALU는 레지스터로부터 피연산자를 받아들이고 제어장치로부터 제어신호를 받아들인다.
ALU는 연산할 결과값과 플래그를 내보낸다.

프로그램 실행 속도를 늦출 수 있기 때문에
ALU의 결과 값을 메모리가 아닌 레지스터에 우선 저장하는 것. (결과값 뿐만 아닌 연산결과에 대한 추가정보를 내보내야 하는 경우가 있다.)

대표적인 플래그

종류	의미	사용 예시
부호 플래그	연산한 결과의 부호를 나타낸다.	1: 음수 0: 양수
제로 플래그	연산 결과가 0인지 여부를 나타낸다.	1: 0 0: 0이 아님
캐리 플래그	연산 결과 올림, 빌림수 발생 여부를 나타냄	1: 발생 0: 미발생
오버플로우 플래그	오버플로우 발생 여부 표시	1: 발생 0: 미발생
인터럽트 플래그	인터럽트 가능 여부 표시	1: 가능 0: 불가능
슈퍼바이저 플래그	커널 모드인지 사용자 모드인지 표시	1: 커널 모드 0: 사용자 모드

플래그는 CPU가 프로그램 실행 중 기억해야할 참고 정보
이는 플래그 레지스터로 레지스터에 저장된다.
플래그 값을 저장하는 플래그 레지스터를 읽으면 연산 결과에 대한 추가적 참고 정보를 얻을 수 있다.
ALU에서 연산한 직후 플래그 값을 확인하여 연산 결과의 정보 확인이 가능

제어장치 - 제어 신호를 내보내고 명령어를 해석하는 부품.
제어신호: 컴퓨터 부품을 관리하고 작동시키기 위한 일종의 전기신호.
CPU의 구성 요소 중 가장 정교하게 설계된 부품과 다름 없음.
CPU 제조사마다 제어장치의 구현방식, 명령어 해석방식, 받아들이고 내보내는 정보에 조금씩 차이가 존재한다.

**제어장치가 받아들이는 정보
1. 제어장치는 클럭 신호를 받아들임
클럭: 컴퓨터의 부품이 움직이는 시간 단위.
클럭 주기에 맞춰 레지스터에서 다른 레지스터로 데이터가 이동하거나, ALU에서 연산이 수행되거나 CPU가 메모리에 저장된 명령어를 읽어들임
여러 클럭에 걸쳐 실행될 수 있으며 박자(주기)에 맞춰 작동된다.

2. 제어장치는 해석할 명령어를 받아들입니다.
CPU가 해석할 명령어는 명령어 레지스터에 저장되며 제어장치는 이 명령어 레지스터로부터 해석할 명령어를 받아들이고 해석한뒤 제어 신호를 발생시켜 컴퓨터 부품들에 수행할 내용을 알려준다.

3. 제어장치는 플래그 레지스터 속 플래그 값을 받아들인다.
플래그는 ALU 연산에 대한 추가적인 상태 정보. 제어장치는 플래그 값을 받아들이고 이를 참고하여 제어신호를 발생시킨다.

4. 제어장치는 제어 버스로 전달된 제어 신호로 받아들인다.
제어 신호는 CPU뿐만 아닌 입출력 장치를 비롯한 CPU 외부 장치를 발생시킬 수 있다. 제어장치는 제어버스를 통해 외부로부터 전달된 제어신호를 받아들이기도 한다.
-> 제어장치는 클럭, 수행할 명령어, 플래그, 제어 신호를 받아들인다.

제어장치가 내보내는 정보
CPU외부 전달 제어 신호

제어 버스로 제어신호를 내보내는 것을 의미. 메모리에 전달하는 제어 신호, 입출력 장치 전달 제어신호
CPU내부 전달 제어 신호

제어장치가 메모리에 저장된 값을 읽거나 메모리에 새로운 값을 쓰고 싶을 경우 메모리로 제어신호를 내보낸다.

제어장치가 CPU 내부에 전달하는 제어신호에 크게 ALU에 전달하는 제어신호, 레지스터에 전달하는 제어신호가 존재.

ALU에는 수행할 연산을 지시하기 위함. 레지스터에는 레지스터간 데이터를 이동하거나 레지스터에 저장된 명령어 해석을 위한 제어 신호를 보낸다.

04-2 레지스터

상용화된 CPU 속 레지스터는 CPU마다 이름, 크기, 종류가 다양하다.

대표적인 레지스터
프로그램 카운터

메모리에서 가져올 명령어의 주소, 메모리에서 읽어들일 명령어의 주소를 저장한다.
이를 명령어 포인터 라고 부르기도 한다.

명령어 레지스터

해석할 명령어, 방금 메모리에서 읽어들인 명령어를 저장하는 레지스터.

제어장치는 명령어 레지스터 속 명령어를 받아들이고 이를 해석한 뒤 제어 신호를 내보낸다.

메모리 주소 레지스터

메모리의 주소를 저장하는 레지스터.

CPU가 읽어 들이고자하는 주소 값을 주소 버스로 보낼 때 메모리 주소 레지스터를 거치게 된다.

메모리 버퍼 레지스터

메모리와 주고 받을 값을 저장하는 레지스터 (데이터, 명령어).

메모리에 쓰고 싶은 값, 메모리로부터 전달받은 값은 메모리 버퍼 레지스터를 거친다.

CPU가 주소 버스로 내보낼 값이 메모리 주소 레지스터를 거친다면 데이터 버스로 주고 받을 값은 메모리 버퍼 레지스터를 거침

플래그 레지스터

연산 결과 또는 CPU 상태에 대한 부가적인 정보를 저장하는 레지스터

범용 레지스터

다양하고 일반적인 상황 속 자유롭게 사용할 수 있는 레지스터.

메모리 버퍼 레지스터는 데이터 버스로 주고받을 값만 저장.

메모리 주소 레지스터는 주소 버스로 내보낼 주소값만 저장하나 범용 레지스터는 데이터와 주소를 모두 저장할 수 있다.

CPU 내부에는 여러 범용 레지스터들이 있고 현재 대다수 CPU는 모두 범용 레지스터를 갖는다.

스택 포인터

스택 주소 지정 방식이라는 주소 지정 방식에 사용.

베이스 레지스터

변위 주소 지정 방식이라는 주소 지정 방식에 사용. (+프로그램 카운터)

특정 레지스터를 이용한 주소 지정 방식 - 스택 주소 지정 방식

스택 주소 지정 방식: 스택과 스택 포인터를 이용한 주소 지정 방식
스택 포인터: 스택의 가장 위를 가르키는 레지스터. 마지막 저장 값의 위치를 저장하는 레지스터.
스택영역: 메모리 내 스택처럼 사용할 지역을 지정. 다른 영역과 달리 스택처럼 사용하기로 암묵적으로 약속함.

특정 레지스터를 이용한 주소 지정 방식 - 변위 주소 지정 방식
오퍼랜드 필드에는 메모리의 주소가 담길 때도 있다. 변위 주소 지정 방식이란 오퍼랜드 필드의 값과 특정 레지스터의 값을 더하여 유효주소를 얻어내는 주소 지정 방식.

변위 주소 지정 방식을 사용하는 명령어는 연산코드, 레지스터, 오퍼랜드 필드가 있다.
변위 주소 지정 방식은 오퍼랜드 필드의 주소와 어떤 레지스터를 더하는지에 따라 상대주소 지정 방식, 베이스 레지스터 주소 지정방식 등으로 나뉜다.
변위 주소 지정 방식에는 CPU의 종류에 따라 대표적으로 상대주소 지정방식과 베이스 레지스터 주소 지정방식이 있다.

상대주소 지정방식.
상대주소 지정방식은 오퍼랜드와 프로그램 카운터 값을 더하여 유효주소를 얻는 방식.
if문과 유사하게 특정 주소의 코드 실행에 사용된다.

베이스 레지스터 주소 지정방식
오퍼랜드와 베이스 레지스터의 값을 더하여 유효주소를 얻는 방식.
베이스 레지스터는 기준 주소, 오퍼랜드는 기준 주소로 부터 떨어진 거리를 의미한다.
➡ 베이스 레지스터 속 기준 주소로부터 얼마나 떨어져있는 주소에 접근할지 연산하여 유효주소를 얻어내는 방식을 의미

04-3 명령어 사이클과 인터럽트

명령어 사이클: CPU가 명령어를 하나씩 실행하는데 이때 프로그램 속 각각의 명령어는 일정한 주기가 반복되며 실행된다.
즉 각각의 명령어는 명령어 사이클이 반복되며 실행되는 것.
인출 사이클: 명령어를 메모리에서 CPU로 가져와야한다. 이것이 명ㅇ령어 사이클의 첫 과정. 메모리에 있는 명령어를 CPU로 가져오는 단계를 인출 사이클이라고 한다.
실행 사이클: CPU로 명령어를 인출하면 명령어를 실행하는 것. 이것이 명령어 사이ㅡㄹ의 두번째 과정
CPU로 가져온 명령어를 실행하는 단계를 실행사이클이라 부름.
제어장치가 명령어 레지스터에 담긴 값을 해석하고, 제어 신호를 발생시키는 단계가 실행사이클.

프로그램을 이루는 수많은 명령어 - 일반적으로 인출과 실행 사이클을 반복하고 실행. -> CPU는 프로그램 속 명령어를 가져오고 실행을 반복.
명령어를 인출하여 CPU로 가져왔더라도 실행할 수 없는 경우도 있다.

CPU로 명령어를 인출한 뒤 가져왔더라도 메모리 접근을 한번 더 해야한다면?
이 단계를 간접 사이클이라고 부른다.

인터럽트: 방해하다, 중단시키다 라는 interrupt를 의미
CPU가 수행중인 작업은 방해를 받아 잠시 중단되기도 한다. 이렇게 CPU의 작업을 방해하는 신호를 인터럽트라 부른다.
CPU가 작업을 잠시 중단해야 한다면 인터럽트는 CPU가 꼭 알아야할 정보, 작업 발생시 발생하게 된다.

인터럽트 종류
동기 인터럽트: CPU에 의해 발생하는 인터럽트. 예기치 못한 상황에 마주쳤을 때 CPU가 실행하는 프로그래밍상 오류와 같은 예외 상황 속 발생하는 인터럽트. 예외 라고 불림.
비동기 인터럽트: 입출력장치에 의해 발생하는 인터럽트. 입출력장치에 의한 비동기 인터럽트는 알림 역할을 한다.
키보드, 마우스 등 입출력 장치가 어떠한 입력을 받아들일 때 이를 처리하기 위해 입력 알림을 보낸다.
일반적으로 인터럽트가 비동기 인터럽트를 의미한다.

알림과 같은 인터럽트 CPU는 입출력작업 도중 효율적으로 명령어를 처리하기 위해 알림과 같은 인터럽트를 사용한다.
비동기 인터럽트를 이용하면 CPU는 주기적으로 하드웨어 완료 여부를 확인할 필요가 없다. CPU는 완료 인터럽트를 받을 때 까지 다른 작업을 처리할 수 있게 된다.

CPU가 하드웨어 인터럽트를 처리하는 순서
1. 입출력장치는 CPU에 인터럽트 요청 신호를 보낸다.
2. CPU는 실행 사이클이 끝나고 명령어 인출 이전 항상 인터럽트 여부를 확인한다.
3. CPU는 인터럽트 요청을 확인하고 인터럽트 플래그를 통해 현재 인터럽트를 받아들일 수 있는지 파악
4. 인터럽트를 받아들일 수 있다면 CPU는 지금까지의 작업을 백업
5. CPU는 인터럽트 벡터를 참조하여 인터럽트 서비스 루틴을 실행
6. 인터럽트 서비스 루틴 실행이 끝나면 백업한 작업을 복구하여 실행 재개

인터럽트 요청 신호: CPU의 정상 흐름을 끊기 전 인터럽트는 CPU에 가능여부 신호를 보냄

인터럽트 플래그: 하드웨어 인터럽트를 받아들일지 무시할지를 결정하는 플래그. CPU가 중요한 작업 처리시 불가능 설정.
불가능할 경우 인터럽트 요청이 있더라도 요청을 무시한다.
가능 설정시 요청 신호를 받고 인터럽트를 처리한다.
단, 불가능으로 설정시에도 무시할 수 없는 인터럽트 요청도 있다. 정전, 고장등이 해당

인터럽트 서비스 루틴: 인터럽트를 처리하기 위한 프로그램. 인터럽트 핸들러 라고도 불림. 인터럽트 발생시 어떻게 처리할지에 대한 정보로 이뤄진 프로그램.

인터럽트 백터: 언터럽트 서비스 루틴을 식별하기 위한 정보 . 인터럽트 서비스 루틴의 시작 주소를 알 수 있다.
인터럽트 벡터를 통해 특정 인터럽트 서비스 루틴을 처음부터 실행이 가능하다.

➡ CPU가 인터럽트를 처리한다 = 인터럽트 서비스 루틴을 실행.
원래 수행중이던 작업으로 다시 되돌아옴.
CPU는 인터럽트 서비스 루틴을 실행하려면 인터럽트 서비스 루틴의 시작 주소를 알아야 함 ➡언터럽트 벡터를 통해 알 수 있음.
인터럽트 서비스 루틴은 명령어와 데이터로 이워져있으며 이 역시 프로그램 카운터를 비롯한 레지스터들을 사용하며 실행.

요청신호: CPU 작업을 방해하는 인터럽트에 대한 요청
플래그: 인터럽트 요청 신호를 받아들일지 무시할지 결정하는 비트
벡터: 인터럽트 서비스 루틴의 시작 주소를 포함하는 인터럽트 서비스 루틴의 식별 정보
서비스 루틴: 인터럽트를 처리하는 프로그램

디버깅시 특정 코드가 실행되는 순간 프로그램의 실행을 멈추게 할 수 있는 것.
처리 이후 프로그램을 중단. 디버깅이 끝나면 프로그램은 다음 명령어부터 실행을 이어나간다.
중단: CPU가 실행중인 프로그램을 강제로 중단시킬 심각한 오류 발견시 발생하는 예외
소프트웨어 인터럽트: 시스템 호출 발생시 나타남.

Ch. 05. CPU 성능 향상 기법

05-1 빠른 CPU를 위한 설계 기법

CPU를 빠르게 하려면 어떻게 설계해야할까

클럭 속도 증가
클럭 속도는 헤르츠 단위로 측정한다.
* 클럭은 기본 속도와 최대속도가 있으며 고성능을 요구하면 순간적으로 클럭 속도를 높이고 그렇지 않다면 유연하게 클럭 속도를 낮춰 유지한다.
최대속도 이상으로 강제로 끌어올리는 경우도 있는데 이런 기법을 오버클럭킹이라 부른다.

➡ 클럭속도를 무작정 높인다면 발열문제가 있어 한계가 발생.

코어와 스레드수 증가
코어: 명령어를 실행하는 여러개의 부품.
멀티코어: 코어를 여러개 포함하는 CPU 멀티코어 혹은 멀티코어 프로세서 라고 부른다. 2개 이상을 모두 멀티코어라 부름.

코어 개수가 연산 처리속도 증가에 직접적으로 연관되지 않음.
처리 연산이 적절히 분배되지 않을 경우 코어수에 비례하여 속도 증가가 되지 않기 때문
+ 코어수가 지나치게 많아도 효율(성능)과 영향 없음.

➡ 적절한 처리 명령어를 적절히 분배하는 것이 성능 향상에 가장 밀접한 연관이 있다.

스레드와 멀티스레드
스레드: 흐름의 단위. CPU의 스레드와 프로그래밍의 슬레드는 다르다.
CPU의 스레드는 하드웨어적 스레드
프로그램에서 사용되는 스레드는 소프트웨어적 스레드

하드웨어 스레드
하나의 코어가 동시에 처리하는 명령어의 단위.
하나의 코어에 여러 명령어를 동시에 처리한다면 CPU를 멀티스레드 프로세서, 멀티스레드 CPU라고 함.

소프트웨어적 스레드
하나의 프로그램에서 독립적으로 실행되는 단위.
언어나 운영체제 학습시 접하는 스레드.
하나의 프로그램은 실행되는 과정에서 한 부분만 실행될 수 있지만 프로그램의 여러 부분이 동시에 실행되기도 한다.

2코어 4스레드 CPU은 한번에 4개의 명령어를 처리할 수 있다.
프로그램 입장에서 한번에 하나의 명령어를 처리하는 CPU는 4개가 있다 생각할 수 있음.
하드웨어 스레드를 논리 프로세서 라고 부름.

코어: 명령어를 실행할 수 있는 하드웨어 부품
스레드: 명령어를 실행하는 단위
멀티코어 프로세서: 명령어를 실행할 수 있는 하드웨어 부품이 2개 이상 있는 CPU
멀티스레드 프로세서: 하나의 코어로 여러개의 명령어를 동시에 실행할 수 있는 CPU

05-2 명령어 병렬 처리 기법

빠른 CPU를 만들기 위해 높은 클럭속도, 멀티코어, 멀티스레드를 지원하는 CPU 만드는 것도 중요.
CPU가 놀지 않고 시간을 알뜰히 쓰며 작동하는것도 중요하다 (효율적인것)

명령어 병렬 처리기법 (ILP) - 하나의 명령어 처리 과정을 클럭 단위로 나눈다면?
1. 명령어 인출
2. 명령어 해석
3. 명령어 실행
4. 결과 저장

명령어 파이프라인
명령어 파이프 라이닝: 동시에 여러 명령어를 겹쳐 실행하는 기법.
슈퍼스칼라: 여러개의 명령어 파이프라인을 두는 기법
비순차적 명령어 처리: 파이프라인 중단을 방지하기 위해 명령어를 순차적으로처리하는 기법

파이프라인 위험
데이터 위험: 데이터 의존성에 의해 발생. 모든 명령어를 동시에 처리할 수 없다. 어떤 명령어는 이전 명령어를 끝까지 실행해야 실행가능한 경우가 존재. 데이터 의존적인 두 명령어를 무작정 동시에 실행하려하면 파이프라인이 제대로 작동하지 않은 것
제어 위험: 분기 등으로 인한 프로그램 카운터의 갑작스러운 변화에 의해 발생. 기본적으로 프로그램 카운터는 현재 실행중인 명령어의 다음 주소로 갱신. 프로그램 실행 흐름이 바뀌어 명령어가 실행되며 프로그램 카운터 값에 갑작스러운 변화가 발생한다면. 명령어 파이프 라인에 미리 가지고 와서 처리중인 명령어를 쓰지 못함.
이를 위해 사용하는 기술 중 하나가 분기예측. 분기예측은 프로그램이 어디로 분기할지 미리 예측한 후 그 주소를 인출.
구조적 위험: 명령어들을 겹쳐 실행하는 과정 속 서로 다른 명령어가 동시에 ALU, 레지스터 등 CPU 부품을 사용하려할 때 발생. 자원 위험이라고도 부른다.

슈퍼스칼라: 파이프라이닝은 단일 파이프라인으로 구현 가능하나 오늘날 CPU는 여러 개의 파이프라인을 이용.
CPU내부 여러 명령어 파이프라인을 포함한 구조를 슈퍼스칼라라고 부름

슈퍼스칼라 구조로 명령어 처리가 가능한 CPU를 슈퍼 스칼라 프로세서 또는 슈퍼스칼라 CPU라고 한다.
슈퍼스칼라 프로세서는 매 클럭 주기마다 동시에 여러 명령어를 인출.실행으로 슈퍼 스칼라 구조를 사용할 수 있다.
이론적으로 파이프라인 개수에 비례하여 프로그램 처리 속도가 빨라져야하나, 파이프라인 위험등의 문제가 있어 실제로는 비례하여 빨라지지 않음.
슈퍼스칼라방식을 차용한 CPU는 파이프라인 위험을 방지하기 위해 고도로 설계해야함.
여러 파이프라인 사용시 하나의 파이프라인 사용시보다 데이터위험, 제어위험, 자원위험을 피하기 어려움.

비순차적 명령어 처리
OoOE로 줄여 부름. 명령어를 순차적으로 실행하지 않는 기법. 순서를 바꿔 실행해도 무방한 명령어를 먼저 실행하여 파이프라인이 멈추는 것을 방지하는 기법.

05-3 CISC와 RISC

명령어 집합: CPU가 이해할 수 있는 명령어의 모음. 명령어 집합구조 (ISA)라고도 부름. CPU마다 ISA가 다를 수 있다.
ISA가 같은 CPU는 서로의 명령어를 이해할 수 있으나 ISA가 다르면 명령어를 이해할 수 없다
ISA = CPU의 언어, 하드웨어가 소프트웨어를 어떻게 이해할지에 대한 약속.

CISC (Complex Instruction Set Computer)

복잡한 명령어 집합을 활용하는 컴퓨터.

복잡하고 다양한 명령어들을 활용하는 CPU 설계 방식.

다양하고 강력한 기능의 명령어 집합을 활용하기 때문에 명령어의 형태와 크기가 다양한 가변 길이 명령어를 활용.

장점: 적은 수의 명령어로 프로그램 동작이 가능, 메모리 공간 절약
단점: 활용하는 명령어가 복잡하고 다양한 기능을 제공하는 탓에 명령어 크기와 실행까지의 시간이 일정하지 않았음. 복잡한 명령어 -> 명령어 하나를 실행하는데 여러 클럭 주기를 필요로 한다.

명령어 파이프라인 구현에 큰 걸림돌이 된다.
CISC가 활용하는 명령어는 명령어 수행시간이 길고 가지각색이기 때문에 파이프라인이 효율적으로 명령어를 처리할 수 없다. (규격화되지 않은 명령어가 파이프라이닝을 어렵게 만들게 함)
➡명령어 파이프라인이 제대로 동작하지 않음은 현대 CPU에서 아주 치명적인 약점. (명령어 파이프라인은 높은 성능을 내기위한 중요 기술)
CISC가 복잡하고 다양한 명령어를 활용할 수 있다하더라도 대다수의 복잡한 명령어는 사용빈도가 낮아 실제로는 자주 쓰는 명령어만 사용.

한계
1. 빠른 처리를 위해 파이프라인 활용이 필요하다. 원활한 파이프라이닝을 위해 명령어 길이와 수행시간이 짧고 규격화 되어야한다.
2. 자주쓰이는 명령어만 쓴다. 복잡한기능을 지원하는 명령어 추가보다 자주쓰이는 기본 명령어를 작고 빠르게 만드는 것이 중요.

정리
CISC명령어 집합은 복잡하고 다양한 기능을 제공하기에 적은 수의 명령으로 프로그램을 동 ➡ 메모리 절약이 가능
명령어의 규격화가 어려워 파이프라이닝이 어려움.
대다수의 복잡한 명령어는 그 사용빈도가 낮다. CISC기반 CPU는 성장에 한계가 있었음.

RISC ( Reduced Instructuin Set Computer)

CISC에 비해 명령어 종류가 적으며 짧고 규격화, 되도록 1클럭 이내에 실행되는 명령어를 지향한다.

고정길이 명렁어를 활용하며 규격화, 빠른 실행으로 파이프라이닝에 최적화 되어있다.

메모리에 직접 접근하는 명령어를 load, store 두개로 제한할 만큼 메모리 접근을 단순화 하고 최소화를 추구한다. (CISC보다 주소지정방식의종류가 적은 경우를 말한다.)

메모리 접근을 단순화, 최소화 하는 대신 레지스터를 적극 활용하여 CISC보다 레지스터를 이용하는 연산이 많고 일반적인 경우보다 범용 레지스터 개수도 더 많다.

다만 사용 가능한 명령어 개수가 CISC보다 적기 때문에 RISC는 보다 많은 명령으로 프로그램을 작동한다.

정리
CISC: 복잡하고 다양한 명령어, 가변 길이 명령어, 다양한 주소 지정 방식, 프로그램을 이루는 명령어의 수가 적음, 여러 클럭에 걸쳐 명령어 수행, 파이프라이닝하기 어려움
RISC: 단순하고 적은 명령어, 고정 길이 명령어, 적은 주소 지정 방식, 프로그램을 이루는 명령어의 수가 많음, 1클럭 내외로 명령어 수행, 파이프라이닝하기 쉬움