4. CPU의 작동원리
1) ALU와 제어장치
CPU의 핵심 구성 요소 세 가지
CPU | ALU |
---|
| |
구분 | 설명 |
---|
ALU (산술논리연산장치) | 연산을 수행하는 장치, 계산을 담당하는 회로 - 레지스터로부터 피연사자(연산의 대상)를 받아들이고, 제어장치로 제어 신호(연산할 작업)를 받아들여서, 산순 연산, 논리 연산 등 다양한 연산을 수행한다. - 연산의 결과를 레지스터, 플래그 레지스터에 저장한다. (덧셈,뺄셈, 곱셉, 나눗셈, 오버플로우 등의 계싼을 담당하는 회로) |
제어장치 | 명령어를 해석하고 제어신호를 내보내는 장치 (CPU제어자치만 제어신호를 내보낼 수 있는 것은 아니고, 다른 I/O 입출력 장치도 내보낼 수 있다.) |
레지스터(들) | 명령어 처리 전후로 값을 임시 저장하는 장치 - ALU가 연산할 때마다 결과를 메모리에 저장한다면, 메모리 접근으로 인해서 프로그램 실행 속도를 늦출 수 있기 때문에 레지스터에 우선 저장한다. (+ 특수한 목적을 가진 레지스터도 존재한다.) |
플래그 레지스터
ALU는 계산 결과와 더불어 플래그를 내보낸다.
부호 플래그 | 연산의 결과와 부호 | 음수는 1, 양수는 0 |
---|
제로 플래그 | 연산 결과가 0인지의 여부 | 플래그가 1인 경우 연산 결과 0, 0인 경우 연산 결과 1 |
케리 플래그 | 연산 결과 올림수나 빌림수 발생 여부 | 올림수는 1, 내림수는 0 |
오버플로우 플래그 | 오버플로우 발생 여부 | 오버플로우 발생 1, 아닐 경우 0 |
인터럽트 플래그 | 인터럽트 가능 여부 | 인터럽트 가능 1, 아닐 경우 0 |
슈퍼바이저 플래그 | 커널 모드로 실행 중인지, 사용자 모드로 실행 중인지의 여부 | 플래그가 1인 경우 슈퍼바이저 모드, 0인 경우 사용자 모드로 실행 중 |
부호 프래그가 1 이기 때문에 음수
제어 장치
- 제어 신호를 내보내고 명령어를 해석하는 장치
- 제어신호 : 컴퓨터 부붐들을 관리하고 작동시키기 위한 일종의 전기신호
1. ALU에 전달하는 제어신호 : 수행할 연산을 지시
2. 레지스터에 전달하는 제어 신호 : 레지스터 간에 데이터를 이동시키거나 레지스터에 저장된 명령어 해석 하기 위함
제어장치가 받아들이는 정보
- 플래그 레지스터 : 연산 결과에 대한 부가정보
- 명령어 레지스터 : 제어장치가 (지금 당장) 해석할 명령어가 담김
- 제어버스 : 시스템 버스 중 하나로 제어신호가 전달 됨
- 제어 버스를 통해 외부로부터 전달된 제어신호를 받아들이기도 함
- 클럭
- 컴퓨터의 모든 부품을 일사불란하게 움직일 수 있게 하는 시간 단위
- 컴퓨터 부품들은 클럭이라는 박자에 맞춰 작동할 뿐 한 박자 마다 작동하는 것은 아님
- 하나의 명령어가 여러 클럭에 걸쳐 실행 될 수 있다.
2) 레지스터
- 프로그램의 실행 전후로 값을 임시로 저장하는 저장 장치
- 레지스터에 어떤 값이 저장되는지만 관찰해도 프로그램 저수준의 흐름을 볼 수 있다.
- CPU 마다 레지스터의 이름, 크기, 종류가 다양하다.
8개의 레지스터
레지스터 종류 | 특징 |
---|
프로그램 카운터 | 다음으로 읽어들인 메모리 주소를 저장 (메모리에서 가져올 명령어 주소) - 특별한 경우를 제외하고는, 프로그램 카운터는 일반적으로 1씩 증가되며 메모리의 프로그램이 순차적으로 증가된다. - 특별한 경우 : 분기문(JUMP) 또는 인터럽트 |
명령어 레지스터 | 해석할 명령어 (메모리에서 읽어들인 주소) |
메모리 주소 레지스터 | 읽어들인 메모리의 주소값 (메모리 어떤 번지 값을 읽어들일지, 주소버스를 통해 주고받아야할 떄 저장함) |
메모리 버퍼 레지스터 | 메모리와 주고받을 명령어와 데이터 (데이터 버스를 통해 주고받아야할 때 저장) |
플래그 레지스터 | 연산 결과에 대한 부가 정보 저장 |
범용 레지스터 | CPU내에 여러개 존재. 프로그램을 적극적으로 실행할 때 사용. 범용적으로 사용 가능한 레지스터 (많은 연산시, 임시 저장해야할 때가 많은데, 이때 사용한다.) |
스택 포인터 | 스택 주소 지정방식에서 사용되는 ‘스택의 꼭대기’를 가리키는 레지스터 - 메모리 내에 스택처럼 사용할 수 있는 영역이 존재, 그 공간에서 제일 마지막에 저장한 위치_제일 상단 위치) |
베이스 레지스터 | 변위 주소 지정 방식에서 사용되는 ‘떨어진 거리’를 가리키는 레지스터 |
레지스터 동작 방식
- CPU로 실행할 프로그램 1000 번지~ 1500번지 저장되어있다고 가정, 1000번지에는 1101((2)이 저장되어있다.
- 프로그램 카운터에 1000 이 저장된다. 이는, 메모리에서 가져올 명령어가 1000 번지에 존재한다는것을 의미.
- 메모리 주소 레지스터 1000을 저장하여, 주소 버스를 통해 1000번지를 내보내야한다.
- 제어 버스를 통해 ‘메모리 읽기’ 제어신호와 주소 버스를 통해 메모리 주소레지스터 값이 메모리(1000번지)로 보내진다.
- 데이터 버스를 통해 메모리 1000번지에 저장된 값이 메모리 버퍼 레지스터로 전달된다.
- 프로그램 카운터는 증가되어 다음 명령어를 읽어 들일 준비한다.
- 메모리 버퍼 레지스터에 저장된 값은 명령어 레지스터로 이동한다.
- 제어장치는 명령어 레지스터의 명령어를 해석하고 제어 신호를 발생시킨다.
프로그램 카운터를 지속적으로 증가해서 계속해서 다음 명령어를 읽어 들인다.
스택 주소 지정방식
스택과 스택 포인터를 이요한 주소 지정 방식
스택 포인터 : 스택에 마지막으로 저장한 값의 위치를 저장하는 레지스터
스택 영역 : 메모리 안에 스택처럼 사용할 영역. 다른 주소 공간과 다르게 스택처럼 사용된다.
변위 주소 지정방식
오퍼랜드 필드의 값을 변위 삼아, 특정 레지스터 값을 더해 유효 주소를 얻는 주소 지정 방식
- 상대 주소 지정 방식 : 오퍼랜드 + 프로그램 카운터 === 유효 주소
- 베이스 레지스터 주소 지정 방식 : 오퍼랜드 + 베이스 레지스터 (기준주소) === 유효주소
- 베이스 레지스터 : 기준 주소
- 오퍼랜드 : 기준 주소로 부터 떨어진 거리
3) 명령어 사이클과 인터럽트
CPU가 명령어를 순차적으로 처리하는 양상
명령어 사이클
CPU가 명령어를 처리하는 정형화된 주기, 흐름. 프로그램 속 각각의 명령어들은 일반적으로 인출과 실행 사이클을 반복하며 실행된다.
- 인출 사이클 : 메모리에 있는 명령어를 CPU로 가지고 오는 단계
- 실행 사이클 : CPU로 가져온 명령어를 실행하는 단계. 제어장치가 명령어 레지스터에 담긴 값을 해석하고, 제어 신호를 발생시키는 단계.
- 간접 사이클 : 실제 연산에 상요될 데이터를 얻기 위해 한 번더 메모리에 접근해야 할 경우가 있다. 간접 주소 지정 방식과 같이 명령어를 인출 했더라도 바로 실행이 불가능할 수도 있다.
어떤 명령어는 인출과 실행 사이클만으로 실행되고, 어떤 명령어는 인출, 간접, 실행 사이클을 거쳐 실행 된다.
인터럽트(interrupt)
- 방해하다, 중단시키다.
- CPU의 정상적인 실행 흐름을 방해하는 신호
- 인터럽트의 종류를 구분하는 통일된 기준은 존재하지는 않다.
인터럽트 종류
- 동기 인터럽트 (예외, exception)
- 주로 CPU에 의해 발생
- 명령어가 처리 도중 비정상적인 상황에 마주했을 경우 발생 (오류와 같은 예외적인 상황)
- 종류 : 폴트, 트랩, 중단, 소프트웨어 인터럽트
- 폴트(fault) : 예외를 처리한 직후 예외가 발생한 명령어부터 실행을 재개하는 예외
- 트랩(trap) : 예외를 처리한 직후 예외가 발생한 명령어의 다음 명령어부터 실행을 재개하는 예외 (예- 디버깅)
- 소프트웨어 인터럽트 : 시스템 호출 발생
- 비동기 인터럽트 (하드웨어 인터럽트)
- 주로 입출력장치에 의해 발생
- CPU가 프린터와 같은 입출력 장치에 입출력 작업을 부탁하면 작업을 끝낸 입출력장치가 CPU에 완료 알림(인터럽트)을 보낸다.
하드웨어 인터럽트 처리 순서 (다른 인터럽트도 유사하게 처리)
- 입출력장치는 CPU에게 인터럽트 요청 신호를 보냄
- 인터럽트 요청 신호 : CPU 작업을 방해하는 인터럽트에 대한 요청. “지금 끼어들어도 되나용?”
- CPU는 실행 사이클이 끝나고 명령어 인출하기 전 항상 인터럽트 여부확인
- CPU가 인터럽트 요청을 수용하기 위해서는 플래그 레지스터가 활성화되어 있어야 함
하드웨어 인터럽트에는 인터럽트 플래그로 막을 수 잇는 인터럽트와 막을 수 없는 인터럽트가 존재한다.
플래그 레지스터가 비활성화 되어있어도 인터럽트가 발생한다. (정전, 고장등에 일어남)
- CPU는 인터럽트 요청 확인 후, 인터럽트 플래그를 통해 인터럽트 수용 여부 확인
- 인터럽트가 가능하다면 지금까지의 작업을 메모리 내 스택 영역에 백업
- 인터럽트 벡터를 참조하여 인터럽트 서비스 루틴(인터럽트 핸들러)의 시작주소를 알 수있고 해당 주소로 점프하여 특정 인터럽트 서비스 루틴을 실행
- 인터럽트 벡터 : 인터럽트 서비스 루틴의 시작 주소를 포함하는 인터럽트 서비스 루틴의 식별 정보
- 인터럽트 서비스 루틴 실행 후 백업한 작업 복구, 실행 재개
- 인터럽트 서비스 루틴 : 해당 인터럽트를 처리하기 위한 특별한 처리방법(프로그램)
명령어 사이클은 인출, 실행, 간접, 인터럽트 사이클로 구성되어있다.
5. CPU 성능 향상 기법
1) 빠른 CPU를 위한 설계 기법
클럭
- 컴퓨터 부품은 클럭 신호에 맞춰 일사 분란하게 움직인다.
- CPU는 클럭 신호에 따라 명령어 사이클에 맞춰 명령어를 실행한다.
- 클럭 속도가 높은 CPU는 일반적으로 성능이 좋다.
- 클럭 속도는 헤르츠(Hz) 단위 : 1초에 반복된 클럭의 횟수로 측정 (1Hz: 1초에 한 번 반복, 1000Hz : 1초에 1000번 반복)
클럭 속도는 매번 일정하게 유지하기보다는 고성능을 요하느 순간에는 순간적으로 클럭 속도를 높이고, 그렇지 않을 때는 유연하게 속도를 낮추기도 함.
CPU 오버 클러킹
최대 클럭 속도를 강제로 더 끌어올리는 기법
- 오버(Over) + 클럭(Clock)
- 부팅시 BIOS에서 설정 가능
클럭 속도를 높이는 것은 CPU를 빠르게하지만, 무작정 높이게 되면 발열 문제가 생긴다.
클럭 속도만으로 CPU의 성능을 올리는 것에 한계가 존재하기 때문에 CPU의 코어와 스레드 수를 늘리는 방법이 있다.
코어와 멀티 코어
오늘날의 CPU는 ‘명령어를 실행하는 부품’에서 ‘명령어를 실행하는 부품을 여러 개 포함하는 부품’으로 명칭의 범위가 확장됨
코어
명령어를 인출하고 해석하고, 실행하는 CPU내 부품
- CPU내에서 명령어를 실행하는 부품으로 여러 개가 존재할 수 있다.
멀티코어
여러개 의 코어를 포함하는 CPU를 멀티코어 CPU 또는 멀티 코어 프로세서
- 한 번에 여러 명령어 인출, 해석, 실행가능하다.
- 코어 수에 비례하여 CPU연산속도가 증가하는 것은 아니다.
- CPU 내에 명령어를 처리하는 일꾼이 여려명 있는 겂과 같다.
코어마다 처리할 연산이 적절히 분배되지 않는다면 코어 수에 비례하여 연산 속도가 증가하지 않는다.
또한, 처리하고자 하는 작업량보다 코어 수가 지나치게 많아도 성능에는 크게 영향이 없다.
스레드와 멀티스레드
스레드
하드웨어적 스레드와 소프트웨어적 스레드가 존재한다.
- 하드웨어적 스레드 : 하나의 코어가 동시에 처리하는 명령어 단위
- 1코어 1스레드 : 명령어를 실행하는 부품 하나, 한 번에 한 개의 명령어를 철;
- 소프트웨어적 스레드 : 하나의 프로그램을 독립적으로 실행하는 단위
- 사용자로부터 입력 받은 내용을 화면에 보여주는 기능
- 사용자가 입력한 내용이 맞춤법에 맞는지 검사하는 기능
- 사용자가 입력한 내용을 수시로 저장하는 기능
멀티 스레드
하나의 코어로 여러 개의 명령어를 동시에 실행할 수 있는 CPU를 멀티스레드 프로세서 또는 멀티스레드 CPU라고 한다.
- 2코어 4스레드 : 명령어 실행하는 부품 두 개, 한 번에 네 개의 명령어를 처리
- 8코어 16스레드 : 명령어 실행하는 부품 여덟 개, 한 번에 열여섯 개의 명령어를 처리, 코어 하나당 두 개의 하드웨어 스레드 처리.
멀티 스레드 프로세서 설계 : 복수의 레지스터 세트를 통해서, 하나의 코어로 여러 명령어를 처리하도록 할 수 있다.
- 레지스터 세트 : 하나의 명령어를 실행하기 위해 꼭 필요한 레지스터 집합(프로그램 카운터, 스택 포인터, 메모리 버퍼 레지스터, 메모리 주소 레지스터)
논리 프로세서
메모리와 메모리에 저장된 프로그램 입장에서는 하드웨어 스레드와 코어를 구분 할 수 없다.
‘한 번에 하나의 명령어를 처리하는 CPU’로, 각 하드웨어를 마치 하나의 단일 스레드/코어 프로세서로 인식하는데, 이런 점에서 하드웨어 스레드를 논리 프로세서라고 부르기도 한다.
2) 명령어 병렬 처리 기법
CPU의 성능을 높일 수 있는 설계
- 높은 클럭 수
- 멀티 코어
- 멀티 스레드(멀티 프로세서)
- 명령어 병렬 처리 기법 : 명령어를 동시에 처리하여 CPU를 한시도 쉬지 않고 작동시키는 기법
명령어 파이프라인
공장의 생산라인과 같이 명령어가 처리되는 서로 다른 단계를 동시에 처리하는 기법
하나의 명령어가 처리되는 과정을 비슷한 시간 간격(클럭 단위)으로 나눈면,
- 명령어 인출
- 명령어 해석
- 명령어 실행
- 명령어 저장
위 단계가 서로 겹치지만 않는다면, CPU는 ‘각 단계를 동시에 실행할 수 있다.’
명령어 파이프라이닝에 실패하는 시나리오 : 파이프라인 위험(pipeline hazard)
파이프라이닝이 높은 성능을 가져오지만, 특정 상황에서는 성능 향상에 실패하는 경우도 있다.
- 데이터 위험(data hazard)
- 명령어 간 의존성에 의해 발생
- 모든 명령어를 동시에 처리 할 수는 없다. 이전 명령어를 끝까지 실행해야만 실행할 수 있는 것도 존재한다.
- RAW : 데이터가 쓰여진 직후 그 데이터를 읽어들이는 경우
- WAW : 데이터를 쓴 직후 그 데이터에서 새 내용을 쓰는 경우
- WAR : 데이터를 읽어들인 직후 그 데이터에 새 내용을 쓰는 경우
- 제어 위험(control hazard)
- 프로그램 카운터의 갑작스러운 변화에 의해 발생(분기 필요)
- 명령어 파이프라인에 미리 가지고 와서 처리중이었던 명령어들이 쓸모가 없어진다.
- 분기 예측 기술로 보완 : 프로그램이 어디로 분기할지 미리 예측한 후 그 주소를 인출하는 기술
- 구조적 위험(structural harazd)
- 서로 다른 명령어가 동시에 ALU, 레지스터 등과 같은 동일한 자원을 사용하려 할 경우 발생
파이프라이닝의 발전 : 슈퍼스칼라
공장 생산 라인을 여러개 두는 것과 같다.
- CPU내부에 여러개의 명령어 파이프라인을 두는 방식
- 여러 명령어 동시 인출/해석/실행/저장이 가능한 CPU
- 이론적으로는 파이프라인 개수에 비례하여 프로그램 처리 속도가 빨라지지만, 반드시 비례해서 빨라지지는 않는다. 데이터 위험, 제어 위험, 자원 위험을 피하기가 까다롭기 때문
비순차적 명령어 처리
명령어를 순차적으로만 실행하지 않고 순서를 바꿔 실행해도 무방한 명령어를 먼저 실행하여 명령어 파이프라인이 멈추는 것을 방지하는 기법
- 파이프라이닝 내의 의존 관계 가 없는 명령어를 순차적으로 처리하지 않는 방법
- 순서를 바꿔 실행 : 비순차적 명령어 처리가 가능한 CPU의 기능
3) CISC와 RISC
2주차 미션
혼자 공부하는 컴퓨터 구조+운영체제
진도: Chapter 04 ~ 05
기본 미션: p. 125의 확인 문제 2번, p. 155의 확인 문제 4번 풀고 인증하기
선택 미션: Ch.05(05-1) 코어와 스레드, 멀티 코어와 멀티 스레드의 개념을 정리하기
기본 미션 : p. 125의 확인 문제 2번 풀고 인증하기
기본 미션 : p. 155의 확인 문제 4번 풀고 인증하기
선택 미션 : Ch.05(05-1) 코어와 스레드, 멀티 코어와 멀티 스레드의 개념을 정리하기
코어
명령어를 인출하고 해석하고, 실행하는 CPU내 부품이다.
CPU내에서 명령어를 실행하는 부품으로 여러 개가 존재할 수 있다.
스레드
하드웨어적 스레드와 소프트웨어적 스레드가 존재한다.
- 하드웨어적 스레드 : 하나의 코어가 동시에 처리하는 명령어 단위
- 소프트웨어적 스레드 : 하나의 프로그램을 독립적으로 실행하는 단위
멀티 코어
여러개 의 코어를 포함하는 CPU를 멀티코어 CPU 또는 멀티 코어 프로세서라고 한다.
코어 수에 비례하여 CPU연산속도가 증가하는 것은 아니다.
멀티 스레드
하나의 코어로 여러 개의 명령어를 동시에 실행할 수 있는 CPU를 멀티스레드 프로세서 또는 멀티스레드 CPU라고 한다.
복수의 레지스터 세트를 통해서, 하나의 코어로 여러 명령어를 처리하도록 할 수 있다.
- 레지스터 세트 : 하나의 명령어를 실행하기 위해 꼭 필요한 레지스터 집합
2주차 회고
이번주는 다른 것들이나 선약들로 바빴던 터라 조금 걱정했었다.
코어와 스레드를 보면서 몇 년 전에 데스크탑 세팅할때 생각나서 반가웠다.
그 당시에는 코어와 스레드에 대해서 정말 잘 와닿지 않았었고, 인텔과 AMD에 대한 차이를 잘 몰랐기 때문에 지인의 추천의 기준으로만 선택했었다.
이번 주차를 통해서 좀 더 이해하게 되어서 재밌다.