캐시메모리는 속도가 빠른 장치와 느린 장치에서 속도 차이에 따른 병목 현상을 줄이기 위한 메모리를 말한다
1. Cache Memory
- CPU가 주기억장치에서 저장된 데이터를 읽어올 때, 자주 사용하는 데이터를 캐시 메모리에 저장한 뒤, 다음에 이용할 때 주기억장치가 아닌 캐시 메모리에서 먼저 가져오면서 속도를 향상시킴
- 속도라는 장점을 얻지만, 용량이 적기도 하고 비용이 비쌈
- CPU에는 이러한 캐시 메모리가 2~3개 정도 사용이 됨
- 속도와 크기에 따라 분류한 것으로, 일반적으로 L1 캐시부터 먼저 사용이 되고 여기서 데이터를 찾지 못하면 L2로 넘어간다
듀얼 코어 프로세서의 캐시 메모리
- 각 코어마다 독립된 L1 캐시 메모리를 가지고, 두 코어가 공유하는 L2 캐시 메모리가 내장됨
- 만약 L1 캐시가 128kb이면, 64/64로 나누어 64kb에 명령어를 처리하기 직전의 명령어를 임시 저장하고, 나머지 64kb에는 실행 후 명령어를 임시 저장한다
L1 : CPU 내부에 존재
L2 : CPU, RAM 사이에 존재
L3 : 보통 메인보드에 존재
2. Cache Memory 작동 원리
시간 지역성
- for나 while 같은 반복문에 사용하는 조건 변수처럼 한 번 참조된 데이터는 잠시후 또 참조될 가능성이 높음
공간 지역성
- A[0], A[1]과 같은 연속 접근 시, 참조된 데이터 근처에 있는 데이터가 잠시후 또 사용될 가능성이 높음
캐시에 데이터를 저장할 때는, 이러한 참조 지역성을 최대한 활용하기 위해 해당 데이터뿐만 아니라, 옆 주소의 데이터도 같이 가져와 미래에 쓰일 것을 대비
3. Cache Miss
CPU에 요청한 데이터가 캐시에 있으면 'Cache Hit', 없어서 DRAM에서 가져오면 'Cache Miss'
Cold Miss
Conflict miss
- 캐시 메모리에 A와 B 데이터를 저장해야 하는데, A와 B가 같은 캐시 메모리 주소에 할당되어 있어서 나는 미스
Capacity miss
4. 구조 및 작동방식
Direct Mapped Cache
- 가장 기본적인 구조로, DRAM의 여러 주소가 캐시 메모리의 한 주소에 대응되는 다대일 방식
- 간단하고 빠른 장점이 있지만 Conflict miss가 발생하는 것이 단점
Fully Associative Cache
- 비어있는 캐시 메모리가 있으면, 마음대로 주소를 저장하는 방식
- 저장할 때는 매우 간단하지만 찾을 때가 문제
- 조건이나 규칙이 없어서 특정 캐시 Set안에 있는 모든 블럭을 한 번에 찾아 원하는 데이터가 있는지 검색해야 함. CAM이라는 특수한 메모리 구조를 사용해야 하지만 가격이 매우 비쌈
Set Associated Cache
- Direct + Fully 방식
- 특정 행을 지정하고, 그 행안의 어떤 열이든 비어있을 때 저장하는 방식
- Direct에 비해 검색 속도는 느리지만, 저장이 빠르고 Fully에 비해 저장이 느린 대신 검색이 빠른 중간형