https://school.programmers.co.kr/learn/courses/30/lessons/17680
지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.
어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.
입력 형식
제한사항
import java.util.*;
class Solution {
class Cache<String, Integer> extends LinkedHashMap<String, Integer>{
int capacity = 0;
public Cache(int capacity) {
// 자바에서 HashMap의 인스턴스 최적의 값은 0.75 (부하계수)
// LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder)
// 세가지 생성자 필요
super(capacity,0.75f,true); // access-ordered
this.capacity = capacity;
}
@Override
protected boolean removeEldestEntry(Map.Entry<String, Integer> eldest) {
// eldest 가장 오랫동안 안쓴 데이터
return size() > capacity;
}
}
public int solution(int cacheSize, String[] cities) {
int answer = 0;
int hit = 1;
int miss = 5;
Cache<String,Integer> cache = new Cache<>(cacheSize);
for(int i = 0; i < cities.length; i++) {
String c = cities[i].toLowerCase();
if (cache.containsKey(c)) {
// hit
answer+=hit;
} else {
// miss
answer+=miss;
}
cache.put(c, 0);
}
return answer;
}
}
캐시[Cache]란?
프로그램이 수행될 때 나타나는 지역성을 이용하여 메모리나 디스크에서 사용되었던 내용을 특별히 빠르게 접근할 수 있는 곳에 보관하고 관리함으로써 이 내용을 다시 필요로할 때 보다 빠르게 참조하도록 하는 것이다.
쉽게 풀어서 설명하면 사용되었던 데이터는 다시 사용되어 질 가능성이 높다는 개념을 이용한 것이다. 이를 통해서
다시 사용될 확률이 높은 아이들을 좀 더 빠르게 접근 가능한 저장소를 사용한다는 개념이다.
캐시 히트[Cache Hit]란?
CPU가 참조하고자 하는 메모리가 캐시에 존재하고 있을 경우 Cache Hit라고 한다.
캐시 미스[Cache Miss]란?
CPU가 참조하고자 하는 메모리가 캐시에 존재하지 않을 때 Cache Miss라고 한다.
가장 오랫동안 참조되지 않은 페이지를 교체하는 기법
페이지 교체 알고리즘엔, FIFO, LFU, LRU 알고리즘 등이 있다.
FIFO : 페이지가 주기억장치에 적재된 시간을 기준으로 교체될 페이지를 선정하는 기법
단점 : Belady`s Anomaly 현상의 발생 가능성이 있다. 구현은 간단하나, 성능은 좋지 않은 편. 중요한 페이지가 가장 오래있었다는 이유로 교체되는 문제가 발생할 수 있음.
Belady`s Anomaly 현상이란? 프레임의 개수가 많아져도 page-fault가 줄어들지 않고 늘어나는 현상.
LFU : 가장 적은 횟수를 참조하는 페이지를 교체
perfect-LFU의 경우 정확하게 참조 횟수를 참조할 수는 있으나, 시간에 따른 참조의 변화까지 반영하는 것은 어렵고, 구현이 복잡하다는 단점을 지녔다.
LRU : 가장 오랫동안 참조되지 않은 페이지를 교체
단점 : 프로세스가 주기억장치에 접근할 때마다 참조된 페이지에 대한 시간을 기록해야함. 계수기나 스택과 같은 별도의 하드웨어가 필요하고 시간적으로 큰 오버헤드가 발생함. 동일한 패턴이 반되는경우 성능 저하.