카카오 - 캐시

아따맘마·2021년 1월 7일
0

알고리즘 - 카카오

목록 보기
3/19

문제

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.

어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.

입력

캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

출력

입력된 도시이름 배열을 순서대로 처리할 때, “총 실행시간”을 출력한다.

조건

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

풀이

LRU 알고리즘

이 문제를 풀면서 처음 들어본 알고리즘이다. 찾아보니까 FIFO 개념과 비슷하다. LRU 알고리즘은 페이지 교체 알고리즘 중 하나인데, 가장 최근에 이용된 페이지는 재사용성이 높아 가장 오래된 페이지를 삭제(?)한다는 개념이다. 이 개념만 보면 바로 FIFO구나~ 할 수 있다. 근데 또 구글링해보니까 FIFO와는 다르다...
생각해 보니까 확실히 다르다는 것을 알 수 있었다.

(아닐 수도 있다..)
위 원리를 보면 Queue 구조는 쓰기에 비경제적(?)이다. Queue는 캐시가 중간에 존재할 때 비효율적이기 때문이다.
그럼 이 LRU 알고리즘을 구현하기 위해 사용하는 자료구조는 어떤것이 있을까?
LRU에 최적화된 자료구조애는 list와 vector이 있는데, 각각 장단점이 있다.
cache hit과 miss는 무슨말일까?

  • hit : 자료구조 내에 해당 캐시가 있는 경우
  • miss : 자료구조 내에 해당 캐시가 없는 경우

코드

이 문제르 풀 때 cache 최대 크기가 30으로 list에서 선회탐색할 때 시간의 제약이 크지 않을 것 같아서 list 자료구조로 풀었다. 한번 vector로도 해봐야겠다.

#include <string>
#include <vector>
#include <algorithm>
#include <list>

using namespace std;

int solution(int cacheSize, vector<string> cities) {
	if (cacheSize == 0)
		return cities.size() * 5;

	int answer = 0;
	list<string> lru;
	list<string>::iterator itr;

	for_each(cities.begin(), cities.end(), [](string& str) {
		for (int i = 0; i < str.length(); i++) {
			str[i] = tolower(str[i]);
		}
		});
	for (int i = 0; i < cities.size(); i++)
	{
		bool miss = true;
		for (itr = lru.begin(); itr != lru.end(); itr++) {
			if (*itr == cities[i]) {
				miss = false;
				lru.erase(itr);
				lru.push_back(cities[i]);
				answer++;
				break;
			}
		}
		if (miss) {
			if (lru.size() == cacheSize)
			{
				lru.pop_front();
				lru.push_back(cities[i]);
			}
			else
				lru.push_back(cities[i]);
			answer += 5;
		}
	}
	return answer;
}

for_each

위 for_each은 파이썬에서 apply와 lambda와 비슷한 것 같다. [](&string str)이 lambda x 와 같은 역할을 한다. 이 str에 cities 스트링 배열에서 하나씩 빼와서 str 변수에 넣는다.

profile
늦게 출발했지만 꾸준히 달려서 도착지점에 무사히 도달하자

0개의 댓글