[프로그래머스] [1차] 캐시 - 알고리즘 문제풀이 (2)

BE전공생·2023년 6월 17일
0

코딩테스트 연습

목록 보기
2/2

Programmers 2018 KAKAO BLIND RECRUITMENT - [1차] 캐시

https://school.programmers.co.kr/learn/courses/30/lessons/17680


문제 설명

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.

어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.


입력 형식

  • 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
  • cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
  • cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
  • 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

제한사항

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

풀이

import java.util.*;

class Solution {
    class Cache<String, Integer> extends LinkedHashMap<String, Integer>{
        int capacity = 0;

        public Cache(int capacity) {
            // 자바에서 HashMap의 인스턴스 최적의 값은 0.75 (부하계수)
            // LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) 
            // 세가지 생성자 필요
            super(capacity,0.75f,true); // access-ordered
            this.capacity = capacity;
        }

        @Override
        protected boolean removeEldestEntry(Map.Entry<String, Integer> eldest) {
        // eldest 가장 오랫동안 안쓴 데이터
            return size() > capacity;
        }
    }

    public int solution(int cacheSize, String[] cities) {
        int answer = 0;
        int hit = 1;
        int miss = 5;
        Cache<String,Integer> cache = new Cache<>(cacheSize);
        for(int i = 0; i < cities.length; i++) {
            String c = cities[i].toLowerCase();
            if (cache.containsKey(c)) {
                // hit
                answer+=hit;
            } else {
                // miss 
                answer+=miss;
            }
            cache.put(c, 0);
        }
        return answer;
    }
}

결과




번외 공부

캐시[Cache]란?

프로그램이 수행될 때 나타나는 지역성을 이용하여 메모리나 디스크에서 사용되었던 내용을 특별히 빠르게 접근할 수 있는 곳에 보관하고 관리함으로써 이 내용을 다시 필요로할 때 보다 빠르게 참조하도록 하는 것이다.

쉽게 풀어서 설명하면 사용되었던 데이터는 다시 사용되어 질 가능성이 높다는 개념을 이용한 것이다. 이를 통해서

다시 사용될 확률이 높은 아이들을 좀 더 빠르게 접근 가능한 저장소를 사용한다는 개념이다.


캐시 히트[Cache Hit]란?

CPU가 참조하고자 하는 메모리가 캐시에 존재하고 있을 경우 Cache Hit라고 한다.

캐시 미스[Cache Miss]란?

CPU가 참조하고자 하는 메모리가 캐시에 존재하지 않을 때 Cache Miss라고 한다.


LRU 알고리즘?

가장 오랫동안 참조되지 않은 페이지를 교체하는 기법

페이지 교체 알고리즘

페이지 교체 알고리즘엔, FIFO, LFU, LRU 알고리즘 등이 있다.

FIFO : 페이지가 주기억장치에 적재된 시간을 기준으로 교체될 페이지를 선정하는 기법

단점 : Belady`s Anomaly 현상의 발생 가능성이 있다. 구현은 간단하나, 성능은 좋지 않은 편. 중요한 페이지가 가장 오래있었다는 이유로 교체되는 문제가 발생할 수 있음.

Belady`s Anomaly 현상이란? 프레임의 개수가 많아져도 page-fault가 줄어들지 않고 늘어나는 현상.

LFU : 가장 적은 횟수를 참조하는 페이지를 교체

  • Incache-LFU ? 메모리에 적재될 때부터 페이지의 횟수를 카운트 하는 방식
  • Perfect-LFU ? 메모리 적재 여부와 상관 없이 페이지의 과거 총 참조 횟수를 카운트 하는 방식

perfect-LFU의 경우 정확하게 참조 횟수를 참조할 수는 있으나, 시간에 따른 참조의 변화까지 반영하는 것은 어렵고, 구현이 복잡하다는 단점을 지녔다.

LRU : 가장 오랫동안 참조되지 않은 페이지를 교체

단점 : 프로세스가 주기억장치에 접근할 때마다 참조된 페이지에 대한 시간을 기록해야함. 계수기나 스택과 같은 별도의 하드웨어가 필요하고 시간적으로 큰 오버헤드가 발생함. 동일한 패턴이 반되는경우 성능 저하.

profile
비전공생이지만 BE전공생을 꿈꾸고 있습니다. 나무보다 숲을 그리는 개발자로의 모험 -ing.

0개의 댓글