[Py_Lv2] 1차 캐시

Sunghun📈·2021년 10월 13일
0

프로그래머스

목록 보기
67/93
post-thumbnail

문제 설명

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.

어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.

제한 사항

  • 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
  • cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
  • cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
  • 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

입출력 예

  • 입력된 도시이름 배열을 순서대로 처리할 때, "총 실행시간"을 출력한다.

조건

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

접근법

우선, 이 문제를 풀기 위해서는 LRU 알고리즘에 대한 지식이 필요하다.

LRU는 캐시 교체 전략 중 하나로, 가장 오래전에 사용된 아이템을
버리는 방식이다.

그냥 구현한다면 꽤 복잡할 수 있으나 역시 파이썬......

collections 라이브러리에 있는 deque를 사용하면 된다.

deque는 스택과 큐와 관련된 문제를 풀때도 사용되었는데

maxlen을 파라미터로 넣으면 최대크기를 설정할 수 있고
maxlen으로 설정한 값을 초과하는 데이터가 들어가면 가장 처음에 입력된
값이 자동으로 삭제되고 마지막에 넣은 데이터가 마지막에 삽입된다.

예를 들어 캐시크기 3일 경우
[1,2,3] 데이터가 최대 3개만 들어갈 수 있으므로 4를 넣으면
[2,3,4] 가 되는것이다.

문제에서 도시를 집어 넣을때 캐시안에 이미 존재하는 경우
데이터를 삭제하고 다시 마지막 단에 집어 넣는다. 그러면 시간은 +1

캐시에 삽입하려는 도시가 없는 경우 miss로 마지막 단에 해당 값을 넣고
시간을 +5한다.

이게 문제 풀이이고 구현은 어렵지 않다.

다만, 이 알고리즘을 몰랐다면 굉장히 시간을 낭비했거나 풀지 못했을것 같다.

===========================================================

import collections

def solution(cacheSize : int, cities) -> int:
    elapsed : int = 0
    cache =  collections.deque(maxlen = cacheSize)
    
    for c in cities:
        c = c.lower()
        #캐시 히트 시 재삽입 처리
        
        if c in cache:
            cache.remove(c)
            cache.append(c)
            elapsed += 1
        else: # 캐시 미스 시 삽입만
            cache.append(c)
            elapsed += 5
    return elapsed
profile
데이터 분석과 AI 분야의 전문가를 꿈꾸는 청년

0개의 댓글