캐시를 효율적으로 처리하기 위한 기본 내용 정리

Genie·2021년 11월 22일
0

캐시 시간 초과

  • 캐시 유효 시간이 초과해서 서버에 다시 요청하면 두 가지 상황이 나타난다.
  1. 서버에서 기존 데이터를 변경했거나
  2. 서버에서 기존 데이터를 변경하지 않았거나

캐시 만료 후에도 서버에서 데이터를 변경하지 않음
생각해보면 데이터를 전송하는 대신, 저장해 두었던 캐시를 재사용 할 수 있다.
단, 클라이언트의 데이터와 서버의 데이터가 같다는 사실을 확인할 수 있는 방법이 필요하다.

바로, 검증 헤더와 조건부 요청

  1. 서버 -> 웹 브라우저
    최초에 서버의 응답에 Last-modified(데이터 최종 수정일)을 같이 보낸다.

  2. 웹 브라우저 -> 서버
    if-modified-since : 웹 브라우저 캐시가 가지고 있는, 데이터 최종 수정일, 웹 브라우저가 서버에 요청할 때 보낸다. (캐시 유효 시간이 초과했거나, 새로고침을 한 경우)

  3. 서버 -> 웹 브라우저
    그럼, 서버에선 if-modified-since 이것을 통해서 검증이 가능해진다. 서버는 이를 보고나서, 데이터의 최종 수정일과 비교하여 새로 보낼 필요가 없다고 판단하게 되면, 서버에서는 304 Not Modified 라고 내보낸다. 그리고 동시에, HTTP Body 없이 용량을 확 줄여서 클라이언트에게 응답한다.

그리고, 웹 브라우저가 다시 그 응답을 받았을 때, cache-control , last-modified 의 메타 정보를 이용해서 다시 캐시를 세팅한다. 클라이언트는 캐시에 저장되어 있는 데이터를 재활용 할 수 있다. 결과적으로 매우 용량을 줄인 실용적인 해결책이 된다.


정리

검증 헤더

  • 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
  • Last-Modified , ETag

조건부 요청 헤더

  • 검증 헤더로 조건에 따른 분기
  • If-Modified-Since : Last-Modified 일 때 사용.
  • If-None-Match : ETag 일 때 사용.
  • 조건이 만족하면 200 응답
  • 만족하지 않으면 304 응답
  • 예시
    • If-Modified-Since : 이 값 이후에 데이터가 수정이 되었나요?
    • 캐시 == 서버 -> 수정이 안됨. 조건과 다름 => 304 Not Modified
    • 캐시 != 서버 -> 수정이 되었음. 조건과 일치 => 200 OK

단점

  • 1초 미만 단위로는 캐시 조정이 불가능 ( 이렇게 까지 할 일이 있을까.. ?)
  • 날짜 기반의 로직 사용
  • 데이터를 수정해서 날짜가 다르지만, 데이터 자체는 똑같다.(A->B->A) 다시 A로 수정을 했다면 서버입장에선 파일의 날짜만 갱신되고 실제 내용은 갱신이 안되어있을 수도 있다.
  • 서버에서 별도로 캐시 로직을 관리하고 싶은 경우(날짜만 보는게 아니라 별도로)
    • 스페이스, 주석 이런거는 신경안쓰고 싶다.
    • 이럴 때, 사용하는 게 ETag

ETag

  • Entity Tag (서버에서 응답할 때 내려주고, 웹 브라우저는 ETag 값을 저장한다.)
  • 캐시용 데이터에 임의의 고유한 버전 이름을 달아둔다.
    • ETag: "v1.0", ETag: "a2jiodwjekjl3"
  • 데이터가 변경되면 이 이름을 바꾸어서 변경하여 다시 hash 를 생성한다.
  • 진짜 단순하게 ETag 만 보내서 같으면 유지, 다르면 다시 받는다.(해시 코드 비교)
  • 캐시 제어 로직을 서버에서 완전히 관리한다. 클라이언트는 완전히 블랙박스임. 클라이언트는 서버의 아무 매커니즘을 모름
  • 예(있을법한)
    • 애플리케이션 배포 주기에 맞추어 ETag 모두 갱신.

캐시와 조건부 관련 헤더 정리

캐시 제어 헤더

  • Cache-Control : 캐시 제어 (이게 제일 중요하다.)

    • 값 : max-age / 캐시가 얼마나 유효한지 , 초 단위로 입력한다.
    • 값 : no-cache / 항상 캐시를 사용하기 전에 원(origin) 서버한테 검증을 하고 써라는 뜻 , 데이터는 캐시해도 됨.
    • 값 : no-store / 데이터에 민감한 정보가 있으므로 저장하면 안됨. 메모리에서 사용하고 최대한 빨리 삭제 해야 한다. no-cache 와 헷갈리지 말자.
  • Pragma : HTTP 1.0 하위 호환이라 거의 사용안함.

  • Expires : 캐시 만료일 지정(하위 호환)

    • 캐시 만료일을 정확한 날짜로 지정할 수 있음.
    • 지금은 Cache-Control: max-age 를 권장, cache-control 이랑 같이 쓰면 cache-control 로만 사용되게 됨.

검증 헤더와 조건부 요청 헤더

  • 검증 헤더
    • ETag , Last-Modified
  • 조건부 요청 헤더
    • If-Match , If-None-Match : ETag 값을 사용
    • If-Modified-Since , If-Unmodified-Since : Last-Modified 값 사용

프록시 캐시

웹 브라우저가 원 서버까지 500ms 가 걸린다고 하면, 사람들은 항상 500ms 를 기다려야 할 것이다.
그래서 도입된 것이 프록시 캐시 서버 이다. CDN 서비스 라고 해서 하고있음.
요청이 오면 프록시 캐시 서버를 거쳐서 오도록 되어있다. 웹 브라우저의 요청을 프록시 캐시 서버로 처리하도록 한다. 우리가 유튜브를 빨리 볼 수 있는 것.
보통, 첫 번째 유저는 느리고, 두 번째부터는 빨리 할 수도 있음. 로컬의 웹 브라우저에 저장되는 것을 private 캐시, 프록시 캐시에 저장되는 것을 public 캐시라고 한다.

캐시 지시어(이런게 있다 정도만 알고 넘어가면 될 듯)

  • Cache-Control : public
    • 응답이 public 캐시에 저장되어도 된다는 뜻
  • Cache-Control : private(이게 default 이다, public 이 아니라)
    • 응답이 해당 사용자를 위한 것임, 중간에 프록시 캐시 서버에 저장되면 안된다는 뜻,
  • Cache-Control : s-maxage
    • 프록시 캐시에만 적용되는 max-age
  • Age: 60(HTTP 헤더)
    • 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간

캐시 무효화

확실한 캐시 무효화 응답을 하는 방법에 대한 설명

  • 웹 브라우저는 임의로 캐시 처리를 해버릴 수 있다.

  • 진짜로 절대 캐시 되게 하기 싫다면 이렇게 해줘야한다.

    Cache-Control: no-cache, no-store, must-revalidate
    Pragma: no-cache (HTTP 1.0 하위 호환)

  • Cache-Control: no-cache

    • 데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용해야 한다.(이름에 주의하자)
    • 원 서버 접근 실패시 성공 으로 보낼 수도 있음.
  • no-store : 데이터에 민감한 정보가 있으므로 저장하면 안됨, 빨리 삭제해야함.

  • must-revalidate

    • 캐시 만료후 최초 조회시 원 서버에 검증해야 한다.
    • 원 서버 접근 실패시 반드시 오류가 발생해야함 - 504(Gateway Timeout) no-cache 와의 차이!
profile
차근차근

0개의 댓글