[작성일: 2023. 09. 12]
캐시 기본 동작
캐시가 없을 때
- 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운받아야 한다.
- 인터넷 네트워크는 매우 비싸고 느리다.
- 브라우저 로딩 속도가 느리다.
- 느린 사용자 경험
캐시 적용
- cache-control: max-age=60
- 캐시 덕분에 캐시 가능 시간동안 네트워크를 사용하지 않아도 된다.
- 비싼 네트워크 사용량을 줄일 수 있다.
- 브라우저 로딩 속도가 매우 빠르다.
- 빠른 사용자 경험
하지만 캐시 유효 시간이 초과하면 서버를 통해 다시 데이터를 조회하고 캐시를 갱신한다.
이때 다시 네트워크 다운로드(1.1M)가 발생하는 것이다.
서버에 있는 데이터와 클라이언트에게 있는 데이터가 변함이 없는데도 전체를 다시 다운 받는다면 낭비가 발생한다.
검증 헤더와 조건부 요청
캐시 유효 시간이 초과해서 서버에 다시 요청하면 다음과 같은 두 가지 상황이 나타난다.
- 서버에서 기존 데이터를 변경할 경우
- 서버에서 기존 데이터를 변경하지 않았을 경우
검증 헤더 추가
- 캐시 데이터와 서버 데이터가 같은 지 검증하는 데이터
- Last-Modified, Etag
- 캐시 유효 시간이 초과해도 서버의 데이터가 갱신되지 않으면 304 NotModified와 헤더 메타 정보만 응답하며 HTTP 바디가 없다.
- 클라이언트는 캐시에 저장되어 있는 데이터를 재활용한다.
- 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드를 한다.
조건부 요청 헤더
- 검증 헤더로 조건에 따른 분기를 서버에게 요청한다.
- If-Modified-Since는 Last-Modified와 같이 사용한다.
- If-None-Match는 Etag와 같이 사용한다.
- 조건이 만족하면 200 OK, 조건이 만족하지 않으면 304 Not Modified가 나온다.
검증 헤더와 조건부 요청 예시
- If-Modified-Since: 이후에 데이터가 수정되었다면?
- 데이터 미 변경 시
- 캐시: 2023년 11월 11일 11:11:11 vs 서버: 2023년 11월 11일 11:11:11
- 304 Not Modified, 헤더 데이터만 전송한다. (body 미 포함)
- 캐시로 리다이렉트 한다.
- 전송 용량 0.1M(헤더 크기)
- 데이터 변경 시
- 캐시: 2023년 11월 11일 11:11:11 vs 서버: 2023년 11월 12일 12:12:12
- 200 OK, 모든 데이터를 전송한다. (body 포함)
- 전송 용량 1.1M(헤더+바디 크기)
- 데이터 미 변경 시
Last-Modified, If-Modified-Since 단점
- 1초 미만 단위로 캐시 조정이 불가능하다.
- 날짜 기반의 로직을 사용한다.
- 데이터를 수정해서 날짜가 다르지만 같은 데이터를 수정해서 데이터 결과가 똑같은 경우 (A ➡️ B ➡️ A)
- 서버에서 별도의 캐시 로직을 관리하고 싶은 경우
- 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우
ETag, If-None-Match
- ETag(Entity Tag)
- Last-Modified, If-Modified-Since의 단점을 보완한다.
- 캐시용 데이터에 임의의 고유한 버전 이름을 달아둔다.
- ETag: "v1.0", ETag: "a2jiodwjekjl3"
- 데이터가 변경되면 이 이름을 바꾸어서 변경하면 된다.(Hash를 다시 생성)
- ETag: "aaaaa" ➡️ ETag: "bbbbb"
- 단순하게 ETag만 보내서 같음녀 유지, 다르면 다시 받으면 된다.
- 캐시 제어 로직을 서버에서 완전히 관리한다.
- 클라이언트는 단순히 이 값을 서버에 제공하며 캐시 메커니즘을 알지 못 한다.
- 서버 베타 오픈 기간인 3일 동안 파일이 변경되어도 ETag를 동일하게 유지한다.
- 애플리케이션 배포 주기에 맞춰서 ETag를 모두 갱신한다.
캐시와 조건부 요청 헤더
Cache-Control
- 캐시 지시어(directives)
- Cache-Control: max-age
- 캐시 유효 시간, 초단위
- Cache-Control: no-cache
- 데이터는 캐시해도 되지만 항상 원(origin) 서버에 검증하고 사용한다.
- 검증: If-modified-Since, If-None-Match 등
- Cache-Control: no-store
- 데이터에 민감한 정보가 있으므로 저장하면 안 된다.
- 메모리에서 사용하고 최대한 빨리 삭제한다.
Pragma
- 캐시 제어(하위 호환)
- Pragma: no-cache
- HTTP 1.0의 하위 호환이다.
Expires
- 캐시 만료일 지정(하위 호환)
- expires: Mon, 01 Jan 2023 00:00:00 GMT
- 캐시 만료일을 정확한 날짜로 지정한다.
- HTTP 1.0부터 사용했다.
- 지금은 더 유연한 Cache-Control: max-age를 권장한다.
- Cache-Control: max-age와 함께 사용되면 Expires는 무시된다.
검증 헤더와 조건부 요청 헤더 정리
- 검증 헤더(Validator)
- ETag: "v1.0", ETag: "asisd90kjsdfk2l"
- Last-Modified: Thu, 04 Jun 2023 00:00:00 GMT
- 조건부 요청 헤더
- If-Match, If-None-Match: ETag 값을 사용한다.
- If-Modified-Since, If-Unmodified-Since: Last-Modified 값을 사용한다.
프록시 캐시
- Cache-Control: public
- 응답이 public 캐시에 저장되어도 된다는 의미
- 공용 이미지 등
- cache-Control: private
- 응답이 해당 사용자만을 위한 것이다.
- private 캐시에 저장해야 한다.(기본값)
- Cache-Control: s-maxage
- 프록시 캐시에만 적용되는 max-age를 의미한다.
- Age: 60 (HTTP 헤더)
- 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간(초)를 의미한다.
캐시 무효화(확실한 캐시 무효화 응답)
- Cache-Control: no-cache
- 데이터는 캐시해도 되지만 항상 원 서버에 검증하고 사용한다.(이름에 주의할 것)
- Cache-Control: no-store
- 데이터에 민감한 정보가 있으므로 저장하면 안 된다.
- 메모리에 사용하고 최대한 빨리 삭제한다.
- Cache-Control: must-revalidate
- 캐시 만료 후 최초 조회 시 원 서버에 검증해야 한다.
- 원 서버 접근 실패 시 반드시 오류가 발생해야 한다. (504, Gateway Timeout)
- must-revalidate는 캐시 유효 시간이라면 캐시를 사용한다.
- Pragma: no-cache
- HTTP 1.0 하위 호환
🐣 출처: 인프런 김영한님 강의
이 글은 인프런의 김영한님 HTTP 웹 강의를 보고 작성한 글입니다.
강의를 들으면서 정리한 글이므로 틀린 내용이나 오타가 있을 수 있습니다.