#HTTP #웹
모든 개발자를 위한 HTTP 웹 기본 지식
인터넷 통신
어떻게 수많은 노드를 거쳐 목적지까지 전달할까?
IP (인터넷 프로토콜)
주소 부여
IP 역할
- 지정한 IP 주소에 데이터 전달
- 패킷이라는 통신 단위로 데이터 전달
IP 패킷 정보
서버 패킷 전달
IP 프로토콜 한계
- 비연결성
* 패킷을 받을 대상이 없거나 서비스 불능 상태여도 패킷 전송
- 비신뢰성
중간에 패킷 사라지면?
패킷이 순서대로 안오면?
- 프로그램 구분
* 같은 IP를 사용하는 서버에서 통신하는 애플리케이션 둘 이상이면?
TCP와 UDP를 통해 어느정도 해결
#TCP
TCP
인터넷 프로토콜 스택의 4계층
- 애플리케이션 계층 - HTTP, FTP
- 전송 계층 - TCP, UDP
- 인터넷 계층 - IP
- 네트워크 인터페이스 계층
프로토콜 계층
TCP/IP 패킷 정보
TCP 특징
전송 제어 프로토콜
TCP 3 way handshake
- 서로 SYN 과 ACK를 보내며 클라이언트 서버 서로를 신뢰할 수 있음
- 서버가 꺼져있거나 클라이언트가 꺼져있으면 SYN 또는 ACK가 전송을 못 받아 연결이 안됨
데이터 전달 보증
순서 보장
#UDP
UDP
UDP 특징
사용자 데이터그램 프로토콜
TCP와 같은 계층
- 하얀 도화지에 비유 (기능 없음)
- 연결지향 - 3 way handshake X
- 데이터 전달 보증 X
- 순서 보장 X
- 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름
- 정리
IP와 거의 같다. +PORT +체크섬 정도만 추가
애플리케이션에서 추가 작업 필요
최근 각광을 받음 현재 TCP 프로토콜 위주 사용중
현재 더 최적화를 하며 UDP 뜨는중
#PORT
PORT
한번에 둘 이상 연결해야 한다면?
패킷이 게임용인지 화상통화용인지 어케 구분?
PORT - 같은 IP 내에서 프로세스 구분
아파트가 IP면 호수가 PORT
PORT
- 0 ~ 65536 할당 가능
- 0 ~ 1023 : 잘 알려진 포트, 사용하지 않는 것이 좋음
FTP - 20, 21
TELNET - 23
HTTP - 80
HTTPS - 443
IP는 변경될 수 있다.
#DNS
DNS
도메인 네임 시스템
DNS 사용
인터넷 네트워크 정리
- 인터넷 통신
- IP
- TCP, UDP
- PORT
- DNS
URI
단어 뜻
- Uniform : 리소스 식별하는 통일된 방식
- Resource : URI로 식별할 수 있는 모든 것
- Identifier : 다른 항목과 구분하는데 필요한 정보
URL, URN
단어 뜻
- URL - Locator : 리소스가 있는 위치 지정
- URN - Name : 리소스에 이름 부여
- 위치를 변할 수 있지만, 이름은 변하지 않음
URL
scheme
- 주로 프로토콜 사용
- 프로토콜 : 어떤 방식으로 자원에 접근할 것인가 약속 규칙
* 예) http, https, ftp 등
- http는 80 포트, https는 443 포트를 주로 사용, 포트는 생략 가능
- https는 http에 보안 추가 (HTTP Secure)
host
- 호스트명
- 도메인명 또는 IP 주소를 직접 사용가능
PORT
- 접속 포트
- 일반적으로 생략, 생략시 http는 80, https는 443
path
- 리소스 경로(path), 계층적 구조
- 예
/home/file1.jpg
/members
* /members/100
쿼리 파라미터
- key=value형태
- ?로 시작, &로 추가 가능
- 웹 서버에 제공하는 파라미터, 문자 형태
웹 브라우저 요청 흐름
HTTP 메시지 전송
패킷 생성
HTTP
- 모든 것이 HTTP
- 클라이언트 서버 구조
- Stateful, Stateless
- 비 연결성
- HTTP 메시지
모든 것이 HTTP
HTTP 메시지에 모든것을 전송
- HTML, TEXT
- IMAGE, 음성, 영상, 파일
- JSON, XML (API)
- 거의 모든 형태의 데이터 전송 가능
- 서버 간에 데이터를 주고 받을 때도 대부분 HTTP 사용
- ::지금은 HTTP 시대::
기반 프로토콜
- TCP : HTTP/1.1, HTTP/2
- UDP : HTTP/3
- 현재 HTTP/1.1 주로 사용
* 2,3 도 점점 증가
HTTP 특징
- 클라이언트 서버 구조
- 무상태 프로토콜(스테이스리스), 비연결성
- HTTP 메시지
- 단순함, 확장 가능
클라이언트 서버 구조
- Request Response 구조
- 클라이언트는 서버에 요청을 보내고, 응답을 대기
- 서버가 요청에 대한 결과를 만들어서 응답
무상태 프로토콜
스테이스리스
- 서버가 클라이언트의 상태를 보존 X
- 장점 : 서버 확장성 높음(스케일 아웃)
- 단점 : 클라이언트가 추가 데이터 전송
Stateful, Stateless 차이
- 상태 유지 : 중간에 다른 점원으로 바뀌면 안됨
- 무상태 : 중간에 다른 점원으로 바뀌어도 됨
갑자기 고객이 증가해도 점원을 대거 투입 가능
갑자기 클라이언트 요청이 증가해도 서버를 대거 투입
- 무상태는 응답 서버를 쉽게 바뀔 수 있다. -> 무한한 서버 증설 가능
상태 유지 - Stateful
항상 같은 서버가 유지되어야 한다.
중간에 서버 장애 나면?
무상태 - Stateless
아무 서버나 호출 가능
중간에 서버 장애 나면?
Stateless 실무 한계
- 모든 것을 무상태로 설계할 수 있는 경우도 있고 없는 경우도 있다.
- 무상태
* 예) 로그인이 필요 없는 단순 서비스 소개 화면
- 상태 유지
* 예) 로그인
- 로그인한 사용자의 경우 로그인 했다는 상태를 서버에 유지
- 일반적으로 브라우저 쿠키와 서버 세션 등을 사용해서 상태 유지
- 상태 유지는 최소한만 사용
비연결성
연결을 유지하는 모델
연결을 유지하지 않는 모델
비 연결성
- HTTP는 기본이 연결을 유지하지 않는 모델
- 일반적으로 초 단위의 이하의 빠른 속도로 응답
- 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 요청은 수십개 이하로 매우 작음
* 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지 않음
- 서버 자원을 매우 효율적으로 사용 가능
한계와 극복
- TCP/IP 연결을 새로 맺어야 함 - 3 way handshake 시간 추가
- 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바 스크립트, css, 추가 이미지 등 수 많은 자원이 함께 다운로드
- 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
- HTTP/2, HTTP/3에서 더 많은 최적화
HTTP 초기 연결
HTTP 지속 연결
스테이스리스를 기억하자
서버 개발자들이 어려워하는 업무
- 정말 같은 시간에 딱 맞춰 발생하는 대용량 트래픽
예) 선착순 이벤트, 명절 KTX 예약, 학과 수업 등록
예) 저녁 6:00 선착순 100명 치킨 할인 이벤트 -> 수만명 동시 요청
HTTP 메시지
시작 라인
요청 메시지
-
start-line = request-line / status-line
-
request-line = method SP(공백) request
-
HTTP 메서드 (GET : 조회)
-
요청 대상 (/search?q=hello&hl=ko)
-
HTTP Version
요청 메시지 - HTTP 메서드
- 종류 : GET, POST, PUT, DELETE …
- 서버가 수행해야 할 동작 지정
GET : 리소스 조회
POST : 요청 내역 처리
요청 메시지 - 요청 대상
요청 메시지 - HTTP 버전
응답 메시지
-
start-line = request-line / status-line
-
status-line = HTTP-version SP status-code SP reason-phrase CRLF
-
HTTP 버전
-
HTTP 상태 코드 : 요청 성공, 실패를 나타냄
200 : 성공
400 : 클라이언트 요청 오류
* 500 : 서버 내부 오류
-
이유 문고 : 사람이 이해할 수 있는 짧은 상태 코드 설명 글
HTTP 헤더
- header -field = field-name “:” OWS field-value OWS
- field-name은 대소문자 구문 없음
용도
- HTTP 전송에 필요한 모든 부가 정보
- 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보 …
- 표준 헤더가 너무 많음
- 필요시 임의의 헤더 추가 기능
* helloworld: hihi
HTTP 메시지 바디
용도
- 실제 전송할 데이터
- HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능
단순함 확장 가능
- HTTP는 단순
- 크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술
HTTP 정리
- HTTP 메시지에 모든 것을 전송
- HTTP 역사 HTTP/1.1을 기준으로 학습
- 클라이언트 서버 구조
- 무상테 프로토콜 (스테이스리스)
- HTTP 메시지
- 단순함, 확장 가능
- 지금은 HTTP 시대
HTTP API를 만들어보자
요구사항
회원 정보 관리 API 를 만들자
- 회원 목록 조회
- 회원 조회
- 회원 등록
- 회원 수정
- 회원 삭제
::가장 중요한 것은 리소스 식별::
API URI 고민
URI
- 리소스의 의미는 뭘까?
회원을 등록하고 수정하고 조회하는게 리소스가 아니다
예) 미네랄을 캐라 -> 미네랄이 리소스
* 회원이라는 개념 자체가 바로 리소스
- 리소스를 어떻게 식별하는게 좋을까?
회원을 등록하고 수정하고 조회하는 것을 모두 배제
회원이라는 리소스만 식별하면 된다. -> 회원 리소스를 URI에 매핑
- 회원 목록 조회
* /members
- 회원 조회
* /members/{id}
- 회원 등록
* /members/{id}
- 회원 수정
* /members/{id}
- 회원 삭제
* /members/{id}
- 참고 : 계층 구조상 상위를 컬렉션으로 보고 복수단어 사용 권장(member -> members)
어떻게 구분?
리소스와 행위를 분리
가장 중요한 것은 리소스를 식별하는 것
- URI는 리소스만 식별!
- 리소스와 해당 리소스를 대상으로 하는 행위를 분리
리소스 : 회원
행위 : 조회, 등록, 삭제, 변경
- 리소스는 명사, 행위는 동사 (미네랄을 캐라)
- 행위(메소드)는 어떻게 구분?
HTTP 메서드 - GET, POST
HTTP 메서드 종류
주요 메서드
- GET : 리소스 조회
- POST : 요청 데이터 처리, 주로 등록에 사용
- PUT : 리소스를 대체, 해당 리소스가 없으면 생성
- PATCH : 리소스 부분 변경
- DELETE : 리소스 삭제
기타 메서드
- HEAD : GET과 동일하지만 메시지 부분을 제외하고, 상태 줄과 헤더만 반환
- OPTIONS : 대상 리소스에 대한 통신 가능 옵션을 설명
- CONNECT
- TRACE
#GET
GET
- 리소스 조회
- 서버에 전달하고 싶은 데이터는 query를 통해서 전달
- 메시지 바디를 사용해서 데이터를 전달할 수 있지만, 지원하지 않는 곳이 많아서 권장하지 않음
-
리소스 조회 1 - 메시지 전달
-
리소스 조회 2 - 서버 도착
-
리소스 조회 3 - 응답 데이터
#POST
POST
- 요청 데이터 처리
- 메시지 바디를 통해 서버로 요청 데이터 전달
- 서버는 요청 데이터를 처리
* 메시지 바디를 통해 들어온 데이터를 처리하는 모든 기능 수행
- 주로 전달된 데이터로 신규 리소스 등록, 프로세스 처리에 사용
-
리소스 등록 1- 메시지 전달
-
리소스 등록 2 - 신규 리소스 생성
-
리소스 등록 3 - 응답 데이터
요청 데이터를 어떻게 처리한다는 뜻일까?
예시
- 스펙 : POST 메서드는 대상 리소스가 리소스의 고유 한 의미 체계에 따라 요청에 포함된 표현을 처리하도록 요청 합니다.
- 예를 들어 POST는 다음과 같은 기능에 사용
HTML 양식에 입력된 필드와 같은 데이터 블록을 데이터 처리 프로세스에 제공
예)HTML FORM에 입력한 정보로 회원 가입, 주문 등에서 사용
게시판, 뉴스 그룹, 메일링 리스트, 블로그 또는 유사한 기사 그룹에 메시지 게시
예) 게시판 글쓰기, 댓글 달기
서버가 아직 식별하지 않은 새 리소스 생성
예) 신규 주문 생성
기존 자원에 데이터 추가
예) 한 문서 끝에 내용 추가하기
- 정리 : 이 리소스 URI에 POST 요청이 오면 요청 데이터를 어떻게 처리할지 리소스마다 따로 정해야 함 ->
정해진 것이 없음
POST 정리
- 1. 새 리소스 생성(등록)
* 서버가 아직 식별하지 않은 새 리소스 생성
- 2. 요청 데이터 처리
단순히 데이터를 생성하거나, 변경하는 것을 넘어서 프로세스를 처리해야 하는 경우
예) 주문에서 결제완료 -> 배달 시작 -> 배달 완료 처럼 단순히 값 변경을 넘어 프로세스의 상태가 변경되는 경우
POST의 결과로 새로운 리소스가 생성되지 않을 수도 있음
예) POST/orders/{orderID}/start-delivery (컨트롤 URI)
- 3. 다른 메서드로 처리하기 애매한 경우
예) JSON으로 조회 데이터를 넘겨야 하는데, GET 메서드를 사용하기 어려운 경우
애매하면 POST
#PUT
PUT
- 리소스를 대체
리소스가 있으면 대체
리소스가 없으면 생성
* 쉽게 이야기해서 덮어버림
- 중요 ! 클라이언트가 리소스를 식별
클라이언트가 리소스 위치를 알고 URI 지정
POST와 차이점
리소스가 있는 경우
리소스가 없는 경우
리소스 완전히 대체
#PATCH
PATCH
#DELETE
DELETE
HTTP 메서드의 속성
- 안전
호출해도 리소스를 변경하지 않는다
GET, HEAD
- 멱등
한번 호출하든 두번 호출하든 100번 호출하든 결과가 같다.
GET, PUT, DELETE
* POST : 멱등 아님, 두번 호출하면 같은 결제 중복 발생
- 캐시 가능
응답 결과 리소스를 캐시해서 사용해도 되는가?
GET, HEAD, POST, PATCH 캐시가능
실제로는 GET, HEAD 정도만 캐시로 사용
POST, PATCH는 본문 내용까지 캐시 키로 고려해야 하는데, 구현이 쉽지 않음
HTTP 메서드 활용
- 클라이언트에서 서버로 데이터 전송
- HTTP API 설계 예시
클라이언트에서 서버로 데이터 전송
데이터 전달 방식 2가지
- 쿼리 파라미터를 통한 데이터 전송
GET
주로 정렬 필터(검색어)
- 메시지 바디를 통한 데이터 전송
POST, PUT, PATCH
회원 가입, 상품 주문, 리소스 등록, 리소스 변경
4가지 상황
- 정적 데이터 조회
- 동적 데이터 조회
- HTML Form 을 통한 데이터 전송
- HTTP API 를 통한 데이터 전송
정적 데이터 조회
쿼리 파라미터 미사용
정리
- 이미지, 정적 텍스트 문서
- 조회는 GET 사용
- 정적 데이터는 일반적으로 쿼리 파라미터 없이 리소스 경로로 단순하게 조회 가능
동적 데이터 조회
쿼리 파라미터 사용
정리
- 주로 검색, 게시판 목록에서 정렬 필터(검색어)
- 조회 조건을 줄여주는 필터, 조회 결과를 정렬하는 정렬 조건에 주로 사용
- 조회는 GET 사용
- GET 은 쿼리 파라미터 사용해서 데이터를 전달
POST 전송 - 저장
GET 전송 - 저장
GET 전송 - 조회
정리
-
HTML Form submit시 POST 전송
* 예) 회원 가입, 상품 주문, 데이터 변경
…
-
참고 : HTMl Form 전송은 GET, POST만 지원
HTTP API 데이터 전송
정리
- 서버 to 서버
* 백엔드 시스템 통신
- 앱 클라이언트
* 아이폰, 안드로이드
- 웹 클라이언트
HTML에서 Form 전송 대신 자바 스크립트를 통한 통신에 사용(AJAX)
예) React, Vue.js 같은 웹 클라이언트와 API 통신
- POST, PUT, PATCH : 메시지 바디를 통해 데이터 전송
- GET : 조회, 쿼리 파라미터로 데이터 전달
- Content-Type : application/json을 주로 사용(사실상 표준)
* TEXT, XML, JSON 등등
HTTP API 설계 예시
- HTTP API - 컬렉션
* POST 기반 등록
* 예)회원 관리 API 제공
- HTTP API - 스토어
* PUT 기반 등록
* 예) 정적 컨텐츠 관리, 원격 파일 관리
- HTML FORM 사용
웹 페이지 회원 관리
GET, POST 만 지원
API 설계 - POST 기반 등록
- 회원 목록 /members -> GET
- 회원 등록 /members -> POST
- 회원 조회 /members/{id} -> GET
- 회원 수정 /members/{id} -> PATCH, PUT, POST
- 회원 삭제 /members/{id} -> DELETE
회원 관리 시스템
POST - 신규 자원 등록 특징
- 클라이언트는 등록될 리소스의 URI를 모른다.
회원 등록 /members -> POST
POST /members
- 서버가 새로 등록된 리소스 URI를 생성해준다.
HTTP/1.1 201 Created
Location : /members/100
- 컬렉션
서버가 관리하는 리소스 디렉토리
서버가 리소스의 URI를 생성하고 관리
* 여기서 컬렉션은 /members
파일 관리 시스템
API 설계 - PUT 기반 등록
- 파일 목록 /files -> GET
- 파일 조회 /files/{filename} -> GET
- 파일 등록 /files/{filename} -> PUT
- 파일 삭제 /files/{filename} -> DELETE
- 파일 대량 등록 /files -> POST
PUT - 신규 자원 등록 특징
- 클라이언트가 리소스 URI를 알고 있어야 한다.
파일 등록 /files/{filename} -> PUT
PUT /files/star.jpg
- 클라이언트가 직접 리소스의 URI 지정
- 스토어
클라이언트가 관리하는 리소스 저장소
클라이언트가 리소스의 URI를 알고 관리
* 여기서 스토어는 /files
-
HTML FORM은 GET,POST만 지원
-
AJAX 같은 기술을 사용해서 해결 가능 -> 회원 API 참고
-
여기서는 순수 HTML, HTML FORM 이야기
-
GET, POST만 지원하므로 제약이 있음
-
회원 목록
* /members -> GET
-
회원 등록 폼
* /members/new -> GET
-
회원 등록
* /members/new, /members -> POST
-
회원 조회
* /members/{id} -> GET
-
회원 수정 폼
* /members/{id}/edit -> GET
-
회원 수정
* /members/{id}/edit, /members/{id} -> POST
-
회원 삭제
* /members/{id}/delete -> POST
정리
- HTTP API - 컬렉션 (주로 사용)
POST 기반 등록
서버가 리소스 URI 결정
- HTTP API - 스토어
PUT 기반 등록
클라이언트가 리소스 URI 결정
- HTML FORM 사용
순수 HTML + HTML form 사용
GET, POST만 지원
HTTP 상태코드
상태 코드
클라이언트가 보낸 요청의 처리 상태를 응답에서 알려주는 기능
- 2xx (Successful) : 요청 정상 처리
- 3xx (Redirection) : 요청을 완료하려면 추가 행동이 필요
- 4xx (Client Error) : 클라이언트 오류, 잘못된 문법 등으로 서버가 요청을 수행할 수 없음
- 5xx (Server Error) : 서버 오류, 서버가 정상 요청을 처리하지 못함
만약 모르는 상태 코드가 나타나면?
- 클라이언트가 인식할 수 없는 상태 코드를 서버가 반환하면?
- 클라이언트는 상위 상태 코드로 해석해서 처리
- 미래에 새로운 상태 코드가 추가되어도 클라이언트를 변경하지 않아도 됨
예)
299 -> Successful
451 : Client Error
502 : Server Error
2xx (Successful)
클라이언트의 요청을 성공적으로 처리
- 200 OK
- 201 Created
- 202 Accepted
- 204 No Content
200 OK
요청 성공
200 Created
요청 성공해서 새로운 리소스가 생성됨
202 Accepted
요청이 접수되지 않거나 처리 안 됨
- 배치 처리 같은 곳에서 사용
- 예) 요청 접수 후 1시간 뒤에 배치 프로세스가 요청을 처리
204 No Content
서버가 요청을 성공적으로 수행했지만, 응답 페이로드 본문에 보낼 데이터가 없음
- 예) 웹 문서 편집기에서 save 버튼
- save 버튼의 결과로 아무 내용이 없어도 된다.
- save 버튼을 눌러도 같은 화면을 유지해야 한다.
- 결과 내용이 없어도 204 메시지(2xx)만으로 성공 인식 가능
3xx (Redirection)
요청을 완료하기 위해 유저 에이전트의 추가 조치 필요
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
리다이렉션 이해
자동 리다이렉트 흐름
종류
- 영구 리다이렉션 - 특정 리소스의 URI가 영구적으로 이동
예) /members -> /users
예) /event -> /new-event
- 일시 리다이렉션 - 일시적인 변경
주문 완료 후 주문 내역 화면으로 이동
PRG : POST/Redirect/Get
- 특수 다이렉션
* 결과 대신 캐시를 사용
영구 리다이렉션
301, 308
- 리소스의 URI가 영구적으로 이동
- 원래의 URL를 사용X, 검색 엔진 등에서도 변경 인지
- 301 Moved Permanently
* 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음
- 308 Permanent Redirect
301과 기능은 같음
리다이렉트시 요청 메서드와 본문 유지(처음 POST를 보내면 리다이렉트도 POST 유지)
301
308
일시적인 리다이렉션
302, 307, 303
- 리소스의 URI가 일시적으로 변경
- 따라서 검색 엔진 등에서 URL을 변경하면 안됨
- 302 Found
* 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음
- 307 Temporary Redirect
302와 기능 같음
리다이렉트시 요청 메서드와 본문 유지
- 303 See Other
302와 기능 같음
리다이렉트시 요청 메서드가 GET으로 변경
PRG : Post/Redirect/Get
일시적인 리다이렉션 - 예시
-
POST로 주문 후에 웹 브라우저를 새로고침하면?
-
새로고침은 다시 요청
-
중복 주문이 될 수 있다.
-
POST로 주문 후에 새로 고침으로 인한 중복 방지
-
POST로 주문 후에 주문 결과 화면을 GET 메서드로 리다이렉트
-
새로고침해도 결과 화면을 GET으로 조회
-
중복 주문 대신에 결고 화면만 GET으로 다시 요청
-
PRG 이후 리다이렉트
URL이 이미 POST -> GET 으로 리다이렉트 됨
새로고침 해도 GET으로 결과 화면만 조회
뭘 써야 할까
- 302 Found -> GET 으로 변할 수 있음
- 307 Temporary Redirect -> 메서드가 변하면 안됨
- 303 See Other -> 메서드가 GET으로 변경
::307, 303 을 권장하지만 이미 많은 애플리케이션 라이브러리 들이 302를 기본값으로 사용::
기타 리다이렉션
304
- 304 Not Modified
캐시를 목적으로 사용
클라이언트에게 리소스가 수정되지 않았음을 알려줌. 클라이언트는 로컬 PC에 저장된 캐시 재사용
304 응답은 응답에 메시지 바디를 포함하면 안된다.
조건부 GET, HEAD 요청시 사용
4xx (Client Error)
클라이언트 오류
- 클라이언트의 요청에 잘못된 문법 등으로 서버가 요청을 수행할 수 없음
- 오류의 원인이 클라이언트
- 클라이언트가 이미 잘못된 요청, 데이터를 보내고 있기 때문에 재시도가 실패
400 Bad Request
클라이언트가 잘못된 요청을 해서 서버가 요청을 처리할 수 없음
- 요청 구문, 메시지 등등 오류
- 클라이언트는 요청 내용을 다시 검토하고, 보내야함
- 예) 요청 파라미터가 잘못되거나, API 스펙이 맞지 않을 때
401 Unauthorized
클라이언트가 해당 리소스에 대한 인증이 필요
- 인증 되지 않음
- 401 오류 발생시 응답에 WWW-Authenticate 헤더와 함께 인증 방법 설명
- 참고
인증(Authentication) : 본인이 누군지 확인 (로그인)
인가 (Authorization) : 권한부여
* 오류 메시지가 Unauthorized이지만 인증 되지 않음
403 Forbidden
서버가 요청을 이해했지만 승인을 거부
- 주로 인증 자격 증명 있지만, 접근 권한 불충분
404 Not Found
요청 리소스 찾을 수 없음
5xx (Server Error)
서버 오류
500 Internal Server Error
서버 문제로 오류 발생, 애매하면 500 오류
- 서버 내부 문제로 오류 발생
- 애매하면 500 오류
503 Service Unavailable
서비스 이용 불가
- 서버가 일시적인 과부하 또는 예정된 작업으로 잠시 요청을 처리할 수 없음
HTTP 헤더1
일반 헤더
HTTP 헤더
용도
- HTTP 전송에 필요한 모든 부가 정보
- 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보…
- 표준 헤더가 너무 많음
- 필요시 임의의 헤더 추가 가능
HTTP BODY
- 메시지 본문을 통해 표현 데이터 전달
- 메시지 분문 = 페이로드
- 표현은 요청이나 응답에서 전달할 실제 데이터
- 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
* 데이터 유형, 데이터 길이, 압축 정보 등등
- 참고 : 표현 헤더는 표현 메타 데이터와 페이로드 메시지를 구분해야 하지만 여기서는 생략
헤더
표현
-
Content-Type : 표현 데이터의 형식
-
Content-Encoding : 표현 데이터의 압축 방식
-
Content-Language : 표현 데이터의 자연 언어
-
Content-Length : 표현 데이터의 길이
-
표현 헤더는 전송, 응답 둘다 사용
Content-Type
표현 데이터의 형식 설명
- 미디어 타입, 문자 인코딩
- 예)
* text/html; charset=utf-8
Content-Encoding
표현 데이터 인코딩
- 표현 데이터를 압축하기 위해 사용
- 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
- 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
- 예)
gzip
deflate
* identity
Content-Language
Content-Length
협상 (콘텐츠 네고시에이션)
클라이언트가 선호하는 표현 요정
-
Accept : 클라이언트가 선호하는 미디어 타입 전달
-
Accept-Charset : 클라이언트가 선호하는 문자 인코딩
-
Accept-Encoding : 클라이언트가 선호하는 압축 인코딩
-
Accept-Language : 클라이언트가 선호하는 자연 언어
-
협상 헤더는 요청시에만 사용
전송 방식
설명
단순 전송
압축 전송
분할 전송
범위 전송
일반 정보
- Form : 유저 에이전트의 이메일 정보
일반적으로 잘 사용 않음
검색 엔진 같은 곳에서 주로 사용
* 요청에서 사용
- Referer : 이전 웹 페이지 주소 (자주 씀)
현재 요청된 웹페이지의 이전 주소
A -> B로 이동하는 경우 B를 요청할 때 Referer : A를 포함해서 요청
Referer를 사용해서 유입 경로 분석 가능
요청에서 사용
- User-Agent : 유저 에이전트 애플리케이션 정보
클라이언트의 애플리케이션 정보 (웹 브라우저 정보, 등등)
통계 정보
* 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
- Server : 요청을 처리하는 ORIGIN 서버의 소프트웨어 정보
Server : Apache/2.2.22(Debian)
server : nginx
* 응답에서 사용
- Date : 메시지가 발생한 날짜와 시간
* Date : Tue, 15 Nov 1994
특별한 정보
-
Host : 요청한 호스트 정보(도메인)
요청에서 사용
필수
하나의 서버가 여러 도메인을 처리해야 할때
하나의 IP 주소에 여러 도메인이 적용되어 있을 때
-
Location : 페이지 리다이렉션
웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동
응답코드 3xx에서 설명
201 (Created) : Location 값은 요청에 의해 생성된 리소스 URI
3xx (Redirection) : Location 값은 요청을 자동으로 리디렉션하기 위한 대상 리소스를 가르킴
-
Allow : 허용 가능한 HTTP 메서드
405(Method Not Allowed) 에서 응답에 포함해야함
Allow : GET, HEAD, PUT
-
Retry-After : 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
503 (Service Unavailable) : 서비스가 언제까지 불능인지 알려줄 수 있음
Retry-After : Fri, 31 Dec 1999 23:59:59 GMT(날짜 표기)
* Retry-After : 120 (초단위 표기)
인증
- Authorization : 클라이언트 인증 정보를 서버에 전달
* Authorization : Basic xxxxxxxxxxxxxxx
- WWW-Authenticate : 리소스 접근시 필요한 인증 방법 정의
리소스 접근시 필요한 인증 방법 정의
401 Unauthorized 응답과 함께 사용
* WWW-Authenticate: Newauth realm=“apps”, type=1, title=“Login to \”apps\””, Basic realm=“simple”
쿠키
- Set-Cookie : 서버에서 클라이언트로 쿠키 전달(응답)
- Cookie : 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달
쿠키 미사용
처음 welcome 페이지 접근
로그인
로그인 이후 welcome 페이지 접근
Stateless
- HTTP는 무상태 프로토콜이다
- 클라이언트와 서버가 요청과 응답을 주고 받으면 연결이 끊어진다ㅏ.
- 클라이언트가 다시 요청하면 서버는 이전 요청을 기억하지 못한다.
- 클라이언트와 서버는 서로 상태를 유지하지 않는다.
대안 - 모든 요청에 사용자 정보 포함
- 모든 요청에 사용자 정보가 포함되도록 개발 해야함
- 브라우저를 완전히 종료하고 다시 열면?
쿠키
로그인
로그인 이후 welcome 페이지 접근
모든 요청에 쿠키 정보 자동 포함
쿠키
- 예) set-cookie: sessionId=abcde1234; expires=Sat, 26-Dec-2020 00:00:00 GMT; path=/; domain=.google.com; Secure
- 사용처
사용자 로그인 세션 관리
광고 정보 트래킹
- 쿠키 정보는 항상 서버에 전송됨
네트워크 트래픽 추가 유발
최소한의 정보만 사용(세션 id, 인증 토큰)
* 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 참고
- 주의!
* 보안에 민감한 데이터는 저장하면 안됨
쿠키 - 생명주기
Expires, max-age
- Set-Cookie : expires=Sat, 26-Dec-2020 04:39:21 GMT
* 만료일이 되면 쿠키 삭제
- Set-Cookie: max-age=3600(3600초)
* 0이나 음수를 지정하면 쿠키 삭제
- 세션 쿠키 : 만료 날짜를 생략하면 브라우저 종료시까지만 유지
- 영속 쿠키 : 만료 날짜를 입력하면 해당 날짜까지 유지
쿠키-도메인
Domain
- 예) domain=example.org
- 명시 : 명시한 문서 기준 도메인 + 서브 도메인 포함
domain=example.org를 지정해서 쿠키 생성
example.org는 물론이고
* dev.example.org도 쿠키 접근
- 생략 : 현재 문서 기준 도메인만 적용
example.org에서 쿠키를 생성하고 domain 지정을 생략
example.org 에서만 쿠키 접근
* dev.example.org는 쿠키 미접근
쿠키 - 경로
Path
- 예) path = /home
- 이 경로를 포함한 하위 경로 페이지만 쿠키 접근
- 일반적으로 path=/ 루트로 지정
- 예)
path=/home 지정
/home -> rㅏ능
/home/level1 -> 가능
/hello -> 불가능
쿠키 - 보안
Secure, HttpOnly, SameSite
- Secure
쿠키는 http, https를 구분하지 않고 전송
Secure를 적용하면 https인 경우에만 전송
- HttpOnly
XSS 공격 방지
자바스크립트에서 접근 불가
* HTTP 전송에만 사용
- SameSite
XSRF 공격 방지
요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송
캐시 기본동작
캐시 없을 때
- 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운로드 받아야 한다.
- 인터넷 네트워크는 매우 느리고 비싸다.
- 브라우저 로딩 속도가 느리다.
- 느린 사용자 경험
캐시 적용
- 캐시 덕분에 캐시 가능 시간동안 네트워크를 사용하지 않아도 된다.
- 비싼 네트워크 사용량을 줄일 수 있다.
- 브라우저 로딩 속도 매우 빠름
- 빠른 사용자 경험
캐시 적용
캐시 시간 초과
- 캐시 유효 시간이 초과하면, 서버를 통해 데이터를 다시 조회하고, 캐시 갱신
- 이때 다시 네트워크 다운로드 발생
- 받아야 하는 내용은 달라지지 않은데 서버에 다시 받아야 한다 -> 낭비
검증 헤더와 조건부 요청 1
캐시 시간 초과
-
캐시 유효 시간이 초과해서 서버에 다시 요청하면 두가지 상황 나온다
서버에서 기존 데이터 변경
서버에서 기존 데이터 변경 X
-
캐시 만료후에도 서버에서 데이터 변경 하지 않음
-
생각해보면 데이터를 전송하는 대신에 저장해 두었던 캐시를 재사용 할 수 있다.
-
단 클라이언트의 데이터와 서버의 데이터가 같다는 사실 확인 필요
정리
- 캐시 유효 시간이 초과해도, 서버의 데이터가 갱신되지 않으면
- 304 Not Modified + 헤더 메타 정보만 응답 (바디 X)
- 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
- 클라이언트는 캐시에 저장되어 있는 데이터 재활용
- 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드
- 매우 실용적인 해결책
검증 헤더와 조건부 요청 2
- 검증 헤더
* 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
- 조건부 요청 헤더
* 검증 헤더로 조건에 따른 분기
캐시와 조건부 요청 헤더
캐시 제어 헤더
-
Cache-Control : 캐시 제어
Cache-Control : max-age
캐시 유효 시간, 초 단위
Cache-Control : no-cache
데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용
Cache-Control : no-store
데이터에 민감한 정보가 있으므로 저장하면 안됨
* 메모리 사용하고 최대한 빨리 삭제
-
Pragma : 캐시 제어 (하위 호환)
Pragma : no-cache
지금은 잘 사용 안함
-
Expires : 캐시 만료일 지정
expires : Mon, 01 Jan 1990 00:00:00 GMT
캐시 만료일을 정확한 날짜로 지정
HTTP 1.0 부터 사용
지금은 더 유연한 Cache-Control : max-age 권장
* Cache-Control : max-age와 함께 사용하면 Expires는 무시
검증 헤더와 조건부 헤더
- 검증 헤더
ETag : “v1.0”, ETag : “asid93jkrh2l”
Last-Modified : Thu, 04 Jun 2020 07:19:24 GMT
- 조건부 요청 헤더
If-Match, If-None-Match : ETag 값 사용
If-Modified-Since, If-Unmodified-Since : Last-Modified 값 사용
프록시 캐시
원 서버 직접 접근
origin 서버
프록시 캐시 도입
첫번째 요청
Cache-Control
캐시 지시어
- Cache-Control : public
* 응답이 public 캐시에 저장되어야함
- Cache-Control : private
* 응답이 해당 사용자만을 위한 것임, 기본값
캐시 무효화
Cache-Control
확실한 캐시 무효화 응답
- Cache-Control : no-cache, no-store, must-revalidate
- Pragma: no-cache
* HTTP 1.0 하위 호환
캐시 지시어 - 확실한 캐시 무효화
- Cache-Control : no-cache
데이터는 캐시해도 되지만, 항상 원 서버에 검증*하고 사용
- Cache-Control : no-store
* 데이터에 민감한 정보 있으므로 저장하면 안됨
- Cache-Control : must-revalidate
캐시 만료후 최초 조회시 원서버에 검증해야함
원 서버 접근 실패시 반드시 오류 발생 - 504
* must-revalidate는 캐시 유효 시간이라면 캐시를 사용함
- Pragma : no-cache
* HTTP 1.0 하위 호환
no-cache vs must-revalidate
no-cache 기본 동작
no-cache
must-revalidate