[모든 개발자를 위한 HTTP 웹 기본 지식] 3. HTTP 기본

0woogie·2023년 6월 26일
0

HTTP 웹 기본 지식

목록 보기
3/8
post-thumbnail

모든 것이 HTTP

HTTP - HyperText Transfer Protocol

  • HTTP는 HTML 문서와 같은 리소스들을 가져올 수 있도록 해주는 프로토콜이다.
  • HTTP는 웹에서 이루어지는 모든 데이터 교환의 기초이며, 클라이언트-서버 프로토콜이기도 하다.
  • 지금은 HTML, TEXT 뿐만 아니라 거의 모든 것을 HyperText Transfer Protocol로 전송 가능하다.

HTTP로 전송 가능한 리소스들

  • HTML, TEXT
  • IMAGE, 음성, 영상, 파일
  • JSON, XML (API)
  • 거의 모든 형태의 데이터 전송 가능
  • 서버간에 데이터를 주고 받을 때도 대부분 HTTP 사용
  • 지금은 HTTP 시대!

HTTP 역사

  • HTTP/0.9 (1991) : GET 메서드만 지원, HTTP 헤더 X
  • HTTP/1.0 (1996) : 메서드, 헤더 추가
  • HTTP/1.1 (1997) : 가장 많이 사용되고 개발자들에게 가장 중요한 버전
    - RFC2068 (1997) -> RFC2616 (1999) -> RFC7230~7235 (2014)
  • HTTP/2 (2015) : 성능 개선
  • HTTP/3 (진행중) : TCP 대신에 UDP 사용, 성능 개선

기반 프로토콜

  • TCP: HTTP/1.1, HTTP/2
  • UDP: HTTP/3
  • 현재 HTTP/1.1 주로 사용
    - HTTP/2, HTTP/3도 점점 증가

HTTP 특징

  • 클라이언트 서버 구조
  • 무상태 프로토콜(스테이스리스), 비연결성
  • HTTP 메시지
  • 단순함, 확장 가능

클라이언트 서버 구조

  • Request Response 구조
  • 클라이언트는 서버에 요청을 보내고, 응답을 대기
  • 서버는 요청에 대한 결과를 만들어서 응답
  • 클라이언트와 서버를 분리함으로써 각자 역할에 집중 -> 독립적으로 진화
    - 클라이언트는 복잡한 비즈니스 로직이나 데이터를 다룰 필요 없이 UI와 사용성에만 집중하면 됨
    - 서버는 비즈니스 로직, 데이터 관리, 아키텍처, 트래픽 등에 대해 집중하면 됨

무상태(Stateless) 프로토콜

  • 서버가 클라이언트의 상태를 보존하지 않음
  • 장점: 서버 확장성 높음(스케일 아웃)
  • 단점: 클라이언트가 추가 데이터 전송

상태 유지(Stateful)와 무상태(Stateless) 차이

  • 상태 유지(Stateful)
    - 항상 같은 서버가 유지되어야 한다.
    - 서버가 클라이언트의 이전 상태를 보존하기 때문에 중간에 응답 서버가 바뀌면 안된다.
    - 중간에 서버가 바뀔 때 마다 상태정보를 다른 서버에게 미리 알려줘야한다.
  • 무상태(Stateless)
    - 중간에 다른 서버로 바뀌어도 된다.
    - 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입 할 수 있다.
    - 무상태는 응답 서버를 쉽게 바꿀 수 있다. -> 무한한 서버 증설 가능

무상태(Stateless) 프로토콜 실무 한계

  • 모든 것을 무상태로 설계 할 수 있는 경우도 있고 없는 경우도 있다.
  • 무상태
    - 예) 로그인이 필요 없는 단순한 서비스 소개 화면
  • 상태 유지
    - 예) 로그인
  • 로그인한 사용자의 경우 로그인 했다는 상태를 서버에 유지
  • 일반적으로 브라우저 쿠키와 서버 세션 등을 사용해서 상태 유지
  • 상태 유지는 최소한만 사용하는 것이 좋다.

비연결성(Connectionless)

서버와 클라이언트의 연결을 유지하는 모델

  • 클라이언트가 서버에 요청을 보내면 응답을 받고 난 후에도 계속 서버에 접속된 상태로 남아있게 된다.
  • 이렇게 서버에 접속하는 클라이언트가 많아질수록 연결을 유지하는 서버의 자원이 계속해서 소모되게 된다.

서버와 클라이언트의 연결을 유지하지 않는 모델

  • 클라이언트가 서버에 요청을 보내고 응답을 받게되면 바로 클라이언트와 서버의 연결을 끊어버린다.
  • 따라서 서버는 최소한의 자원만을 사용하게 된다.

HTTP의 비연결성

  • HTTP는 기본이 연결을 유지하지 않는 모델
  • 일반적으로 초 단위 이하의 빠른 속도로 응답
  • 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
    - 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
  • 서버 자원을 매우 효율적으로 사용할 수 있음

비연결성의 한계와 극복

  • TCP/IP 연결을 새로 맺어야 함 -> 3 way handshake 시간 추가됨
  • 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지 등 수 많은 자원이 함께 다운로드 된다.
  • 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
  • HTTP/2, HTTP/3에서 더 많은 최적화가 이루어졌다.

HTTP 지속 연결(Persistent Connections)

  • HTTP에서 TCP/IP 연결을 일정 시간 열어두고 여러 요청을 하는 것
  • 웬만한 리소스들을 다 다운 받기 전까지 연결을 유지하고
    다운로드가 끝난 후 연결을 종료하는 것

Stateless를 기억하자

  • 정말 같은 시간에 딱 맞추어 발생하는 대용량 트래픽
    - 예) 선착순 이벤트, 명절 KTX 예약, 학과 수업 등록 등
  • 최대한 Stateless하게 설계해야 한다.

HTTP 메시지

HTTP 메시지 구조

  • 시작 라인(요청 라인/상태 라인), 헤더, 바디가 있음
  • 요청 메시지도 body 본문을 가질 수 있음

시작 라인 - 요청 메시지

request-line = method SP(공백) request-target SP HTTP-version CRLF(엔터)
예) GET /search?q=hello&hl=ko HTTP/1.1

  • HTTP 메서드 (GET)
    - 종류: GET, POST, PUT, DELETE...
    - 서버가 수행해야 할 동작 지정
    • 예) GET: 리소스 조회, POST: 요청 내역 처리
  • 요청 대상 (/search?q=hello&hl=ko)
    - 절대경로[?쿼리]
    - 절대경로: "/"로 시작하는 경로
  • HTTP 버전 (HTTP/1.1)

시작 라인 - 응답 메시지

status-line = HTTP-version SP status-code SP reason-phrase CRLF
예) HTTP/1.1 200 OK

  • HTTP 버전 (HTTP/1.1)
  • HTTP 상태 코드: 요청 성공, 실패를 나타냄
    - 200: 성공
    - 400: 클라이언트 요청 오류
    - 500: 서버 내부 오류
  • 이유 문구: 사람이 이해할 수 있는 짧은 상태 코드 설명 글

HTTP 헤더

header-field = field-name ":" OWS field-value OWS (OWS: 띄어쓰기 허용)
(field-name은 대소문자 구분 없음)

  • HTTP 전송에 필요한 모든 부가정보
    - 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보...
  • 표준 헤더가 너무 많음
  • 필요시 임의의 헤더 추가 가능 -> 약속한 클라이언트와 서버만 이해 가능

HTTP 메시지 바디

  • 실제 전송할 데이터
  • HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능

단순함 확장 가능

  • HTTP는 단순하다. 스펙도 읽어볼만한 편
  • HTTP 메시지도 매우 단순한 편
  • 크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술

Reference

https://www.inflearn.com/course/http-%EC%9B%B9-%EB%84%A4%ED%8A%B8%EC%9B%8C%ED%81%AC

profile
정리하고 다듬기 위한 공간

0개의 댓글