HTTP 완벽 가이드 (1장)

문린이·2023년 4월 20일
0

HTTP 완벽 가이드 책을 읽고 정리한 내용입니다.

HTTP 개관

전 세계의 웹브라우저, 서버, 웹 애플리케이션은 모두 HTTP를 통해 서로 대화한다. HTTP는 현대 인터넷의 공용어이다.

HTTP: 인터넷의 멀티미디어 배달부

HTTP는 신뢰성 있는 데이터 전송 프로토콜을 사용하기 때문에, 데이터가 지구 반대편에서 오더라도 전송 중 손상되거나 꼬이지 않음을 보장한다. 개발자는 HTTP 통신이 전송 중 파괴되거나, 중복되거나, 왜곡되는 것을 걱정하지 않아도 되기 때문에 애플리케이션 고유의 기능을 구현하는 데 집중할 수 있다.

웹 클라이언트와 서버

웹 서버 (HTTP 서버)는 인터넷의 데이터를 저장하고, HTTP 클라이언트가 요청한 데이터를 제공한다. 클라이언트는 서버에게 HTTP 요청을 보내고 서버는 요청된 데이터를 HTTP 응답으로 돌려준다. HTTP 클라이언트와 HTTP 서버는 월드 와이드 웹의 기본 요소다.

리소스

웹 서버는 웹 리소스를 관리하고 제공한다. 웹 리소스는 웹 콘텐츠에 원천으로 기본적으로 정적 파일이지만 리소스는 요청에 따라 콘텐츠를 생산하는 프로그램이 될 수도 있다. 즉, 어떤 종류의 콘텐츠 소스도 리소스가 될 수 있다.

미디어 타입

웹 서버는 모든 HTTP 객체 데이터에 MIME 타입을 붙인다. MIME 타입은 사선(/)으로 구분된 주 타입과 부타입으로 이루어진 문자열 라벨이다.

  • HTML로 작성된 텍스트 문서는 text/html 라벨이 붙는다.
  • plain ASCII 텍스트 문서는 text/plain 라벨이 붙는다.
  • JPEG 이미지는 image/jpeg가 붙는다.
  • GIF 이미지는 image/gif가 된다.
  • 애플 퀵타임 동영상은 video/quicktime이 붙는다.
  • MS PPT는 application/vnd.ms-powerpoint가 된다.

URI

서버 리소스 이름은 통합 자원 식별자 (uniform resource identifier), 혹은 URI로 불린다. URI는 인터넷의 우편물 주소 같은 것으로, 정보 리소를 고유하게 식별하고 위치를 지정할 수 있다. URI에는 두 가지가 있는데, URL과 URN이라는 것이다.

URL

통합 자원 지시자 (uniform resource locator)는 리소스 식별자의 가장 흔한 형태다. URL은 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다.

http://www.yahoo.com/images/logo.gif 은 야후 웹 사이트 로고의 URL

  • URL의 첫 번째 부분은 스킴(scheme)이라고 불리는데, 리소스에 접근하기 위해 사용되는 프로토콜을 서술한다. (보통 HTTP 프로토콜(http://)이다.)
  • 두 번째 부분은 서버의 인터넷 주소를 제공한다. (www.yahoo.com)
  • 마지막은 웹 서버의 리소스를 가리킨다. (/images/logo.gif)

오늘날 대부분의 URI는 URL이다.

URN

유니폼 리소스 이름 (uniform resource name)은 콘텐츠를 이루는 한 리소스에 대해, 그 리소스의 위치에 영향 받지 않는 유일무이한 이름 역할을 한다. 이 위치 독립적인 URN은 리소스를 여기저기로 옮기더라도 문제없이 동작한다. 리소스가 그 이름을 변하지 않게 유지하는 한, 여러 종류의 네트워크 접속 프로토콜로 접근해도 문제없다.

트랜잭션

HTTP 트랜잭션은 요청 명령(클라이언트에서 서버로 보내는)과 응답 결과(서버가 클라이언트에게 돌려주는)로 구성되어 있다. 이 상호작용은 HTTP 메시지라고 불리는 정형화된 데이터 덩어리를 이용해 이루어진다.

메서드

HTTP는 HTTP 메서드라고 불리는 여러 가지 종류의 요청 명령을 지원한다. 모든 HTTP 요청 메시지는 한 개의 메서드를 갖는다.

  • GET : 서버에서 클라이언트로 지정한 리소스를 보내라.
  • PUT : 클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장하라.
  • DELETE : 지정한 리소스를 서버에서 삭제하라.
  • POST : 클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라.
  • HEAD : 지정한 리소스에 대한 응답에서, HTTP 헤더 부분만 보내라.

상태 코드

모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다. 상태 코드는 클라이언트에게 요청이 성공했는지 아니면 추가 조치가 필요한지 알려주는 세 자리 숫자다.

  • 200 : 좋다. 문서가 바르게 반환되었다.
  • 302 : 다시 보내라. 다른 곳에 가서 리소를 가져가라.
  • 404 : 없음. 리소스를 찾을 수 없다.

웹페이지는 여러 객체로 이루어질 수 있다

애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다. '웹페이지'는 보통 하나의 리소스가 아닌 리소스의 모음이다.

메시지

HTTP 메시지는 단순한 줄 단위의 문자열이다. 웹 클라이언트에서 웹 서버로 보낸 HTTP 메시지를 요청 메시지라고 부른다. 서버에서 클라이언트로 가는 메시지는 응답 메시지라고 부른다. 그 외에 다른 종류의 HTTP 메시지는 없다.
HTTP 메시지는 다음의 세 부분으로 이루어진다.

  • 시작줄 : 메시지의 첫 줄은 시작줄로, 요청이라면 무엇을 해야 하는지 응답이라면 무슨 일이 일어났는지 나타낸다.
  • 헤더 : 시작줄 다음에는 0개 이상의 헤더 필드가 이어진다. 각 헤더 필드는 쉬운 구문분석을 위해 쌍점(:)으로 구분되어 있는 하나의 이름과 하나의 값으로 구성된다.
  • 본문 : 빈 줄 다음에는 어떤 종류의 데이터든 들어갈 수 있는 메시지 본문이 필요에 따라 올 수 있다. 요청의 본문은 웹 서버로 데이터를 실어 보내며, 응답의 본문은 클라이언트로 데이터를 반환한다.

간단한 메시지의 예

웹 브라우저는 메서드, 로컬 리소스, HTTP 프로토콜 버전 등을 포함해서 HTTP 요청 메시지를 보낸다.
서버는 HTTP 버전, 상태 코드, 사유 구절, 응답 헤더 필드 영역(응답 본문 길이, 문서의 MIME 타입 등), 응답 본문등을 포함해서 HTTP 응답 메시지를 돌려준다.

TCP 커넥션

TCP : Transmission Control Protocol (전송 제어 프로토콜)

TCP/IP

HTTP는 애플리케이션 계층 프로토콜이다. HTTP는 네트워크 통신의 핵심적인 세부사항에 대해서 신경 쓰지 않는다. 대신 대중적이고 신뢰성 있는 인터넷 전송 프로토콜인 TCP/IP에게 맡긴다.

TCP는 다음을 제공한다.

  • 오류 없는 데이터 전송
  • 순서에 맞는 전달 (데이터는 언제나 보낸 순서대로 도착한다.)
  • 조각나지 않는 데이터 스트림 (언제든 어떤 크기로든 보낼 수 있다.)
HTTP 네트워크 프로토콜 스택
HTTP (애플리케이션 계층)
---
TCP (전송 계층)
---
IP (네트워크 계층)
---
네트워크를 위한 링크 인터페이스 (데이터 링크 계층)
---
물리적인 네트워크 하드웨어 (물리 계층)

접속, IP 주소 그리고 포트번호

HTTP 클라이언트가 서버에 메시지를 전송할 수 있게 되기 전에, 인터넷 프로토콜 주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야 한다.

  1. 웹브라우저는 서버의 URL에서 호스트 명을 추출한다.
  2. 웹브라우저는 서버의 호스트 명을 IP로 변환한다.
  3. 웹브라우저는 URL에서 포트번호(있다면)를 추출한다.
  4. 웹브라우저는 웹 서버와 TCP 커넥션을 맺는다.
  5. 웹브라우저는 웹 서버에 HTTP 요청을 보낸다.
  6. 서버는 웹브라우저에 HTTP 응답을 돌려준다.
  7. 커넥션이 닫히면, 웹브라우저는 문서를 보여준다.

텔넷을 이용한 실전 예제

HTTP는 TCP/IP를 사용하고 있으며, 이진 형식이 아닌 문자열 기반이기 때문에, 웹 서버와 직접 대화하는 것도 간단하다. 텔넷 유틸리티는 당신의 키보드를 목적지의 TCP 포트로 연결해주고 출력 TCP 포트로 당신의 화면으로 연결해준다.

프로토콜 버전

  1. HTTP/0.9 : 1991년의 HTTP 프로토타입, 오직 GET 메서드만 지원

  2. HTTP/1.0 : 처음으로 널리 쓰이기 시작한 HTTP 버전, 시각적으로 매력적인 웹페이지와 상호작용하는 폼을 실현

  3. HTTP/1.0+ : keep-alive 커넥션, 가상 호스팅 지원, 프락시 연결 지원을 포함

  4. HTTP/1.1 : HTTP 설계의 구조적 결함 교정, 두드러진 성능 최적화, 잘못된 기능 제거, 더 복잡해진 웹 애플리케이션과 배포를 지원

  5. HTTP/2.0 : HTTP/1.1 성능 문제를 개선하기 위해 구글의 SPDY 프로토콜을 기반으로 설계

웹의 구성요소

프락시

클라이언트와 서버 사이에 위치한 HTTP 중개자
클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다. 프락시는 주로 보안을 위해 사용된다.

캐시

많이 찾는 웹페이지를 클라이언트 가까이에 보관하는 HTTP 창고
웹캐시와 캐시 프락시는 자신을 거쳐 가는 문서들 중 자주 찾는 것의 사본을 저장해 두는, 특별한 종류의 HTTP 프락시 서버다.

게이트웨이

다른 애플리케이션과 연결된 특별한 웹 서버
다른 서버들의 중개자로 동작하는 특별한 서버로 게이트웨이는 주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다. 게이트웨이는 언제나 스스로가 리소스를 갖고 있는 진짜 서버인 것처럼 요청을 다루기 때문에 클라이언트는 자신이 게이트웨이와 통신하고 있음을 알아채지 못한다.

터널

단순히 HTTP 통신을 전달하기만 하는 특별한 프락시
터널은 투 커넥션 사이에서 날(raw) 데이터를 열어보지 않고 그대로 전달해주는 HTTP 애플리케이션이다. HTTP 터널은 주로 비 HTTP 데이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용된다.

에이전트

자동화된 HTTP 요청을 만드는 준지능적 웹클라이언트
사용자 에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램이다. 웹 요청을 만드는 애플리케이션은 뭐든 HTTP 에이전트다.

profile
Software Developer

0개의 댓글