HTTP

HTTP(Hypertext Transfer Protocol): 현대 인터넷의 공용어

웹 서버로부터 대량의 정보(이미지, html페이지, 텍스틑 파일 동영상, 음성파일 등)를 사용자의 pc에 설치된 브라우저로 옮겨준다.

신뢰성 있는 데이터 전송 프로토콜을 사용해서 전송 중 손상이나 꼬이지 않는다.

웹 클라이언트와 서버

  • 웹 서버 = HTTP 서버

  • HTTP 프로토콜로 의사소통

  • 인터넷의 데이터를 저장하고 HTTP 클라이언트가 요청한 데이터를 제공

  • 클라이언트(웹브라우저)는 서버에게 HTTP 객체를 요청, 사용자의 화면에 보여준다.

리소스

웹 리소스란 웹에 콘텐츠를 제공하는 모든 것

미디어 타입

HTTP는 웹에서 전송되는 객체 각각에 MIME 타입이라는 데이터 포맷 라벨을 붙인다.

MIME(Multipurpose Internet Mail Extensions, 다목적 인터넷 메일 확장)은 전자메일 메시지가 오갈 때 격는 문제점을 해결하기 위해 설계되었으나 이메일에서 잘 동작되어 HTTP에서도 채택.

사선(/)으로 구분된 주 타입(primary object type)과 부타입(specific subtype)으로 이루어진 문자열 라벨

  • HTML로 작성된 텍스트 문서 = text/html
  • plain ASCII 텍스트 문서 = text/plain
  • JPEG 이미지 = image/jpeg
    등등

URI

웹 서버는 각자 이름을 갖고 있으며 통합 자원 식별자, URI(uniform resource identifier)라고 불린다. 이를 통해 리소스를 고유하게 식별하고 위치를 지정할 수 있다.

예) '죠의 컴퓨터 가게'의 웹 서버에 있는 이미지 리소스에 대한 URI
http://www.joes-hardware.com/specials/saw-blade.gif

URL

  • 통합 자원 지시자(Uniform resource locator, URL)
  • 톡정 서버의 한 리소스에 대한 구체적 위치
  • 오늘날 대부분의 URI는 URL

표준 포맷

  • 스킴(scheme)이라고 불리며 보통 HTTP 프로토콜(http://)
  • 서버의 인터넷 주소를 제공(예: www.joes-hardware.com)
  • 웹 서버의 리소스(예: /specials/saw-blade.gif)

URN

유니폼 리소스 이름(uniform resource name, URN)

리소스의 위치에 영향을 받지 않는 유일무이한 이름

urn:ietf:rfc:2141

트랜잭션

HTTP 트랜잭션 = 요청 명령(클라이언트 -> 서버) + 응답 결과(서버 -> 클라이언트)

메서드

HTTP는 여러 가지 종류의 요청 명령을 지원하며, 모든 요청 메시지는 한 개의 메서드를 갖는다.

메서드의 종류

  • GET: 서버에서 클라이언트로 지정한 리소스를 보내라
  • PUT: 클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장하라
  • DELETE: 지정한 리소스를 서버에서 삭제하라
  • POST: 클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라
  • HEAD: 지정한 리소스에 대한 응답에서 HTTP 헤더 부분만 보내라

상태 코드

클라이언트에게 요청의 성공 여부를 알려주는 세 자리 숫자가 담긴 상태 코드를 응답 메시지에 함께 보낸다. 각 상태 코드에는 텍스트로 된 사유 구절(reson phrase)도 함께 보낸다.

예) 200 OK, 200 Document attached 등

상태 코드설명
200좋다. 문서가 바르게 반환되었다.
302다시 보내라. 다른 곳에 가서 리소스를 가져가라.
404없음. 리소스를 찾을 수 없다.

메시지

HTTP 메시지는 사람이 읽고 쓰기 쉬운 일반 텍스트(단순한 줄 단위의 문자열)이다.

웹 클라이언트에서 웹 서버로 보내는 요청 메시지와 서버에서 클라이언트로 가는 응답 메시지 두 종류만이 있으며 비슷한 형식을 가진다.

형식

  • 시작줄: 요청은 무었을 해야 하는지, 응답은 무슨일이 일어났는지

  • 헤더: 시작줄 0개 이상의 헤더 필드가 이어진다. 각 헤더는 콜론(:)으로 구분되어 하나의 이름과 하나의 값으로 구성된다. 빈 줄로 끝난다.

  • 본문: 어떤 종류의 데이터든 들어갈 수 있는 메시지 본문이 필요에 따라 온다.

    요청응답
    웹 서버로 데이터를 보냄클라이언트로 데이터를 반환

    문자열이며 시작줄이나 헤더와 달리 임의의 이진 데이터(이미지, 비디오, 오디오 트랙, 응용 소프트 웨어)를 포함할 수 있다.

TCP 커넥션

TCP/IP

어떻게 HTTP 메시지가 어떻게 한 곳에서 다른 곳으로 옮겨질까?

HTTP는 애플리케이션 계층 프로토콜로 네크워크 통신의 세부사항에 대해서는 관여하지 않는다. 대신 TCP/IP 인터넷 통신 프로토콜을 에게 맡긴다.


TCP 특징

  • 오류 없는 데이터 전송
  • 순선에 맞는 전달
  • 조각나지 않는 데이터 스트임

TCP/IP는 TCP 와 IP가 층을 이루는 패킷 교환 네트워크 프로토콜의 집합이다. 각 네트워크와 하드웨어의 특성을 숨기고 서로 신뢰성 있는 의사소통을 하게 해 준다.


HTTP 네트워크 프로토콜 스택

계층설명
HTTP애플리케이션 계층
TCP전송 계층
IP네트워크 계층
네트워크를 위한 링크 인터페이스데이터 링크 계층
물리적인 네트워크 하드웨엉물리계층

접속, IP 주소 그리고 포트번호

클라이언트가 서버에 메시지를 전송할 수 있게 되기 전에, 인터넷 프로토콜(Internet protocol, IP)주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야 한다.

웹의 구성 요소

  • 프락시: 클라이언트와 서버 사이에 위치한 HTTP 중개자
  • 캐시: 많이 찾는 웹페이지를 클라이언트 가까이에 보관하는 HTTP 창고
  • 게이트웨이: 다른 어플리케이션과 연결괸 특별한 웹 서버
  • 터널: 단순히 HTTP 통신을 전달하기만 하는 특별한 프락시
  • 에이전트: 자동화된 HTTP 요청을 만드는 준지능적(semi-intelligent) 웹 클라이언트

프락시

프락시는 클라이언트와 서버 사이에 위치하여, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다(대개 요청을 수정한 뒤에).

  • 보안을 위해 사용
  • 요청과 응답을 필터링

캐시

웹캐시와 캐시 프락시는 자신을 거쳐 가는 문서들 중 자주 찾는 것의 사본을 저장해 두는 특별한 종류의 HTTP 프락시 서버다.

게이트웨이

다른 서버들의 중개자로 동작하는 특별한 서버. HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다. 언제나 스스로가 리소스를 갖고 있는 진짜 서버인 것처럼 요청을 다루기 때문에 클라이언트는 자신이 게이트웨이와 통신하고 있음을 알아채지 못한다.

터널

두 커넥션 사이에서 날(raw) 데이터를 열어보지 않고 그대로 전달해주는 HTTP 애플리케이션이다. 주로 비 HTTP 데이터를 하나 이상의 연결을 통해 그대로 전송해주기 위해 사용된다.

에이전트

사용자 에이전트(혹은 그냥 에이전트)는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램

예) 브라우저, 자동화된 사용자 에이전트(스파이더, 웹로봇)!

0개의 댓글