직역하면 리소스를 식별하는 통합된 방법
URI? URL? URN? 차이가 뭘까?
URI는 로케이터(Locator), 이름(Name) 또는 둘다 추가로 분류될 수 있다.
URI는 리소스(자원)을 식별하는 방법, URI라는 개념 안에 URL, URN이 존재하는 것.
하지만 거의 URL만 사용한다. (URN으로 사실상 리소스 찾기가 힘듦, 그냥 이런게 있다 정도만 알아두자)
URI 단어 뜻
- Uniform : 리소스를 식별하는 통일된 방식
- Resource : 자원, URI로 식별할 수 있는 모든 것(제한 없다)
- Identifier : 다른 항목과 구분하는데 필요한 정보
- URL : Uniform Resource Locator
- URN : Uniform Resource Name
URL, URN 단어 뜻
- URL - Locator : 리소스가 있는 위치를 지정
- URN - Name : 리소스에 이름을 부여
- 위치는 변할 수 있지만, 이름은 변하지 않는다.
- urn:isbn:89607777331 (어떤 책의 isbn URN)
- URN 이름만으로 실제 리소스를 찾을 수 있는 방법이 보편화 되지 않았다.
- 따라서 앞으로 URI를 URL과 같은 의미로 이야기 할 것
URL 전체 문법
• scheme://[userinfo@]host[:port][/path][?query][#fragment]
• https://www.google.com:443/search?q=hello&hl=ko
- 프로토콜 : https
- 호스트면 : www.google.com
- 포트번호 : 443
- 패스 : /search
- 쿼리 파라미터 : q=hello&hl=ko
scheme
- 주로 프로토콜 사용
- 프로토콜 : 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙
- http는 80포트, https는 443포트를 주로 사용, 포트는 생략 가능
- https는 http에 보안 추가 (HTTP Secure)
userinfo
- URL에 사용자 정보를 포함해서 인증해야할 때 사용
- 거의 사용하지 않는다.
host
- 호스트명
- 도메인명 또는 IP주소를 직접 사용가능
PORT
- 포트 (PORT)
- 접속 포트
- 일반적으로 생략, 생략시 http는 80, https는 443
path
- 리소스 경로(path), 계층적 구조
- 예)
- /home/file1.jpg
- /members
- /members/100, /items/iphone12
query
- key=value 형태
- ?로 시작, &로 추가 가능, ?keyA=valueA&keyB=valueB
- query parameter, query string 등으로 불림, 웹서버에 제공하는 파라미터, 문자형태(숫자 적어도 다 문자로 넘어간다)
fragment
- fragment
- html 내부 북마크 등에 사용
- 서버에 전송하는 정보 아니다.
- 잘 사용하진 않음
웹 브라우저 요청 흐름
- 위와 같은 요청을 보낼 때 요청의 흐름을 알아보자
- 웹브라우저는 먼저 DNS 서버를 조회해서 IP주소를 알아낸다.
- 포트는 생략가능하므로 IP와 PORT정보를 찾아내었다.
- HTTP 요청 메시지를 생성한다.
- HTTP 요청 메시지는 위와같은 생김새이다.
- 브라우저가 생성한 HTTP 메시지를 SOCKET 라이브러리를 통해서 OS에 전달한다.
- 먼저 위에서 찾은 IP와 PORT정보를 가지고 TCP/IP의 3way handshaking을 통해 서버와 가상회선 연결한다.
- 그리고 해당 데이터(HTTP 메시지)를 전달한다.
- HTTP메시지에 IP와 PORT정보가 들어있는 패킷을 씌워서 (캡슐화) TCP/IP 패킷을 생성한다.
- 해당 패킷을 인터넷 망으로 던진다.
- 전송 데이터는 웹 브라우저가 만든 HTTP 메시지이다.
- 생성된 패킷을 인터넷 망을 통해 전달한다.
- 요청 패킷이 서버에 도착하면, 서버에서는 해당 패킷을 역캡슐화를 통해 HTTP 메시지를 꺼낸다.
- 해당 HTTP 메시지를 해석해서 요청을 처리한다.
- 해당 요청에 대해 아래와 같은 HTTP응답 메시지를 생성한다.
- 서버도 같은 방식으로 응답 패킷을 생성하고 클라이언트에 인터넷 망을 통해 전달한다.
- 웹 브라우저는 수신한 응답 패킷을 역캡슐화해서 HTTP 응답 메시지를 꺼내고, 해당 메시지에 있는 HTML을 렌더링해서 보여준다.
해당 게시글은 김영한님의 <모든 개발자를 위한 HTTP 웹 기본지식> 인프런 강의를 듣고 정리한 내용입니다.