"www.naver.com"을 주소창에 치면 어떻게 될까요?"
URL은 브라우저가 어떤 방법(protocol)로 어떤 서버(domain)의 어떤 경로(path)에 위치한 파일(resource)을 요청하는지를 표현합니다.
예를 들어, https://channy.creation.net/blog/hello-world 라는 URL을 분류해보면,
이제 브라우저는 DNS 조회를 통해 입력된 도메인으로 웹 사이트를 호스팅하는 서버의 IP 주소를 조회해야 합니다. DNS는 도메인 이름과 IP 주소를 매핑해주는 서버입니다. DNS는 복잡하고 매우 빨라야 하기 때문에 DNS 데이터는 웹 브라우저 사이의 서로 다른 계층과 인터넷의 다양한 위치에 임시로 저장되어 있습니다. 웹 브라우저는 DNS 조회에 앞서 브라우저 캐시, OS 캐시, 라우터의 캐시, ISP의 캐시를 확인합니다.
만약 캐시 계층에서 IP 주소를 찾지 못했다면, ISP의 DNS 서버가 인터넷에 있는 여러 DNS 서버를 요청하며 검색될 때까지 DNS 레코드에 대해 더 많은 DNS 서버에 요청하는 재귀적 DNS 조회를 수행합니다.
www.naver.com 에 DNS 쿼리가 오면 [Root DNS]→ [.com DNS] → [.naver DNS] → [.www DNS] 과정을 거쳐 완벽한 주소를 찾아 IP 주소를 매핑합니다.
DNS에서 받은 IP 주소를 기반으로 해당 목적지까지 라우팅 테이블, 서브 네트워크 등을 거쳐 IP 주소를 찾습니다. 라우터는 라우팅 테이블을 통해 해당 요청이 어떤 경로를 통해 가야할지 지정해줍니다. 통신 장치에 있는 라우팅 테이블의 IP를 통해 시작 주소부터 시작하여 다음 IP로 계속해서 이동하는 라우팅 과정을 거쳐 최종 목적지까지 도달합니다.
이렇게 찾은 논리적 주소인 IP를 바탕으로 ARP를 통해 물리적 서버 주소인 MAC 주소를 찾게 됩니다. ARP는 IP 주소로부터 MAC 주소를 구하는 IP와 MAC 주소의 다리 역할을 하는 프로토콜입니다. ARP를 통해 가상 주소인 IP 주소를 실제 주소인 MAC 주소로 변환합니다. 이와 반대로 RARP를 통해 실제 주소를 가상 주소인 IP 주소로 변환하기도 합니다.
ARP Request 브로드캐스트를 보내서 IP 주소에 해당하는 MAC 주소를 찾습니다. 그러고 나서 해당 주소에 맞는 장치가 ARP Reply 유니캐스트를 통해 MAC 주소를 반환하는 과정을 거쳐 IP 주소에 맞는 MAC 주소에 찾게 됩니다.
이러한 과정을 거쳐 해당 URL의 실제 서버에 도달하게 됩니다.
이제 웹 브라우저(클라이언트)와 서버가 통신하기 위해 TCP 연결을 해야합니다. TCP 연결은 3-way-handshaking 과정을 통해 이루어집니다. 과정은 다음과 같습니다.
1. SYN 단계 : 클라이언트는 서버에 클라이언트의 ISN을 담아 SYN을 보냅니다.
2. SYN + ACK 단계 : 서버는 클라이언트의 SYN을 수신하고 서버의 ISN을 보내며 승인번호로 클라이언트의 ISN + 1을 보냅니다.
3. ACK 단계 : 클라이언트는 서버의 ISN + 1한 값인 승인번호를 담아 ACK를 서버에 보냅니다.
(ISN : TCP 기반 통신에서 각각 새 연결에 할당된 고유 시퀀스 번호)
(SYN : synchronization, 연결 요청 플래그)
(ACK : acknowledgement, 응답 플래그)
웹 브라우저가 서버에 연결되면, HTTP(s) 프로토콜에 대한 통신 규칙을 따릅니다. 웹 브라우저가 페이지의 콘텐츠를 요청하기 위해 서버에 HTTP 요청을 전송하는 것으로 시작합니다. 요청 라인에는 클라이언트가 수행하려는 작업을 서버가 결정하는데 사용할 수 있는 정보가 포함되어 있습니다.
_GET /blog/1620 HTTP/1.1_
// 서버에 /blog/1620에서 리소스를 가져오고 HTTP/1.1과 통신하기를 원한다고 알립니다.
요청 헤더는 라우팅하는 데 도움이 되는 추가 정보를 클라이언트에서 전달하고, 어떤 유형의 클라이언트가 요청을 수행하는지 나타냅니다.
Host: channy.creation.net
User-Agent: curl/7.64.1
Accept: */*
보통 GET 요청에 Body는 비어 있습니다. POST, PUT, PATCH와 같이 리소스를 조작하는 요청의 경우 본문에는 생성하거나 업데이트할 클라이언트의 데이터가 포함됩니다. 요청 본문은 서로 다른 형식일 수 있으면 서버는 요청 헤더인 Content-Type을 기반으로 형식을 이해합니다.
웹 서버가 클라이언트로부터 요청을 받으면 서버는 요청을 처리하고 응답을 전송합니다. 서버는 요청을 받고 요청 라인, 헤더 및 본문의 정보를 기반으로 요청 처리 방법을 결정합니다. 응답에는 다음이 포함됩니다.
HTTP/1.1 200 OK
Date: Tue, 25 May 2021 19:40:59 GMT
Server: Apache
X-Frame-Options: SAMEORIGIN
X-Powered-By: Express
Cache-Control: max-age=0, no-cache
Content-Type: text/html; charset=utf-8
Vary: Accept-Encoding
X-Mod-Pagespeed: 1.13.35.2-0
Content-Encoding: br
Keep-Alive: timeout=1, max=100
Connection: Keep-Alive
Transfer-Encoding: chunked
<!DOCTYPE html>
<html lang="ko">
<head>
나머지 HTML 항목
응답의 상태코드는 다음과 같이 분류할 수 있습니다.
웹 브라우저가 서버로부터 응답을 받으면, 응답 헤더를 검사하여 리소스를 렌더링하는 방법에 대한 정보를 확인합니다. 위의 예시에서 응답 헤더인 Content-Type은 HTML 리소스를 받았음을 보여주고 있습니다.
브라우저가 수신한 HTML을 파싱하고 렌더링할 때, HTML 파일이 참조하고 있는 이미지, CSS, Javscript 등 웹 페이지 추가 요소에 대해 GET 요청을 보낼 수 있습니다.
이와 같은 과정을 거쳐 해당 url의 웹 페이지가 브라우저에 나타나게 됩니다.
<참고>