지금 우리가 사용하는 인터넷 프로토콜, 즉 IP 기반의 네트워크는 미 국방성에서 1969년 진행했던 아르파넷(ARPANET) 프로젝트에서 시작되었음.
이 프로젝트는 당시 냉전시대에서 핵전쟁을 대비하기 위한 통신망 구축을 위해 추진되었음.
이때 기존에 사용되었던 회선교환 방식이 아닌 패킷교환 방식으로 네트워크를 구축하게 되는데 이를 토대로 현재의 인터넷 통신 방식의 기반이 세워졌음.
그럼 패킷교환 이전에 사용되었던 회선교환 방식은 어떻게 통신을 했을까?
회선교환 방식
회선교환 방식은 발신자와 수신자 사이에 데이터를 전송할 전용선을 미리 할당하고 둘을 연결함. 그래서 내가 연결하고 싶은 상대가 다른 상대와 연결중이라면, 상대방은 이미 다른 상대와의 전용선과 연결되어 있기 때문에 그 연결이 끊어지고 나서야 상대방과 연결할 수 있음.
또한 특정 회선이 끊어지는 경우에는 처음부터 다시 연결을 성립해야함.
패킷교환 방식
패킷교환 방식은 패킷이라는 단위로 데이터를 잘게 나누어 전송하는 방식임.
그래서 각 패킷에는 출발지와 목적지 정보가 있고 이에 따라 패킷이 목적지를 향해 가장 효율적인 방식으로 이동할 수 있음.
이를 이용하면 특정 회선이 전용선으로 할당되지 않기 때문에 빠르고 효율적으로 데이터를 전송할 수 있음.
그래서 인터넷 프로토콜, 줄여서 IP는 출발지와 목적지의 정보를 IP 주소라는 특정한 숫자값으로 표기하고 패킷단위로 데이터를 전송하게 되었음.
IP 주소 부여
IP는 지정한 IP 주소(IP Address)에 패킷(Packet)이라는 통신 단위로 데이터 전달을 함.
IP 패킷 정보
IP 패킷에서 패킷은 pack과 bucket이 합쳐진 단어로 소포로 비유할 수 있음.
IP 패킷은 이를 데이터 통신에 적용한 것이라고 보면 됨.
IP 패킷은 우체국 송장처럼 전송 데이터를 무사히 전송하기 위해 출발지 IP, 목적지 IP와 같은 정보가 포함되어 있음.
클라이언트 패킷 전달
패킷 단위로 전송을 하면 노드들은 목적지 IP에 도달하기 위해 서로 데이터를 전달함.
이를 통해 복잡한 인터넷 망 사이에서도 정확한 목적지로 패킷을 전송할 수 있음.
서버 패킷 전달
서버에서 무사히 데이터를 전송받는다면 서버도 이에 대한 응답을 돌려줘야 함.
서버 역시 IP 패킷을 이용해 클라이언트에 응답을 전달함.
IP 프로토콜 한계
네트워크 프로토콜 계층은 다음과 같이 OSI 7계층과 TCP/IP 4 계층으로 나눌 수 있음.
IP 프로토콜 보다 더 높은 계층에 TCP 프로토콜이 존재하기 때문에 앞서 다룬 IP 프로토콜의 한계를 보완할 수 있음.
( TCP/IP 4 계층은 OSI 7 계층보다 먼저 개발되었으며 TCP/IP 프로토콜의 계층은 OSI 모델의 계층과 정확하게 일치하지는 않음. 실제 네트워크 표준은 업계표준을 따르는 TCP/IP 4 계층에 가까움. )
채팅 프로그램에서 메시지를 보낼 때 어떤 일이 일어나는지 자세히 알아보자.
먼저 HTTP 메시지가 생성되면 Socket을 통해 전달됨.
프로그램이 네트워크에서 데이터를 송수신할 수 있도록, “네트워크 환경에 연결할 수 있게 만들어진 연결부“가 바로 네트워크 소켓(Socket)임.
그리고 IP 패킷을 생성하기 전 TCP 세그먼트를 생성함.
이렇게 생성된 TCP/IP 패킷은 LAN 카드와 같은 물리적 계층을 지나기 위해 이더넷 프레임 워크에 포함되어 서버로 전송됨.
TCP / IP 패킷 정보
TCP/IP 패킷에 대해 자세히 살펴보자.
TCP 세그먼트에는 IP 패킷의 출발지 IP와 목적지 IP 정보를 보완할 수 있는 출발지 PORT, 목적지 PORT, 전송 제어, 순서, 검증 정보 등을 포함함.
전송 제어 프로토콜(Transmission Control Protocol)
TCP는 같은 계층에 속한 UDP에 비해 상대적으로 신뢰할 수 있는 프로토콜.
TCP는 장치들 사이에 논리적인 접속을 성립하기 위하여 3 way handshake를 사용하는 연결지향형 프로토콜.
연결 방식은 다음과 같음.
먼저 클라이언트는 서버에 접속을 요청하는 SYN 패킷을 보냄.
서버는 SYN요청을 받고 클라이언트에게 요청을 수락한다는 ACK 와 SYN가 설정된 패킷을 발송하고 클라이언트가 다시 ACK으로 응답하기를 기다림.
클라이언트가 서버에게 ACK을 보내면 이 이후로부터 연결이 성립되며 데이터를 전송할 수 있음.
만약 서버가 꺼져있다면 클라이언트가 SYN을 보내고 서버에서 응답이 없기 때문에 데이터를 보내지 않음.
현재에는 최적화가 이루어져 3번 ACK을 보낼때 데이터를 함께 보내기도 함.
사용자 데이터그램 프로토콜(User Datagram Protocol)
UDP는 IP 프로토콜에 PORT, 체크섬 필드 정보만 추가된 단순한 프로토콜.
앞서 TCP 특징과 비교해 보면 신뢰성은 낮지만 3 way handshake 방식을 사용하지 않기 때문에 TCP와 비교해 빠른 속도를 보장함.
HTTP3는 UDP를 사용하며 이미 여러 기능이 구현된 TCP보다는 하얀 도화지처럼 커스터마이징이 가능하다는 장점이 있음.
아직 TCP와 UDP의 차이가 잘 와닿지 않는다면, 좋은 기능이 다 들어있는 무거운 라이브러리와 필요한 기능만 들어있는 가벼운 라이브러리로 비교할 수 있음.
네트워크 계층 모델은 크게 OSI 7계층 모델과 TCP/IP 4계층으로 나뉨.
1계층 - 물리 계층:
OSI 모델의 맨 밑에 있는 계층으로서, 시스템 간의 물리적인 연결과 전기 신호를 변환 및 제어하는 계층.
주로 물리적 연결과 관련된 정보를 정의함.
주로 전기 신호를 전달하는데 초점을 두고, 들어온 전기 신호를 그대로 잘 전달하는 것이 목적임.
2계층 - 데이터링크 계층:
네트워크 기기 간의 데이터 전송 및 물리주소(e.g. MAC 주소)를 결정하는 계층.
물리 계층에서 들어온 전기 신호를 모아 알아 볼 수 있는 데이터 형태로 처리 함.
이 계층에서는 주소 정보를 정의하고 출발지와 도착지 주소를 확인한 후, 데이터 처리를 수행함.
3계층 - 네트워크 계층:
OSI 7 계층에서 가장 복잡한 계층 중 하나로서 실제 네트워크 간에 데이터 라우팅을 담당.
이때 라우팅이란 어떤 네트워크 안에서 통신 데이터를 짜여진 알고리즘에 의해 최대한 빠르게 보낼 최적의 경로를 선택하는 과정을 라우팅이라고 함.
4계층 - 전송 계층:
컴퓨터간 신뢰성 있는 데이터를 서로 주고받을 수 있도록 하는 서비스를 제공하는 계층.
하위 계층에서 신호와 데이터를 올바른 위치로 보내고 신호를 만드는데 집중했다면, 전송 계층에서는 해당 데이터들이 실제로 정상적으로 보내지는지 확인하는 역할을 함.
네트워크 계층에서 사용되는 패킷은 유실되거나 순서가 바뀌는 경우가 있는 데, 이를 바로 잡아주는 역할도 담당함.
5계층 - 세션 계층:
세션 연결의 설정과 해제, 세션 메시지 전송 등의 기능을 수행하는 계층.
즉, 컴퓨터간의 통신 방식에 대해 결정하는 계층이라고 할 수 있음.
쉽게 말해, 양 끝 단의 프로세스가 연결을 성립하도록 도와주고, 작업을 마친 후에는 연결을 끊는 역할을 함.
6계층 - 표현 계층:
응용 계층으로 전달하거나 전달받는 데이터를 인코딩 또는 디코딩하는 계층.
일종의 번역기 같은 역할을 수행하는 계층이라고 볼 수 있음.
7계층 - 응용 계층:
최종적으로 사용자와의 인터페이스를 제공하는 계층으로 사용자가 실행하는 응용 프로그램(e.g. Google Chrome)들이 해당 계층에 속함.
OSI 7계층 모델은 송신 측의 7계층과 수신 측의 7계층을 통해 데이터를 주고 받음.
각 계층은 독립적이므로 데이터가 전달되는 동안에 다른 계층의 영향을 받지 않음.
데이터를 전송하는 쪽은 데이터를 보내기 위해서 상위 계층에서 하위 계층으로 데이터를 전달함.
이때 데이터를 상대방에게 보낼 때 각 계층에서 필요한 정보를 데이터에 추가하는데 이 정보를 헤더(데이터링크 계층에서는 트레일러)라고 함.
그리고 이렇게 헤더를 붙여나가는 것을 캡슐화라고 함.
마지막 물리 계층에 도달하며 송신 측의 데이터링크 계층에서 만들어진 데이터가 전기 신호로 변환되어 수신 측에 전송됨.
데이터를 받는 쪽은 하위 계층에서 상위 계층으로 각 계층을 통해 전달된 데이터를 받게됨.
이때 상위 계층으로 데이터를 전달하며 각 계층에서 헤더(데이터링크 계층에서는 트레일러)를 제거해 나가는 것을 역캡슐화라고 함.
역캡슐화를 거쳐 마지막 응용 계층에 도달하면 드디어 전달하고자 했던 원본 데이터만 남게 됨.
TCP/IP 4계층 모델은 OSI 모델을 기반으로 실무적으로 이용할 수 있도록 현실에 맞춰 단순화된 모델.
쉽게 말해 OSI 7계층 이론을 실제 사용하는, 즉 실용성에 기반을 둔 현대의 인터넷 표준이 TCP/IP 4계층이라고 할 수 있음.
TCP/IP 4계층 모델은 그림과 같이 응용 계층, 전송 계층, 인터넷 계층, 네트워크 접속 계층으로 이루어져 있습니다. 각 계층에 대해 자세히 알아보겠습니다.
4계층: 어플리케이션 계층:
OSI 계층의 세션 계층, 표현 계층, 응용 계층에 해당하며 TCP/UDP 기반의 응용 프로그램을 구현할 때 사용함.
3계층: 전송 계층:
OSI 계층의 전송 계층에 해당하며 통신 노드간의 연결을 제어하고, 신뢰성 있는 데이터 전송을 담당함.
2계층: 인터넷 계층:
OSI 계층의 네트워크 계층에 해당하며 통신 노드 간의 IP 패킷을 전송하는 기능 및 라우팅을 담당함.
1계층: 네트워크 인터페이스 계층:
OSI 계층의 물리 계층과 데이터 링크 계층에 해당하며 물리적인 주소로 MAC을 사용함.
앞서 살펴봤듯이 응용 계층은 네트워크 모델의 최상위 계층으로 최종적으로 사용자와의 인터페이스를 제공하는 계층임.
쉽게 말해 사용자가 웹 서핑을 할 때에는 웹 브라우저를 사용하고 메일을 주고 받을 때는 Outlook과 같은 메일 프로그램을 사용하는 것을 예시로 들 수 있음.
이렇게 응용 계층은 이메일, 파일 전송, 웹 사이트 조회 등 어플리케이션에 대한 서비스를 사용자에게 제공하는 계층임.
클라이언트가 서버에 요청을 보내면 서버는 그에 대한 응답을 보내는 클라이언트 서버 구조로 이루어져있음.
HTTP에서는 서버가 클라이언트의 상태를 보존하지 않는 무상태 프로토콜임.
Connection Oriented vs Connectionless
Connection Oriented - 연결을 유지하는 모델
Connectionless - 연결을 유지하지 않는 모델
HTTP는 기본이 연결을 유지하지 않는 모델
일반적으로 초 단위 이하의 빠른 속도로 응답
1시간동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음 (웹 브라우저에서 계속 연속해서 검색 버튼을 누리지는 않음)
HTTP 1.0 기준으로, HTTP는 연결을 유지하지 않는 모델임.
트래픽이 많지 않고, 빠른 응답을 제공할 수 있는 경우, 비연결성의 특징은 효율적으로 작동함.
하지만 트래픽이 많고, 큰 규모의 서비스를 운영할 때에는 비연결성은 한계를 보임.
형식 : <field-name>
: <field-value>
<field-name>
은 대소문자 구분 없음용도 :HTTP 전송에 필요한 모든 부가정보를 담기 위해 사용함.
요청, 응답 둘 다 사용함
From: 유저 에이전트의 이메일 정보
Referer: 이전 웹 페이지 주소
Referer: A
를 포함해서 요청Referer
를 사용하면 유입경로 수집 가능User-Agent: 유저 에이전트 애플리케이션 정보
Host: 요청한 호스트 정보(도메인)
Origin: 서버로 POST 요청을 보낼 때, 요청을 시작한 주소를 나타냄
Authorization: 인증 토큰(e.g. JWT)을 서버로 보낼 때 사용하는 헤더
Server: 요청을 처리하는 ORIGIN 서버의 소프트웨어 정보
Date: 메시지가 발생한 날짜와 시간
Location: 페이지 리디렉션
Location
헤더가 있으면, Location
위치로 리다이렉트(자동 이동)Location
값은 요청에 의해 생성된 리소스 URILocation
값은 요청을 자동으로 리디렉션하기 위한 대상 리소스를 가리킴Allow: 허용 가능한 HTTP 메서드
Retry-After: 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
: 클라이언트가 선호하는 표현 요청
협상 헤더는 요청시에만 사용
accept : 클라이언트가 선호하는 미디어 타입 전달
accept-Charset : 클라이언트가 선호하는 문자 인코딩
accept-Encoding : 클라이언트가 선호하는 압축 인코딩
accept-Language : 클라이언트가 선호하는 자연 언어
accept-Language
한국어 브라우저에서 특정 웹사이트에 접속했을 때 콘텐츠 협상(Accept-Language)이 적용되지 않았다면
서버는 요청으로 받은 우선순위가 없으므로 기본 언어로 설정된 영어로 응답함.
클라이언트에서 Accept-Language로 KO를 작성해 요청한다면 서버에서는 해당 우선순위 언어를 지원할 수 있기 때문에 한국어로 된 응답을 돌려줌.
accept-Language 협상과 우선 순위
우선순위
: HTTP Secure
HTTPS는 HTTP 요청과 응답으로 오가는 내용을 암호화함.
HTTPS는 HTTP 통신을 하는 소켓 부분에서 SSL 혹은 TLS라는 프로토콜을 사용하여 서버 인증과 데이터 암호화를 진행함.
여기서 SSL이 표준화되며 바뀐 이름이 TLS이므로 같은 사실상 같은 프로토콜임.
HTTPS를 사용하면 브라우저가 서버의 응답과 함께 전달된 인증서를 확인할 수 있음.
이러한 인증서는 서버의 신원을 보증줌.
이때 인증서를 발급해주는 공인된 기관들을 Certificate Authority, CA라고 부름.
서버와 클라이언트간의 CA를 통해 서버를 인증하는 과정과 데이터를 암호화하는 과정을 아우른 프로토콜을 SSL 또는 TLS이라고 말하고, HTTP에 SSL/TLS 프로토콜을 더한 것을 HTTPS라고 함.