네트워크

수민·2023년 1월 5일
0

code

목록 보기
34/47

[그림] 네트워크는 OSI 7계층 또는, TCP/IP 4계층으로 구분한다.

이번 유닛에서는 컴퓨터를 이용하다 보면 흔히 접할 수 있는 IP, 캐시가 무엇을 뜻하는지 살펴보고, 이를 네트워크 통신과 관련하여 더욱 깊이 탐구합니다. 더불어 네트워크 흐름을 이해하기 위해서는 웹 통신을 가능하게 한 HTTP 통신의 흐름을 파악하는 것이 중요합니다. 위 그림에서 볼 수 있듯이, HTTP 통신은 애플리케이션 계층에 속해 있습니다. HTTP 통신을 깊이 이해하기 위해서는, TCP와 UDP 같이 보다 낮은 레벨의 프로토콜도 학습해야 합니다. 이를 위해 IP를 시작으로 TCP/UDP 그리고 HTTP까지 이르는 전체 통신 흐름을 살펴봅시다.

네트워크의 시작

인터넷이 대중화되면서 네트워크는 컴퓨터 기술에서 빼놓을 수 없는 분야가 되었습니다. 우리는 언제 어디서나 인터넷에 접속하여 필요한 정보를 찾고 사람들과 연락을 주고받을 수 있습니다. 이러한 네트워크는 어디서부터 시작된 걸까요?

지금 우리가 사용하는 인터넷 프로토콜, 즉 IP 기반의 네트워크는 미 국방성에서 1969년 진행했던 아르파넷(ARPANET) 프로젝트에서 시작되었습니다. 이 프로젝트는 당시 냉전시대에서 핵전쟁을 대비하기 위한 통신망 구축을 위해 추진되었습니다. 이때 기존에 사용되었던 회선교환 방식이 아닌 패킷교환 방식으로 네트워크를 구축하게 되는데 이를 토대로 현재의 인터넷 통신 방식의 기반이 세워졌습니다. 그럼 패킷교환 이전에 사용되었던 회선교환 방식은 어떻게 통신을 했을까요?

회선교환 방식

패킷교환 방식은 기존에 전화에서 사용했던 회선교환 방식의 단점을 보완한 방식인데요. 그럼 회선교환 방식은 어떻게 연결을 했을까요? 옛 모습을 배경으로 하는 영화 혹은 드라마에서 아래와 같은 장면을 보신 적 있나요? 이 사진의 여성분이 회선교환 중간에서 발신자와 수신자를 연결해주는 전화교환원, 즉 오퍼레이터입니다.

회선교환 방식은 발신자와 수신자 사이에 데이터를 전송할 전용선을 미리 할당하고 둘을 연결합니다. (우리가 전화하는 방식을 떠올려보세요.) 그래서 내가 연결하고 싶은 상대가 다른 상대와 연결중이라면, 상대방은 이미 다른 상대와의 전용선과 연결되어 있기 때문에 그 연결이 끊어지고 나서야 상대방과 연결할 수 있습니다. 또한 특정 회선이 끊어지는 경우에는 처음부터 다시 연결을 성립해야합니다. 다음의 예를 통해 회선교환 방식에서 생길 수 있는 비효율을 살펴봅시다.

패킷교환 방식

회선이 사용 중이더라도 마냥 기다리지 않아도 되는 방법이 있을까요? 아르파넷 프로젝트에서는 이 문제를 해결하기 위하여 패킷교환 방식의 네트워크를 고안했습니다.

패킷교환 방식은 패킷이라는 단위로 데이터를 잘게 나누어 전송하는 방식입니다. 마치 소포를 보내듯이요! 그래서 각 패킷에는 출발지와 목적지 정보가 있고 이에 따라 패킷이 목적지를 향해 가장 효율적인 방식으로 이동할 수 있습니다. 이를 이용하면 특정 회선이 전용선으로 할당되지 않기 때문에 빠르고 효율적으로 데이터를 전송할 수 있습니다.

그래서 인터넷 프로토콜, 줄여서 IP는 출발지와 목적지의 정보를 IP 주소라는 특정한 숫자값으로 표기하고 패킷단위로 데이터를 전송하게 되었습니다.

IP


잡한 인터넷 망 속 수많은 노드들을 지나 어떻게 클라이언트와 서버가 통신할 수 있을까요?

(여기서 노드는 하나의 서버 컴퓨터를 의미합니다.)

출발지에서 목적지까지 데이터가 무사히 전달되기 위해선 규칙이 필요하지 않을까요?


그래서 흔히 말하는 IP(인터넷 프로토콜) 주소를 컴퓨터에 부여하여 이를 이용해 통신합니다.

IP는 지정한 IP 주소(IP Address)에 패킷(Packet)이라는 통신 단위로 데이터 전달을 합니다.


IP 패킷에서 패킷은 pack과 bucket이 합쳐진 단어로 소포로 비유할 수 있습니다.

IP 패킷은 이를 데이터 통신에 적용한 것이라고 보면 됩니다.

IP 패킷은 우체국 송장처럼 전송 데이터를 무사히 전송하기 위해 출발지 IP, 목적지 IP와 같은 정보가 포함되어 있습니다.


패킷 단위로 전송을 하면 노드들은 목적지 IP에 도달하기 위해 서로 데이터를 전달합니다.

이를 통해 복잡한 인터넷 망 사이에서도 정확한 목적지로 패킷을 전송할 수 있습니다.

서버에서 무사히 데이터를 전송받는다면 서버도 이에 대한 응답을 돌려줘야 합니다.

서버 역시 IP 패킷을 이용해 클라이언트에 응답을 전달합니다.


정확한 출발지와 목적지를 파악할 수 있다는 점에서 인터넷 프로토콜은 적절한 통신 방법으로 보이지만

IP에도 이와 같은 한계가 존재합니다.

다음 슬라이드에서 자세히 알아봅시다.

첫 번째는 비연결성입니다.

만약 패킷을 받을 대상이 없거나 서비스 불능 상태여도 클라이언트는 서버의 상태를 파악할 방법이 없기 때문에 패킷을 그대로 전송하게 됩니다.

두 번째는 비신뢰성입니다.

중간에 있는 서버가 데이터를 전달하던 중 장애가 생겨 패킷이 중간에 소실되더라도 클라이언트는 이를 파악할 방법이 없습니다.


또한 전달 데이터의 용량이 클 경우 이를 패킷 단위로 나눠 데이터를 전달하게 되는데

이때 패킷들은 중간에 서로 다른 노드를 통해 전달될 수 있습니다.

이렇게 되면 클라이언트가 의도하지 않은 순서로 서버에 패킷이 도착할 수 있습니다.

TCP/UDP

앞서 다룬 IP 패킷에는 이와 같은 한계들이 존재합니다.

네트워크 계층 구조를 통해 이와 같은 한계를 어떻게 보완할 수 있을지 알아봅시다.


네트워크 프로토콜 계층은 다음과 같이 OSI 7계층과 TCP/IP 4 계층으로 나눌 수 있습니다.

IP 프로토콜 보다 더 높은 계층에 TCP 프로토콜이 존재하기 때문에 앞서 다룬 IP 프로토콜의 한계를 보완할 수 있습니다.

  • TCP/IP 4 계층은 OSI 7 계층보다 먼저 개발되었으며 TCP/IP 프로토콜의 계층은 OSI 모델의 계층과 정확하게 일치하지는 않습니다. 실제 네트워크 표준은 업계표준을 따르는 TCP/IP 4 계층에 가깝습니다.


채팅 프로그램에서 메시지를 보낼 때 어떤 일이 일어나는지 자세히 알아봅시다.

먼저 HTTP 메시지가 생성되면 Socket을 통해 전달됩니다.

프로그램이 네트워크에서 데이터를 송수신할 수 있도록, “네트워크 환경에 연결할 수 있게 만들어진 연결부“가 바로 네트워크 소켓(Socket)입니다.

그리고 IP 패킷을 생성하기 전 TCP 세그먼트를 생성합니다.

이렇게 생성된 TCP/IP 패킷은 LAN 카드와 같은 물리적 계층을 지나기 위해 이더넷 프레임 워크에 포함되어 서버로 전송됩니다.


TCP/IP 패킷에 대해 자세히 살펴봅시다.

TCP 세그먼트에는 IP 패킷의 출발지 IP와 목적지 IP 정보를 보완할 수 있는 출발지 PORT, 목적지 PORT, 전송 제어, 순서, 검증 정보 등을 포함합니다.

다음에서 각 정보들에 대해 자세히 알아보도록 하겠습니다.


TCP에는 다음 특징이 있습니다.

TCP는 같은 계층에 속한 UDP에 비해 상대적으로 신뢰할 수 있는 프로토콜이며 그 이유는 차차 알아보도록 하겠습니다.


TCP는 장치들 사이에 논리적인 접속을 성립하기 위하여 3 way handshake를 사용하는 연결지향형 프로토콜입니다.

연결 방식은 다음과 같습니다.

먼저 클라이언트는 서버에 접속을 요청하는 SYN 패킷을 보냅니다.

또한 TCP는 데이터 전송이 성공적으로 이루어진다면 이에 대한 응답을 돌려주기 때문에 IP 패킷의 한계인 비연결성을 보완할 수 있습니다.


만약 패킷이 순서대로 도착하지 않는다면 TCP 세그먼트에 있는 정보를 토대로 다시 패킷 전송을 요청할 수 있습니다.

이를 통해 IP 패킷의 한계인 비신뢰성(순서를 보장하지 않음)을 보완할 수 있습니다.


UDP는 IP에 PORT, 체크섬 필드 정보만 추가된 단순한 프로토콜입니다.

앞서 TCP 특징과 비교해 보면 신뢰성은 낮지만 3 way handshake 방식을 사용하지 않기 때문에 TCP와 비교해 빠른 속도를 보장합니다.

HTTP3는 UDP를 사용하며 이미 여러 기능이 구현된 TCP보다는 하얀 도화지처럼 커스터마이징이 가능하다는 장점이 있습니다.

OSI 7계층 모델

해당 계층 모델은 ISO(International Organization for Standardization)라고 하는 국제표준화기구에서 1984년에 제정한 표준 규격입니다. 왜 네트워크에 대한 표준 규격을 정해야만 했을까요?

지금은 상상하기 어렵지만 같은 회사에서 만든 컴퓨터끼리만 통신이 가능했던 시절이 있었습니다. 따라서 다른 회사의 시스템이라도 네트워크 유형에 관계없이 상호 통신이 가능한 규약, 즉 프로토콜(Protocol)이 필요했습니다. 그래서 ISO에서는 제조사에 상관없이 공통으로 사용할 수 있는 네트워크 표준 규격을 정의했습니다.

OSI 7계층 모델은 네트워크를 이루고 있는 구성요소들을 7단계로 나누고, 각 계층의 표준을 정하였습니다. OSI 7계층 모델의 목적은 표준화를 통하여 포트, 프로토콜의 호환 문제를 해결하고, 네트워크 시스템에서 일어나는 일을 해당 계층 모델을 이용해 쉽게 설명할 수 있습니다. 또한 네트워크 관리자가 문제가 발생 했을 때 이것이 물리적인 문제인지, 응용 프로그램과 관련이 있는지 등 원인이 어디에 있는지 범위를 좁혀 문제를 쉽게 파악할 수 있습니다. 즉 사이트에 접속되지 않는다고 해서 무작정 컴퓨터를 껐다 키는 일을 피할 수 있습니다.

[그림] OSI 7계층 모델
각 컴퓨터간 데이터를 전송할 때 컴퓨터 내부에서는 여러가지 일을 합니다. 해당 모델은 하드웨어 및 소프트웨어가 수행하는 기능에 따라 이를 7개의 계층(또는 레이어라고도 부릅니다.)으로 구분하였습니다.

각 계층은 다음과 같이 구분됩니다.

1계층 - 물리 계층: OSI 모델의 맨 밑에 있는 계층으로서, 시스템 간의 물리적인 연결과 전기 신호를 변환 및 제어하는 계층입니다. 주로 물리적 연결과 관련된 정보를 정의합니다. 주로 전기 신호를 전달하는데 초점을 두고, 들어온 전기 신호를 그대로 잘 전달하는 것이 목적입니다.
e.g. 디지털 또는 아날로그로 신호 변경
2계층 - 데이터링크 계층: 네트워크 기기 간의 데이터 전송 및 물리주소(e.g. MAC 주소)를 결정하는 계층입니다. 물리 계층에서 들어온 전기 신호를 모아 알아 볼 수 있는 데이터 형태로 처리 합니다. 이 계층에서는 주소 정보를 정의하고 출발지와 도착지 주소를 확인한 후, 데이터 처리를 수행합니다.
e.g. 브리지 및 스위치, MAC 주소
3계층 - 네트워크 계층: OSI 7 계층에서 가장 복잡한 계층 중 하나로서 실제 네트워크 간에 데이터 라우팅을 담당합니다. 이때 라우팅이란 어떤 네트워크 안에서 통신 데이터를 짜여진 알고리즘에 의해 최대한 빠르게 보낼 최적의 경로를 선택하는 과정을 라우팅이라고 합니다.
e.g. IP 패킷 전송
4계층 - 전송 계층: 컴퓨터간 신뢰성 있는 데이터를 서로 주고받을 수 있도록 하는 서비스를 제공하는 계층입니다. 하위 계층에서 신호와 데이터를 올바른 위치로 보내고 신호를 만드는데 집중했다면, 전송 계층에서는 해당 데이터들이 실제로 정상적으로 보내지는지 확인하는 역할을 합니다. 네트워크 계층에서 사용되는 패킷은 유실되거나 순서가 바뀌는 경우가 있는 데, 이를 바로 잡아주는 역할도 담당합니다.
e.g. TCP/UDP 연결
5계층 - 세션 계층: 세션 연결의 설정과 해제, 세션 메시지 전송 등의 기능을 수행하는 계층입니다. 즉, 컴퓨터간의 통신 방식에 대해 결정하는 계층이라고 할 수 있습니다. 쉽게 말해, 양 끝 단의 프로세스가 연결을 성립하도록 도와주고, 작업을 마친 후에는 연결을 끊는 역할을 합니다.
6계층 - 표현 계층: 응용 계층으로 전달하거나 전달받는 데이터를 인코딩 또는 디코딩하는 계층입니다. 일종의 번역기 같은 역할을 수행하는 계층이라고 볼 수 있습니다.
e.g. 문자 코드, 압축, 암호화 등의 데이터 변환
7계층 - 응용 계층: 최종적으로 사용자와의 인터페이스를 제공하는 계층으로 사용자가 실행하는 응용 프로그램(e.g. Google Chrome)들이 해당 계층에 속합니다.
e.g. 이메일 및 파일 전송, 웹 사이트 조회

데이터 캡슐화

[그림] OSI 7계층 모델의 데이터 송수신
OSI 7계층 모델은 송신 측의 7계층과 수신 측의 7계층을 통해 데이터를 주고 받습니다. 각 계층은 독립적이므로 데이터가 전달되는 동안에 다른 계층의 영향을 받지 않습니다.

데이터를 전송하는 쪽은 데이터를 보내기 위해서 상위 계층에서 하위 계층으로 데이터를 전달합니다. 이때 데이터를 상대방에게 보낼 때 각 계층에서 필요한 정보를 데이터에 추가하는데 이 정보를 헤더(데이터링크 계층에서는 트레일러)라고 합니다. 그리고 이렇게 헤더를 붙여나가는 것을 캡슐화라고 합니다.

마지막 물리 계층에 도달하며 송신 측의 데이터링크 계층에서 만들어진 데이터가 전기 신호로 변환되어 수신 측에 전송됩니다.

데이터를 받는 쪽은 하위 계층에서 상위 계층으로 각 계층을 통해 전달된 데이터를 받게됩니다. 이때 상위 계층으로 데이터를 전달하며 각 계층에서 헤더(데이터링크 계층에서는 트레일러)를 제거해 나가는 것을 역캡슐화라고 합니다. 역캡슐화를 거쳐 마지막 응용 계층에 도달하면 드디어 전달하고자 했던 원본 데이터만 남게 됩니다.

[그림] OSI 7계층 모델과 TCP/IP 4계층 모델
TCP/IP 4계층 모델은 OSI 모델을 기반으로 실무적으로 이용할 수 있도록 현실에 맞춰 단순화된 모델입니다. 쉽게 말해 OSI 7계층 이론을 실제 사용하는, 즉 실용성에 기반을 둔 현대의 인터넷 표준이 TCP/IP 4계층이라고 할 수 있습니다.

TCP/IP 4계층 모델은 그림과 같이 응용 계층, 전송 계층, 인터넷 계층, 네트워크 접속 계층으로 이루어져 있습니다. 각 계층에 대해 자세히 알아보겠습니다.

4계층: 어플리케이션 계층: OSI 계층의 세션 계층, 표현 계층, 응용 계층에 해당하며 TCP/UDP 기반의 응용 프로그램을 구현할 때 사용합니다.
e.g. FTP, HTTP, SSH
3계층: 전송 계층: OSI 계층의 전송 계층에 해당하며 통신 노드간의 연결을 제어하고, 신뢰성 있는 데이터 전송을 담당합니다.
e.g. TCP/UDP
2계층: 인터넷 계층: OSI 계층의 네트워크 계층에 해당하며 통신 노드 간의 IP 패킷을 전송하는 기능 및 라우팅을 담당합니다.
e.g. IP, ARP, RARP
1계층: 네트워크 인터페이스 계층: OSI 계층의 물리 계층과 데이터 링크 계층에 해당하며 물리적인 주소로 MAC을 사용합니다.
e.g. LAN, 패킷망 등에 사용됨

응용 계층

앞서 살펴봤듯이 응용 계층은 네트워크 모델의 최상위 계층으로 최종적으로 사용자와의 인터페이스를 제공하는 계층입니다. 쉽게 말해 사용자가 웹 서핑을 할 때에는 웹 브라우저를 사용하고 메일을 주고 받을 때는 Outlook과 같은 메일 프로그램을 사용하는 것을 예시로 들 수 있습니다. 이렇게 응용 계층은 이메일, 파일 전송, 웹 사이트 조회 등 어플리케이션에 대한 서비스를 사용자에게 제공하는 계층입니다.
앞서 살펴봤듯이 응용 계층은 네트워크 모델의 최상위 계층으로 최종적으로 사용자와의 인터페이스를 제공하는 계층입니다. 쉽게 말해 사용자가 웹 서핑을 할 때에는 웹 브라우저를 사용하고 메일을 주고 받을 때는 Outlook과 같은 메일 프로그램을 사용하는 것을 예시로 들 수 있습니다. 이렇게 응용 계층은 이메일, 파일 전송, 웹 사이트 조회 등 어플리케이션에 대한 서비스를 사용자에게 제공하는 계층입니다.

[그림] 응용 계층의 클라이언트와 서버
이때 어플리케이션은 서비스를 요청하는 측(사용자 측)에서 사용하는 어플리케이션과 서비스를 제공하는 측의 어플리케이션으로 분류됩니다. 일반적으로 서비스를 요청하는 측을 클라이언트, 서비스를 제공하는 측을 서버라고 합니다. 웹 브라우저(e.g. Google Chrome)나 메일 프로그램(e.g. Outlook)은 사용자 측에서 사용하는 어플리케이션이니 클라이언트에 속하는 반면, 서비스를 제공하는 측인 서버에는 웹 서버 프로그램과 메일 서버 프로그램 등이 있습니다. 클라이언트와 서버 모두 응용 계층에서 동작합니다.

HTTP

HTTP 역사는 다음과 같습니다.

HTTP/1.1, HTTP/2는 TCP 기반이며 HTTP/3는 UDP 기반 프로토콜입니다.

HTTP의 특징은 다음과 같습니다.

다음 슬라이드에서 자세히 알아보도록 하겠습니다.

클라이언트가 서버에 요청을 보내면 서버는 그에 대한 응답을 보내는 클라이언트 서버 구조로 이루어져 있습니다.

HTTP에서는 서버가 클라이언트의 상태를 보존하지 않는 무상태 프로토콜입니다.

다음 장에서 사례를 통해 무상태에 대해 알아봅시다.

카페에서 아메리카노 2잔을 신용카드로 결제한다고 가정해 봅시다.

상태가 유지되는 때에는 점원 A가 고객의 주문 상태에 대해 기억하고 있습니다.

만약 중간에 점원 A가 아닌 점원 B가 그대로 고객을 접객한다고 가정해 봅시다.

이 경우 점원 A만 고객의 주문을 기억하고 있기 때문에 상태 정보를 다른 점원 B에게 미리 알려줘야 합니다.

이렇게 점원 A가 고객의 상태를 기억하고 있는 것을 상태를 유지한다고 합니다.

무상태에서는 고객이 자신의 주문을 기억하고 있다면 중간에 다른 점원으로 바뀌어도 주문을 할 수 있습니다.

만약 갑자기 고객이 증가하더라도 무상태에서는 점원을 대거 투입할 수 있습니다.

상태 유지와 무상태는 다음과 같이 정리할 수 있습니다.

앞서 말한 예제처럼 상태 유지가 되어야 하는 프로토콜이라면 클라이언트 A의 요청을 서버 1이 기억하고 있기 때문에 항상 서버 1이 응답해야합니다.

만약 서버 1이 장애가 난다면 유지되던 상태 정보가 다 날아가 버리므로 처음부터 다시 서버에 요청해야 합니다.

무상태 프로토콜이라면 클라이언트 A가 요청할 때 이미 필요한 데이터를 다 담아서 보내기 때문에 아무 서버나 호출해도 됩니다.

만약 서버 1에 장애가 생기더라도 다른 서버에서 응답을 전달하면 되기 때문에 클라이언트는 다시 요청할 필요가 없습니다.

무상태는 응답 서버를 쉽게 바꿀 수 있기 때문에 무한한 서버 증설이 가능합니다.

무상태는 다음과 같은 한계를 가지고 있습니다.

로그인이 필요 없는 단순한 서비스 소개 화면 같은 경우엔 무상태로 설계할 수 있지만

로그인이 필요한 서비스라면 유저의 상태를 유지해야 되기 때문에 브라우저 쿠키, 서버 세션, 토큰 등을 이용해 상태를 유지합니다.

TCP/IP의 경우 기본적으로 연결을 유지합니다.

연결을 유지하는 모델에서는 클라이언트 1, 2는 요청을 보내지 않더라도 계속 연결을 유지해야 합니다.

이러한 경우 연결을 유지하는 서버의 자원이 계속 소모가 됩니다.


s

비연결성을 가지는 HTTP에서는 실제로 요청을 주고받을 때만 연결을 유지하고 응답을 주고 나면 TCP/IP 연결을 끊습니다.

이를 통해 최소한의 자원으로 서버 유지를 가능하게 합니다.

HTTP 1.0 기준으로, HTTP는 연결을 유지하지 않는 모델입니다.

트래픽이 많지 않고, 빠른 응답을 제공할 수 있는 경우, 비연결성의 특징은 효율적으로 작동합니다.

예를 들어, 한 시간 동안 수천 명이 서비스를 사용해도, 실제 서버에서는 초당 처리 요청 개수는 수십 개에 불과합니다.

하지만 트래픽이 많고, 큰 규모의 서비스를 운영할 때에는 비연결성은 한계를 보입니다.

비연결성은 다음과 같은 한계를 가집니다.

웹 브라우저로 사이트를 요청하면 HTML뿐만 아니라 자바스크립트, css, 추가 이미지 등 수많은 자원이 함께 다운로드됩니다.

해당 자원들을 각각 보낼 때마다 연결 끊고 다시 연결하고를 반복하는 것은 비효율적이기 때문에

지금은 HTTP 지속 연결(Persistent Connections)로 문제를 해결합니다.


s

HTTP 초기에는 각각의 자원을 다운로드하기 위해 연결과 종료를 반복해야 했습니다.

profile
헬창목표

0개의 댓글