네트워크 계층이 하는 역할이 있는 것처럼 전송 계층도 하는 역할이 있다. 이번에는 전송 계층의 역할에 대해 알아보자.
네트워크 계층을 설명할 때 다른 네트워크로 데이터를 전송하려면 라우터가 필요하고, 라우터의 라우팅 기능을 사용하여 전송할 수 있다고 설명했다.
하지만 라우팅 정보가 잘못될 수도 있고 많은 라우터를 경유하는 도중에 라우터에 문제가 생기거나 패킷이 손상될 수도 있다.
물리 계층, 데이터 링크 계층, 네트워크 계층의 3계층이 있으면 목적지에 데이터를 보낼 수 있다.
하지만 데이터가 손상되거나 유실되더라도 이들 계층에서는 아무것도 해줄 수가 없다.
전송 계층은 목적지에 신뢰할 수 있는 데이터를 전달하기 위해 필요하다.
전송 계층에는 오류를 점검하는 기능이 있다. 오류가 발생하면 데이터를 재전송하도록 요청한다.
네트워크 계층은 목적지까지 데이터를 전달하고, 전송계층의 역할은
1. 데이터가 잘 도착했는지 확인한다.
전송 계층의 특징을 간단히 설명하면 신뢰성/정확성과 효율성으로 구분할 수 있다.
신뢰성/정확성
데이터를 목적지에 문제없이 전달하는 것.
연결형 통신이라고 한다.
상대편과 확인해 가면서 통신하는 방식.
TCP가 사용된다.
효율성
데이터를 빠르고 효율적으로 전달하는 것.
비연결형 통신이라고 한다.
상대편을 확인하지 않고 일방적으로 데이터를 전송하는 방식.
UDP가 사용된다.
정리
전송 계층에서 신뢰할 수 있는 정확한 통신을 제공하는 TCP 프로토콜의 구조에 대해 알아보자.
프로토콜 데이터 단위
물리 계층: 비트
데이터 링크 계층: 이더넷 헤더가 추가된 프레임
네트워크 계층: IP 헤더가 추가된 IP 패킷
전송 계층: TCP 헤더가 추가된 세그먼트
응용 계층: 데이터
연결은 그림과 같이 SYN(연결요청)과 ACK(확인응답)를 사용하여 확립할 수 있다. 신뢰할 수 있는 연결을 하려면 데이터를 전송하기 전에 패킷을 교환하는데, 그림처럼 세 번 확인한다.
SYN 과 ACK를 사용한 연결 확립 과정 (코드 비트)
URG | ACK | PSH | RST | SYN | FIN |
---|---|---|---|---|---|
0 | 0 | 0 | 0 | 1 | 0 |
URG | ACK | PSH | RST | SYN | FIN |
---|---|---|---|---|---|
0 | 1 | 0 | 0 | 1 | 0 |
URG | ACK | PSH | RST | SYN | FIN |
---|---|---|---|---|---|
0 | 1 | 0 | 0 | 0 | 0 |
이처럼 데이터를 보내기 전에 연결을 확립하기 위해 패킷 요청을 세 번 교환하는 것을 3 - way 핸드셰이크라고 한다.
'핸드셰이크'는 사람들이 상대방을 확인하고 악수를 하는 것처럼 데이터 통신에서도 확실하게 데이터가 전송되었는지 확인하면서 이루어지는 통신 수단이다.
데이터를 전송한 후 연결을 끊기 위한 요청을 교환해야 한다.
연결을 끊을 때는 FIN(연결 종료)과 ACK(확인 응답)를 사용한다.
URG | ACK | PSH | RST | SYN | FIN |
---|---|---|---|---|---|
0 | 0 | 0 | 0 | 0 | 1 |
URG | ACK | PSH | RST | SYN | FIN |
---|---|---|---|---|---|
0 | 1 | 0 | 0 | 0 | 0 |
URG | ACK | PSH | RST | SYN | FIN |
---|---|---|---|---|---|
0 | 0 | 0 | 0 | 0 | 1 |
URG | ACK | PSH | RST | SYN | FIN |
---|---|---|---|---|---|
0 | 1 | 0 | 0 | 0 | 0 |
정리
3 - way 핸드셰이크 이후 데이터 전송에 사용되는 TCP 헤더의 일련번호와 확인 응답 번호에 대해 알아봅시다.
TCP는 데이터를 분할해서 보내는데 일련번호는 송신 측에서 수신 측에 '이 데이터가 몇 번째 데이터인지' 알려 주는 역할을 한다. 전송된 데이터에 일련번호를 부여하면 수신자는 원래 데이터의 몇 번째 데이터를 받았는지 알 수 있다. 일련번호는 '순서', '연속된 번호'라는 뜻이 있다.
확인 응답 번호는 수신 측이 몇 번째 데이터를 수신했는지 송신 측에 알려 주는 역할을 한다. 그래서 이 번호는 다음 번호의 데이터를 요청하는데도 사용된다. 예를 들어 10번 데이터를 수신하면 11번 데이터를 송신 측에 요청하는 것. 이것을 확인 응답이라고 한다.
1 ~ 4를 데이터 전송이 완료될 때까지 반복한다.
하지만 데이터가 항상 올바르게 전달되는 것은 아니다. 그러므로 일련번호와 확인 응답 번호를 사용해서 데이터가 손상되거나 유실된 경우에 같은 데이터를 재전송하게 되어있는데, 이를 재전송 제어라고 한다.
TCP의 특징은 세그먼트(데이터) 하나를 보낼 때마다 확인 응답을 한 번 반환하는 통신이다.
이와 같은 통신은 한 번 보낼 때마다 한 번 응답을 반환하는 방식이어서 효율이 낮다.
매번 확인 응답을 기다리는 대신 세그먼트를 연속해서 보내고 난 다음에 확인 응답을 반환하면 효율이 높아진다. 그리고 상대방에게 쌓인 세그먼트는 버퍼(buffer)라는 장소에 일시적으로 보관한다.
하지만 수신 측은 대량으로 데이터가 전송되면 보관하지 못하고 넘쳐 버리는 경우도 있다. 이것을 오버플로(overflow)라고 한다.
오버플로가 발생하지 않도록 버퍼의 한계 크기를 알고 있어야 한다. 그것이 TCP 헤더의 윈도우 크기(window size) 값에 해당한다.
윈도우 크기는 얼마나 많은 용량의 데이터를 저장해 둘 수 있는지를 나타내는 것이다. 즉, 확인 응답을 일일이 하지 않고 연속해서 송수신할 수 있는 데이터 크기이다.
이 윈도우 크기의 초깃값은 그림과 같이 3 - way 핸드 셰이크를 할 때 판단한다. 이 예제에서는 컴퓨터 1의 한계 값이 3000바이트고 컴퓨터 2의 한계값은 2000바이트가 된다.
상대방 버퍼의 한계 값을 알았으니 세그먼트(데이터)를 오버플로되지 않도록 보내면 된다.
세그먼트 하나를 보내고 확인 응답을 반환하는 경우.
확인 응답을 기다리지 않고 세그먼트를 연속해서 보내는 경우. 컴퓨터 1은 첫 번째 세그먼트(데이터)를 전송했지만, 컴퓨터 2에서 그에 대한 확인 응답을 수신하기 전에 두 번째 세그먼트를 보내고 있다.
정리
여기서는 데이터의 목적지가 어떤 프로그램인지 구분하는 역할을 하는 포트 번호에 대해 알아볼 것이다.
이번 강의에서 연결 확립, 재전송 제어, 윈도우 제어에 대해 살펴보았다. 이러한 기능에 의해 TCP는 데이터를 정확하게 전달할 수 있다.
전송 계층에는 이외에도 한 가지 역할이 더 있었다. 전송된 데이터의 목적지가 어떤 애플리케이션(웹 브라우저나 메일 프로그램 등)인지 구분하는 역할이다.
예를 들어 목적지가 어떤 애플리케이션인지 구분하지 못하면 사용자가 홈페이지를 보기 위해 웹 브라우저를 사용하는 데도 메일 프로그램으로 데이터가 전송될 수 있다. 즉, 어느 애플리케이션의 데이터인지 알 수 없기 때문에 일어나는 일이다.
그래서 그렇게 되지 않도록 출발지 포트 번호와 목적지 포트 번호가 필요하다. 이 TCP 헤더에 포트 번호가 있기 때문에 애플리케이션을 구분할 수 있게 된다.
포트 번호는 0 ~ 65535번을 사용할 수 있는데,
0 ~ 1023번 포트는 주요 프로토콜이 사용하도록 예약되어 있다. 이러한 포트를 잘 알려진 포트라고 한다. 1024번은 예약되어 있지만 사용되지 않는 포트고, 1025번 이상은 랜덤 포트라고 해서 클라이언트 측의 송신 포트로 사용된다.
쉽게 비유해보자면 애플리케이션을 아파트 주민 A씨와 B씨, 포트 번호를 각 방의 번호로 바꾸어 보자.
즉 A씨(애플리케이션)에게 짐(데이터)를 보내려면 방 번호(포트 번호)가 '22'번인 방에 보내면 된다.
애플리케이션 | 포트 번호 |
---|---|
SSH | 22 |
SMTP | 25 |
DNS | 53 |
HTTP | 80 |
POP3 | 110 |
HTTPS | 443 |
애플리케이션과 포트 번호.
이처럼 동작하는 애플리케이션은 각각 포트 번호가 있어서 다른 애플리케이션과 서로 구분된다. 데이터를 전송할 때는 상대방의 IP 주소가 필요하지만, 어떤 애플리케이션이 사용되고 있는지 구분하려면 TCP는 포트 번호가 필요하다.
그림과 같이 컴퓨터 1에서 컴퓨터 2까지 포트 번호를 붙여서 통신하면 원하는 애플리케이션까지 데이터를 보낼 수 있다.
Q. 컴퓨터 1의 웹 브라우저로는 왜 1025번 포트 번호가 할당되었나?
웹 브라우저로 접속할 때 웹 브라우저에는 임의의 포트가 자동으로 할당된다.
그래서 서버 측에서는 포트 번호를 정해 둬야 하지만 클라이언트 측은 정하지 않아도 자동으로 할당 된다.
정리
전송 계층에서 효율적으로 통신할 수 있도록 돕는 UDP 프로토콜의 구조에 대해 알아보자.
신뢰할 수 있는 데이터를 상대방에게 전달하는 TCP와 달리
UDP는 비연결형 통신이라 데이터를 전송할 때 시간이 걸리는 확인 작업을 일일이 하지 않는다.
UDP는 효율성을 중요하게 여기는 프로토콜이고, 장점으로 데이터를 효율적으로 빠르게 보내는 것이라 스트리밍 방식으로 전송하는 동영상 서비스와 같은 곳에 사용된다.
그림과 같이 UDP 헤더가 붙은 데이터를 UDP 데이터그램이라고 한다.
TCP는 그림과 같이 번거롭게 여러 번 확인 응답을 보내면서 전송하지만, UDP는 효율성과 빠른 속도가 중요해서 상대방을 확인하지 않고 연속해서 데이터를 보낸다.
또한 UDP를 사용하면 그림과 같이 랜에 있는 컴퓨터나 네트워크 장비에 데이터를 일괄로 보낼 수 있다. 이것을 브로드캐스트라고 한다.
정리
전송 계층(transport layer, 트랜스포트 계층) : 신뢰할 수 있는 데이터를 순차적으로 전달하는 역할을 하므로 상위 계층들이 데이터 전달의 유효성이나 효율성을 신경 쓰지 않도록 한다. 데이터가 중복되거나 누락되지 않고 오류 없이 순서에 맞게 전송되도록 관리한다.
연결형(connection-oriented) : 데이터를 교환하기 전에 연결을 맺고 데이터를 교환하는 동안 계속 연결을 관리하는 프로토콜의 한 형태다.
비연결형(connectionless) : 연결(connection)에 대한 초기화 과정이 없는 통신이다.
TCP(Transmission Control Protocol, 전송 제어 프로토콜) : 전송 계층의 프로토콜은 연결형(connection-oriented) 통신 방식이며 신뢰할 수 있는 데이터 전송을 보장한다.
대역폭(bandwidth) : 정해진 시간 동안 전송될 수 있는 데이터의 양(주로 속도를 의미한다)을 말한다. 대역폭은 제한적이다.
UDP(User Datagram Protocol) : 정보를 서로 주고받을 때 보내는 쪽에서 일방적으로 데이터를 전달하는 통신 프로토콜이다. 연결을 맺을 필요가 없고 정보를 보내거나 받는다는 신호도 필요하지 않다.
3-way 핸드셰이트(three-way handshake) : TCP 통신에서 사용하는 신뢰성을 제공하기 위한 통신 방식이다. 컴퓨터 간에 연결을 맺기 위한 초기화 과정으로 세 단계로 되어 있어서 three-way라고 부른다.
잘 알려진 포트(well-known ports) : 특정 애플리케이션이 사용할 수 있도록 예약되어 있는 포트로 1~1023번 포트를 말한다.
브로드캐스트(broadcast) : 네트워크의 모든 컴퓨터와 장비에 같은 패킷을 일괄 전송하는 방식이다.
일련번호(sequence number) : TCP에서는 데이터를 보낼 때마다 각 데이터에 고유한 번호를 부여해서 전송을 시도한다. 이 번호를 이용하여 TCP 패킷의 순서를 제어할 수 있다.
포트 번호(port number) : 컴퓨터가 데이터 통신을 할 때 통신하고자 하는 네트워크 서비스나 특정 프로세스를 식별하는 노리 단위다. 포트 번호는 0~65535번을 사용할 수 있다. 0~1023번은 잘 알려진 포트(well-known ports)로 특정 애플리케이션이 사용할 수 있도록 예약된 번호다.