[네트워크] TCP/IP, 네트워크 계층 모델, HTTP, HTTPS

rsuubinn·2023년 3월 6일
0

network

목록 보기
1/1

📍 TCP/IP

네트워크의 시작

회선교환 방식

회선교환 방식은 발신자와 수신자 사이에 데이터를 전송할 전용선을 미리 할당하고 둘을 연결한다.
이 둘을 연결해주는 사람이 전화교환원, 즉 오퍼레이터 이다.
그래서 내가 연결하고 싶은 상대가 다른 상대와 연결중이라면, 상대방은 이미 다른 상대와의 전용선과 연결되어 있기 때문에 그 연결이 끊어지고 나서야 상대방과 연결할 수 있다.
또한 특정 회선이 끊어지는 경우에는 처음부터 다시 연결을 성립해야 한다.
이로인해 즉시성이 떨어진다.

패킷교환 방식

패킷교환 방식은 패킷이라는 단위로 데이터를 잘게 나누어 전송하는 방식이다.
그래서 각 패킷에는 출발지와 목적지 정보가 있고 이에 따라 패킷이 목적지를 향해 가장 효율적인 방식으로 이동할 수 있다.
이를 이용하면 특정 회선이 전용선으로 할당되지 않기 때문에 빠르고 효율적인 데이터를 전송할 수 있다.
인터넷 프로토콜, 줄여서 IP는 출발지와 목적지의 정보를 IP 주소라는 특정한 숫자값으로 표기하고 패킷단위로 데이터를 전송하게 되었다.

IP와 IP Packet

IP(인터넷 프로토콜)주소를 컴퓨터에 부여하여 이를 이용해 통신한다.
IP는 지정한 IP 주소(IP Address)에 패킷(Packet)이라는 통신 단위로 데이터를 전달한다.
패킷은 pack + bucket이 합쳐진 단어로 소포로 비유할 수 있다.
IP 패킷은 우체국 송장처럼 전송 데이터를 무사히 전송하기 위해 출발지 IP, 목적지 IP와 같은 정보가 포함되어 있다.

  • IP Packet의 한계
    • 비연결성
      • 패킷을 받을 대상이 없거나 서비스 불능 상태여도 패킷 전송
    • 비신뢰성
      • 중간에 패킷이 사라질 수 있음
      • 패킷의 순서를 보장할 수 없음

TCP vs UDP

OSI 7계층과 TCP/IP 4계층

IP 프로토콜 보다 더 높은 계층에 TCP 프로토콜이 존재하기 때문에 앞서 다룬 IP 프로토콜의 한계를 보완할 수 있다.


1. HTTP 메시지를 생성한다.
2. HTTP 메시지가 생성되면 Socket을 통해 전달된다. 프로그램이 네트워크에서 데이트럴 송수신할 수 있도록, 네트워크 환경에 연결할 수 있게 만들어진 연결부 가 바로 네트워크 소켓(Socket) 이다.
3. IP 패킷을 생성하기 전 TCP 세그먼트를 생성한다.
4. 이렇게 생성된 TCP/IP 패킷은 LAN 카드와 같은 물리적 계층을 지나기 위해 이더넷 프레임 워크에 포함되어 서버로 전송된다.

TCP/IP 패킷 정보

전송 제어 프로토콜(TCP: Transmission Control Protocol)


TCP 세그먼트에는 IP 패킷의 출발지 IP와 목적지 IP 정보를 보완할 수 있는 출발지 PORT, 목적지 PORT, 전송 제어, 순서, 검증 정보 등을 포함한다.


TCP는 장치들 사이에 논리적인 접속을 성립하기 위해 3 way handshakek를 사용하는 연결지향형 프로토콜 이다.

연결 방식
1. 클라이언트는 서버에 접속을 요청하는 SYN 패킷을 보낸다.
2. 서버는 SYN 요청을 받고 클라이언트에세 요청을 수락한다는 ACK 와 SYN가 설정된 패킷을 발송하고 클라이언트가 다시 ACK으로 응답하기를 기다린다.
3. 클라이언트가 서버에게 ACK를 보내면 이 이후로부터 연결이 성립되며 데이터를 전송할 수 있다.
4. 만약 서버가 꺼져있다면 클라이언트가 SYN을 보내고 서버에서 응답이 없기 때문에 데이터를 보내지 않는다.
SYN은 Synchronize(동기화) ACK는 Acknowledgment(승인) 의 약자

전송 제어 프로토콜(TCP: Transmission Control Protocol) 특징

  • 연결 지향 - TCP 3 way handshake(가상 연결)
  • 데이터 전달 보증
  • 순서 보장
  • 신뢰할 수 있는 프로토콜
  • 데이터 전송이 성공적으로 이루어진다면 이에 대한 응답을 돌려주기 때문에 IP 패킷의 한계인 비연결성을 보완
  • 만약 패킷이 순서대로 도착하지 않는다면 TCP 세그먼트에 있는 정보를 토대로 다시 패킷 전송을 요청할 수 있다. 이를 통해 IP 패킷의 한계인 비신뢰성(순서를 보장하지 않음)을 보완

사용자 데이터그램 프로토콜(UDP: User Datagram Protocol)

UDP는 IP에 PORT, 체크섬(중복 검사) 필드 정보만 추가된 단순한 프로토콜이다.

사용자 데이터그램 프로토콜(UDP: User Datagram Protocol) 특징

  • 하얀 도화지(기능이 거의 없음)처럼 커스텀마이징이 가능하다는 장점
  • 비연결지향 - TCP 3 way handshake(X)
  • 데이터 전달 보증 되지 않음
  • 순서 보장되지 않음
  • 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름
  • 신뢰성 보다는 연속성이 중요한 서비스(e.g. 실시간 스트리밍)에 자주 사용됨

TCP와 UDP 정리

TCPUDP
연결지향형 프로토콜비연결지향형 프로토콜
전송 순서 보장전송 순서 보장하지 않음
데이터 수신 여부 확인함데이터 수신 여부 확인하지 않음
신뢰성 높지만 속도 느림신뢰성 낮지만 속도 빠름

📍 네트워크 계층 모델

OSI 7 계층 모델

OSI 7 계층 모델은 ISO(International Organization for Standardization)라고 하는 국제표준화기구에서 1984년에 제정한 표준 규격이다.
네트워크에 대한 표준 규격을 정해야만 했던 이유는 같은 회사에서 만든 컴퓨터끼리만 통신이 가능했던 시절이 있었다.
따라서 다른 회사의 시스템이라도 네트워크 유형에 관계없이 상호 통신이 가능한 규약, 즉 프로토콜(Protocol)이 필요했다.
그래서 ISO에서는 제조사에 상관없이 공통으로 사용할 수 있는 네트워크 표준 규격을 정의했다.

각 컴퓨터간 데이터를 전송할 때 컴퓨터 내부에서는 여러가지 일을 한다.
해당 모델은 하드웨어 및 소프트웨어가 수행하는 기능에 따라 이를 7개의 계층으로 구분했다.

1계층 - 물리 계층

OSI 모델의 맨 밑에 있는 계층으로서, 시스템 간의 물리적인 연결과 전기 신호를 변환 및 제어하는 계층이다.
주로 물리적 연결과 관련된 정보를 정의한다.
주로 전기 신호를 전달하는데 초점을 두고, 들어온 전기 신호를 그대로 잘 전달하는 것이 목적이다.

  • e.g. 디지털 또는 아날로그로 신호 변경

2계층 - 데이터링크 계층

네트워크 기기 간의 데이터 전송 및 물리주소(e.g. MAC 주소)를 결정하는 계층이다.
물리 계층에서 들어온 전기 신호를 모아 알아볼 수 있는 데이터 형태로 처리한다.
이 계층에서는 주소 정보를 정의하고 출발지와 도착지 주소를 확인한 후, 데이터 처리를 수행한다.

  • e.g. 브리지 및 스위치, MAC 주소

3계층 - 네트워크 계층

OSI 7 계층에서 가장 복잡한 계층 중 하나로서 실제 네트워크 간에 데이터 라우팅을 담당한다.
이때 라우팅이란 어떤 네트워크 안에서 통신 데이터를 짜여진 알고리즘에 의해 최대한 빠르게 보낼 최적의 경로를 선택하는 과정을 라우팅이라고 한다.

  • e.g. IP 패킷 전송

4계층 - 전송 계층

컴퓨터간 신뢰성 있는 데이터를 서로 주고 받을 수 있도록 하는 서비스를 제공하는 계층이다.
하위 계층에서 신호와 데이터를 올바른 위치로 보내고 신호를 만드는데 집중했다면, 전송 계층에서는 해당 데이터들이 실제로 정상적으로 보내지는지 확인하는 역할을 한다.
네트워크 계층에서 사용되는 패킷은 유실되거나 순서가 바뀌는 경우가 있는데 이를 바로 잡아주는 역할도 담당한다.

  • e.g. TCP/UDP 연결

5계층 - 세션 계층

세션 연결의 설정과 해제, 세션 메시지 전송 등의 기능을 수행하는 계층이다.
즉, 컴퓨터간의 통신 방식에 대해 결정하는 계층이라고 할 수 있다.
쉽게 말해 양 끝 단의 프로세스가 연결을 성립하도록 도와주고, 작업을 마친 후에는 연결을 끊는 역할을 한다.

6계층 - 표현 계층

응용 계층으로 전달하거나 전달받는 데이터를 인코딩 또는 디코딩하는 계층이다.
일종의 번역기 같은 역할을 수행하는 계층이라고 볼 수 있다.

  • e.g. 문자 코드, 압축, 암호화 등의 데이터 변환

7계층 - 응용 계층

최종적으로 사용자와의 인터페이스를 제공하는 계층으로 사용자가 실행하는 응용 프로그램(e.g. Google Chrome)들이 해당 계층에 속한다.

  • e.g. 이메일 및 파일 전송, 웹 사이트 조회

데이터 캡슐화

OSI 계층 모델은 송신 측의 7계층과 수신 측의 7계층을 통해 데이터를 주고 받는다.
각 계층은 독립적이므로 데이터가 전달되는 동안에 다른 계층의 영향을 받지 않는다.

데이터를 전송하는 쪽은 데이터를 보내기 위해서 상위 계층에서 하위 계층으로 데이터를 전달한다.
이때 데이터를 상대방에게 보낼 때 각 계층에서 필요한 정보를 데이터에 추가하는데 이 정보를 헤더(데이터링크 계층에서는 트레일러)라고 한다.
그리고 이렇게 헤더를 붙여나가는 것캡슐화 라고 한다.

마지막 물리 계층에 도달하면 송신 측의 데이터링크 계층에서 만들어진 데이터가 전기 신호로 변환되어 수신 측에 전송된다.

데이터를 받즌 쪽은 하위 계층에서 상위 계층으로 각 계층을 통해 전달된 데이터를 받게된다.
이때 상위 계층으로 데이터를 전달하며 각 계층에서 헤더(데이터링크 계층에서는 트레일러)를 제거해 나가는 것역캡슐화 라고 한다.
역캡슐화를 거쳐 마지막 응용 계층에 도달하면 드디어 전달하고자 했던 원본 데이터만 남게 된다.

TCP/IP 4계층 모델

TCP/IP 4계층 모델은 OSI 모델을 기반으로 실무적으로 이용할 수 있도록 현실에 맞춰 단순화된 모델이다.
쉽게 말해 OSI 7계층 이론을 실제 사용하는, 즉 실용성에 기반을 둔 현대의 인터넷 표준이 TCP/IP 4계층이다.

4계층: 어플리케이션 계층

OSI 계층의 세션 계층, 표현 계층, 응용 계층에 해당하며 TCP/UDP 기반의 응용 프로그램을 구현할 때 사용한다.

  • e.g. FTP, HTTP, SSH

3계층: 전송 계층

OSI 계층의 전송 계층에 해당하며 통신 노드간의 연결을 제어하고, 신뢰성 있는 데이터 전송을 담당한다.

  • e.g. TCP/UDP

2계층: 인터넷 계층

OSI 계층의 네트워크 계층에 해당하며 통신 노드 간의 IP 패킷을 전송하는 기능 및 라우팅을 담당한다.

  • e.g. IP, ARP, RARP

1계층: 네트워크 인터페이스 계층

OSI 계층의 물리 계층과 데이터 링크 계층에 해당하며 물리적인 주소 MAC을 사용한다.

  • e.g. LAN, 패킷망 등에 사용됨

📍 HTTP

HTTP의 특징

1. 클라이언트 서버 구조

2. 무상태 프로토콜(Stateless)

서버가 클라이언트의 상태를 보존하지 않음

  • 장점 : 서버 확장성 높음(스케일 아웃)
  • 단점 : 클라이언트가 추가 데이터 전송

상태 유지(Stateful) : 항상 같은 서버가 유지돼야 함
서버에 장애가 생기면 상태 정보가 다 날아가 버리므로 처음부터 다시 서버에 요청해야 함

무상태(Stateless) : 아무 서버나 호출해도 됨
서버에 장애가 생기더라도 다른 서버에서 응답을 전달하면 되기 때문에 클라이언트가 다시 요청할 필요 없음
응답 서버를 쉽게 바꿀 수 있기 때문에 무한 서버 증설 가능

3. 비연결성(Connectionless)

연결을 유지하는 모델에서는 클라이언트 1, 2는 요청을 보내지 않더라도 계속 연결을 유지해야 함
비연결성을 가지는 HTTP에서는 실제로 요청을 주고 받을 때만 연결을 유지하고 응답을 주고나면 TCP/IP 연결을 끊는다.
이를 통해 최소한의 자원으로 서버 유지를 가능하게 한다.

특징

  • HTTP 1.0 기준으로 HTTP는 기본 연결을 유지하지 않는 모델
  • 일반적으로 초 단위 이하의 빠른 속도로 응답
  • 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
    • e.g. 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.

한계

  • TCP/IP 연결을 새로 맺어야 함 - 3 way handshake 시간 추가
  • 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, CSS, 추가 이미지 등 수많은 자원이 함께 다운로드
  • HTTP 초기에는 각각의 자원을 다운로드하기 위해 연결과 종료를 반복해야 했지만 지금은 연결이 이루어지고 난 뒤 각각의 자원들을 요청하고 모든 자원에 대한 응답이 돌아온 후에 연결을 종료하는 HTTP 지속 연결(Persistent Connections)로 문제 해결
  • HTTP/2, HTTP/3에서 더 많은 최적화

HTTP 헤더의 종류와 특징

HTTP 메시지는 헤더바디로 구분할 수 있다.
HTTP 바디에서는 데이터 메시지 본문(Message body)을 통해서 표현(Representation) 데이터를 전달한다.
표현은 요청이나 응답에서 전달할 실제 데이터이다.
여기서 데이터를 실어 나르는 부분페이로드(Payload) 라고 한다.

표현 헤더(Representation Headers)

표현 헤더는 표현 데이터를 해석할 수 있는 정보를 제공한다. (데이터 유형(html, json), 데이터 길이, 압축 정보 등)

  • Content-Type : 표현 데이터의 형식
    • 미디어 타입, 문자 인코딩
      • Text/html;charset=utf-8
      • application/json
      • Image/png
  • Content-Encoding : 표현 데이터의 압축 방식
    • 표현 데이터를 압축하기 위해 사용
    • 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
    • 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
      • gzip
      • deflate
      • identity
  • Content-Language : 표현 데이터의 자연 언어를 표현
    • ko
    • en
    • en-US
  • Content-Length : 표현 데이터의 길이
    • 바이트 단위
    • Transfer-Encoding(전송 코딩: 전송 시 어떤 인코딩 방법을 사용할 것인가)을 사용하려면 Content-Length를 사용하면 안됨
    • 현재는 Content-Encoding을 사용
    • Transfer-Encoding을 사용하는 경우 chunked의 방식으로 사용한다. chunked 방식의 인코딩은 많은 양의 데이터를 분할하여 보내기 때문에 전체 데이터의 크기를 알 수 없어 표현 데이터의 길이를 명시해야 하는 Content-Length 헤더와 함께 사용할 수 없다.

요청(Request)에서 사용되는 헤더

Form: 유저 에이전트의 이메일 정보

  • 일반적으로 잘 사용하지 않음
  • 검색 엔진에서 주로 사용
  • 요청에서 사용

Referer: 이전 웹 페이지의 주소

  • 현재 요청된 페이지의 이전 웹 페이지 주소
  • A → B 로 이동하는 경우 B를 요청할 때 Referer: A 를 포함해서 요청
  • Referer 를 사용하면 유입경로 수집 가능
  • 요청에서 사용
  • referer는 단어 referrer의 오탈자이지만 스펙으로 굳어짐

User-Agent: 유저 에이전트 애플리케이션 정보

  • 클라이언트의 애플리케이션 정보(웹 브라우저 정보 등등)
  • 통계 정보
  • 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
  • 요청에서 사용
  • e.g.
    • user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/
      537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36

Host: 요청한 호스트 정보(도메인)

  • 요청에서 사용
  • 필수 헤더
  • 하나의 서버가 여러 도메인을 처리해야 할 때 호스트 정보를 명시하기 위해 사용
  • 하나의 IP주소에 여러 도메인이 적영되어 있을 때 호스트 정보를 명시하기 위해 사용

Origin: 서버로 POST 요청을 보낼 때, 요청을 시작한 주소를 나타냄

  • 여기서 요청을 보낸 주소와 받는 주소가 다르면 CORS 에러가 발생한다.
  • 응답 헤더의 Access-Control-Allow-Origin와 관련

Authorization: 인증 토큰(e.g. JWT)을 서버로 보낼 때 사용하는 헤더

  • "토큰의 종류(e.g. Basic) + 실제 토큰 문자" 를 전송
  • e.g.
    • Authorization: Basic YWxhZGRpbjpvcGVuc2VzYW1l

응답(Response)에서 사용되는 헤더

Server: 요청을 처리하는 ORIGIN 서버의 소프트웨어 정보

  • 응답에서 사용
  • e.g.
    • Server: Apache/2.2.22 (Debian)
    • Server: nginx

Date: 메시지가 발생한 날짜와 시간

  • 응답에서 사용
  • e.g.
    • Date: Tue, 15 Nov 1994 08:12:31 GMT

Location: 페이지 리디렉션

  • 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 리다이렉트(자동 이동)
  • 201(Created): Location 값은 요청에 의해 생성된 리소스 URI
  • 3xx(Redirection): Location 값은 요청을 자동으로 리디렉션 하기 위한 대상 리소스를 가리킴

Allow: 허용 가능한 HTTP 메서드

  • 405(Method Not Allowed)에서 응답에 포함
  • e.g.
    • Allow: GET, HEAD, PUT

Retry-After: 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간

  • 503(Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
  • e.g.
    • Retry-After: Fri, 31 Dec 2020 23:59:59 GMT(날짜 표기)
    • Retry-After: 120(초 단위 표기)

콘텐츠 협상 헤더

  • Accept : 클라이언트가 선호하는 미디어 타입 전달
  • Accept-Charset : 클라이언트가 선호하는 문자 인코딩
  • Accept-Encoding : 클라이언트가 선호하는 압축 인코딩
  • Accept-Language : 클라이언트가 선호하는 자연 언어
  • 협상 헤더는 요청시에만 사용

협상 헤더에서는 원하는 콘텐츠에 대한 우선순위를 지정할 수 있다.

  • Quality Values(q) 값 사용
  • 0 ~ 1 클수록 높은 우선 순위
  • 생략하는 경우, 1

📍 HTTPS

HTTPS는 HTTP Secure의 약자로, 단어 뜻 그대로 기존의 HTTP 프로토콜을 더 안전하게(Secure) 사용할 수 있음을 의미한다.
그 이유는 HTTPS가 HTTP와 달리 요청과 응답으로 오가는 내용을 암호화 하기 때문이다.

암호화 방식

데이터를 암호화 할 때는 암호화할 때 사용할 키, 암호화한 것을 해석(복호화)할 때 사용할 키가 필요하다.
이 때 암호화와 복호화할 때 사용하는 키가 동일하다면 대칭 키 암호화 방식, 다르다면 공개키(비대칭 키) 암호화 방식이라고 한다.

1. 대칭 키 암호화 방식

대칭 키 암호화 방식은 하나의 키만 사용한다.
암호화할 때 사용한 키로만 복호화가 가능하다.
두 개의 키를 사용해야 하는 공개 키 방식에 비해서 연산 속도가 빠르다는 장점이 있다.
하지만 키를 주고 받는 과정에서 탈취 당했을 경우에는 암호화가 소용 없어지기 때문에 키를 관리하는데 신경을 많이 써야한다.

2. 공개 키(비대칭 키) 암호화 방식

비대칭 키 암호화 방식은 두 개의 키를 사용한다.
암호화 할 때 사용한 키와 다른 키로만 복호화가 가능하다.
여기서 두 개의 키를 각각 공개 키, 비밀 키 라고 부른다.
공개 키는 이름 그대로 공개되어 있기 때문에 누구든지 접근이 가능하다.
누구든 이 공개 키를 사용해서 암호화한 데이터를 보내면, 비밀 키를 가진 사람만 그 내용을 복호화 할 수 있다.
보통 요청을 보내는 사용자가 공개 키를, 요청을 받는 서버가 비밀 키를 가진다.
이 때, 비밀 키는 서버가 해킹당하지 않는 이상 탈취되지 않는다.

이러한 공개 키 방식은 공개 키를 사용해 암호화한 데이터가 탈취 당한다고 하더라도, 비밀 키가 없으면 복호화할 수 없기 때문에 대칭 키 방식보다 보안성이 더 좋다.
하지만 대칭 키 방식보다 더 복잡한 연산이 필요하여 더 많은 시간을 소모한다는 단점이 있다.

SSL/TLS 프로토콜

SSL이 표준화되며 바뀐 이름이 TLS 이므로 사실상 같은 프로토콜이라고 생각하면 된다.

  • SSL/TLS 특징
    • CA를 통한 인증서 사용
    • 대칭 키, 공개 키 암호화 방식을 모두 사용

인증서와 CA(Certificate Authority)

HTTPS를 사용하면 브라우저가 서버의 응답과 함께 전달된 인증서를 확인할 수 있다.
이러한 인증서는 서버의 신원을 보증해준다.
이 때 인증서를 발급해주는 공인된 기관들을 CA(Certificate Authority) 라고 부른다.

서버는 인증서를 발급받기 위해서 CA로 서버의 정보와 공개 키를 전달한다.
CA는 서버의 공개 키와 정보를 CA의 비밀 키로 암호화하여 인증서를 발급한다.

서버는 클라이언트에게 요청을 받으면 CA에서 발급받은 인증서를 보내준다.
이 때, 사용자가 사용하는 브라우저는 CA들의 리스트와 공개 키를 내장하고 있다.
우선 해당 인증서가 리스트에 있는 CA가 발급한 인증서인지 확인하고, 리스트에 있는 CA라면 해당하는 CA의 공개 키를 사용해서 인증서의 복호화를 시도한다.

CA의 비밀 키로 암호화된 데이터(인증서)는 CA의 공개 키로만 복호화가 가능하므로, 정말로 CA에서 발급한 인증서가 맞다면 복호화가 성공적으로 진행되어야 한다.

profile
@rsuubinn

0개의 댓글