Transaction, TCP와 UDP

송현진·2023년 7월 26일
0

CS공부

목록 보기
3/5
post-thumbnail

Transaction이란?

데이터베이스의 상태를 변환시키는 하나의 논리적인 작업 단위를 구성하는 연산들의 집합이다.

  • 작업의 완전성을 보장해준다.
  • 즉, 작업들을 모두 처리하거나 처리하지 못할 경우 이전 상태로 복구하여 작업의 일부만 적용되는 현상이 발생하지 않게 만들어주는 기능이다.
  • 하나의 트랜잭션은 커밋되거나 롤백된다.

    Commit
    하나의 트랜잭션이 성공적으로 끝나고, 데이터베이스가 일관성있는 상태에 있을 때 하나의 트랜잭션이 끝났음을 알려주기 위해 사용하는 연산
    Rollback
    하나의 트랜잭션 처리가 비정상적으로 종료되어 데이터베이스의 일관성을 깨뜨렸을 때, 이 트랜잭션의 일부가 정상적으로 처리되었더라고 트랜잭션의 원자성을 구현하기 위해 이 트랜잭션이 행한 모든 연산을 취소하는 연산

성질(ACID)

  1. 원자성(Atomicity) : 작업이 모두 반영되거나 전혀 반영되지 않아야한다(all or nothing).
  2. 일관성(Consistency) : 실행이 완료되면 언제나 일관성 있는 상태를 유지해야 한다.
  3. 독립성(Isolation) : 둘 이상 트랜잭션이 동시에 실행될 경우 서로의 연산에 끼어들 수 없다.
  4. 지속성(Durability) : 완료된 결과는 영구적으로 반영되어야 한다.

상태

  • 활동(Active)
    트랜잭션이 실행 중에 있는 상태, 연산들이 정상적으로 실행 중인 상태
  • 부분완료(Partially Committed)
    트랜잭션의 마지막 연산까지 실행했지만, Commit 연산이 실행되기 직전의 상태
  • 완료(Committed)
    트랜잭션이 성공적으로 종료되어 Commit 연산을 실행한 후의 상태
  • 철회(Aborted)
    트랜잭션이 비정상적으로 종료되어 Rollback 연산을 수행한 상태
  • 실패(Failed)
    트랜잭션 실행에 오류가 발생하여 중단된 상태

✏️ 부분완료와 완료 차이점
commit 요청이 들어오면 상태는 부분완료가 된다. 이후 commit을 문제없이 수행할 수 있다면 완료 상태로 전이되고, 오류가 발생하면 실패 상태가 된다. 즉, 부분완료는 commit 요청이 들어왔을 때를 말하고, 완료 상태는 commit을 정상적으로 완료한 상태이다.

주의점

트랜잭션은 꼭 필요한 최소의 코드에만 적용하는 것이 좋다.
즉, 여러 개의 트랜잭션으로 쪼개서 트랜잭션의 범위를 최소화하라는 말이다.

일반적으로 데이터베이스 커넥션의 개수는 제한적이다.
그런데 각 단위 프로그램이 커넥션을 소유하는 시간이 길어지면 사용 가능한 여유 커넥션의 개수는 줄어들게 된다. 그렇게되면 각 단위 프로그램에서 커넥션을 가져가기 위해 기다려야하는 상황이 발생할 수 있기 때문이다.

전송계층(Transport Layer)

송신자와 수진자를 연결하는 통신서비스를 제공하는 계층으로 데이터 전달을 담당한다. 데이터를 보내기 위해 사용하는 프로토콜이 있는데 그 프로토콜이 TCPUDP이다

TCP(Transmission Control Protocol)

인터넷 상에서 데이터를 메세지의 형태로 보내기 위해 IP와 함께 사용하는 프로토콜
일반적으로 TCP와 IP를 함께 사용하는데 IP가 데이터의 배달을 처리한다면 TCP는 패킷을 추적 및 관리하게 된다. TCP는 연결형 서비스를 지원하는 프로토콜로 인터넷 환경에서 기본으로 활용한다.

패킷(Packet)
인터넷 내에서 데이터를 보내기 위한 경로배정(라우팅)을 효율적으로 하기 위해서 데이터를 여러 개의 조각들로 나누어 전송을 하는데 이때, 이 조각을 패킷이라고 한다.

TCP는 패킷을 어떻게 추적 및 관리하는가?
데이터는 패킷단위로 나누어 같은 목적지(IP계층)으로 전송된다. 예를 들어 한 줄로 서야하는 A, B, C라는 사람들(패킷)이 부산에서 출발해 서울로 간다고 하자. 그런데 A, B, C가 순차적으로 가는 상황에 B가 길을 잘못 들어서 실종되었다고 하자. 하지만 목적지에서는 A, B, C가 모두 필요한지 모르고 A, C만 보고 다 왔다고 착각할 수 있다. 그렇기 때문에 A, B, C라는 패킷에 1, 2, 3이라는 번호를 부여해 패킷의 분실 확인과 같은 처리를 하여 목적지에서 재조립을 한다. 이런 방식으로 TCP 패킷을 추적하며 나누어 보내진 데이터를 받는 조립을 할 수 있다.

특징

가상회선 방식을 제공한다는 것은 발신지와 수신지를 연결하여 패킷을 전송하기 위한 논리적 경로를 배정한다는 말이다. 그리고 3-way handshaking 과정은 목적지와 수신지를 확실히 하여 정확한 전송을 보장하기 위해서 세션을 수립하는 과정을 의미한다.
TCP는 연결형 서비스로 신뢰성을 보장하기 때문에 이러한 특징을 가질 수 있다.(연속성보다 신뢰성)

  • 연결형 서비스로 가상 회선 방식을 사용
  • 3-way handshaking 과정을 통해 연결을 설정하고 4-way handshaking을 통해 해제
  • 흐름제어 및 혼잡 제어
  • 높은 신뢰성 보장
  • UDP보다 속도가 느림
  • 전이중(Full-Duplex), 점대점(Point to Point) 방식

3-way handshaking, 4-way handshaking

  • 포트 상태 정보
    • CLOSED : 포트가 닫힌 상태
    • LISTEN : 포트가 열린 상태로 연결 요청 대기 중
    • SYN_RCV : SYNC 요청을 받고 상대방의 응답을 기다리는 중
    • ESTABLISHED : 포트 연결 상태
  • 플래그 정보
    • TCP Header에는 CONTROL BIT(플래그 비트, 6bit)가 존재, 각각 bit는 "URG-ACK-PSH-RST-SYN-FIN"의 의미를 가짐
      • 즉, 해당 위치의 bit가 1이면 해당 패킷이 어떠한 내용을 담고 있는 패킷인지 나타냄
    • SYN(Sychronize Sequence Number) / 000010
      • 연결 설정. Sequence Number를 랜덤으로 설정하여 세션을 연결하는 데 사용, 초기에 Sequence Number 전송
    • ACK(Acknowledgement) / 010000
      • 응답 확인. 패킷 받았다는 것을 의미
      • Acknowledgement Number 필드가 유효한지 나타냄
      • 양단 프로세스가 쉬지 않고 데이터를 전송한다고 가정하면 최초 연결 설정 과정에서 전송되는 첫 번째 세그먼트를 제외한 모든 세그먼트의 ACK 비트는 1로 지정된다고 생각 가능
    • FIN(Finish) / 000001
      • 연결 해제. 세션 연결을 종료시킬 때 사용, 더 이상 전송할 데이터가 없음을 의미

3-way handshaking

  • TCP 통신을 이용하여 데이터를 전송하기 위해 네트워크 연결을 설정(Connection Establish) 하는 과정
  • 양쪽 모두 데이터를 전송할 준비가 되었다는 것을 보장하고, 실제로 데이터 전달이 시작하기 전에 한 쪽이 다른 쪽이 준비되었다는 것을 알 수 있도록 한다.
  • 즉, TCP/IP 프로토콜을 이용해서 통신을 하는 응용프로그램이 데이터를 전송하기 전에 먼저 정확한 전송을 보장하기 위해 상대방 컴퓨터와 사전에 세션을 수립하는 과정

    과정
  1. A 클라이언트는 B 서버에 접속을 요청하는 SYN 패킷을 보낸다. 이때 A 클라이언트는 SYN을 보내고 SYN/ACK 응답을 기다리는 SYN_SENT 상태가 된다.
  2. B 서버는 SYN 요청을 받고 A 클라이언트에게 요청을 수락한다는 ACK와 SYN flag가 설정된 패킷을 발송하고 A가 다시 ACK로 응답하기를 기다린다. 이때 B 서버는 SYN_RECEIVED 상태가 된다
  3. A 클라이언트는 B 서버에게 ACK를 보내고 이후 부터는 연결이 이루어지고 데이터가 오가게 된다.이때 B 서버 상태가 ESTABLISHED이다.

4-way handshaking

  • 3-way handshaking의 TCP 연결을 초기화할 때 사용
  • 4-way handshaking은 세션을 종료하기 위해 수행되는 절차

    과정
  1. 클라이언트가 연결을 종료하겠다는 FIN flag 전송
  2. 서버는 일단 확인 메세지를 보내고 자신의 통신이 끝날 때까지 기다리는데 이 상태가 CLOSE_WAIT 상태
  3. 서버가 통신이 끝났으면 연결이 종료되었다고 클라이언트에게 FIN flag 전송
  4. 클라이언트는 확인했다는 메세지를 보냄

서버의 특징

  • 서버소켓 연결만을 담당
  • 연결과정에서 반환된 클라이언트 소켓은 데이터의 송수신에 사용
  • 가상 회선 방식을 제공
  • 서버와 클라이언트는 1:1로 연결
  • 스트림 전송으로 전송 데이터의 크기가 무제한
  • 패킷에 대한 응답을 해야하기 때문에(시간지연, CPU 소모) 성능이 낮음
  • 손실된 경우 재전송 요청을 하므로 Streaming 서비스에 불리

TCP Flow

UDP(User Datagram Protocol)

데이터를 데이터그램 단위로 처리하는 프로토콜
데이터그램이란 독립적인 관계를 지니는 패킷이다.
UDP는 비연결형 프로토콜이다. 즉, 연결을 위해 할당되는 논리적인 경로가 없는데, 그렇기 때문에 각각의 패킷은 다른 경로로 전송되고, 독립적인 관계를 지니게 되는데 이렇게 데이터를 서로 다른 경로로 독립적으로 처리하게되는 프로토콜이다.

특징

비연결형 서비스이기 때문에 연결을 설정하고 해제하는 과정이 존재하지 않는다.
서로 다른 경로로 독립적으로 처리함에도 패킷에 순서를 부여하여 재조립하거나 흐름 제어 또는 혼잡 제어와 같은 기능도 처리하지 않기에 TCP보다 속도가 빠르며 네트워크 부하가 적다.
하지만 신뢰성있는 데이터의 전송을 보장하지는 못한다.(신뢰성 보다는 연속성)

  • 비연결형 서비스로 데이터그램 방식을 제공
  • 정보를 주고 받을 때 정보를 보내거나 받는다는 신호절차를 거치지 않음
  • UDP 헤더의 CheckSum 필드를 통해 최소한의 오류만을 검출
  • 신뢰성이 낮음
  • TCP보다 속도가 빠름

서버의 특징

  • UDP에는 연결 자체가 없어서 서버 소켓과 클라이언트 소켓의 구분 X
  • 소켓 대신 IP를 기반으로 데이터 전송
  • 서버와 클라이언트는 1:1, 1:N, N:M 등으로 연결 가능
  • 데이터그램 단위로 전송되며 그 크기는 65535byte로 크기가 초과하면 잘라서 보냄
  • 흐름제어가 없어서 패킷이 제대로 전송되었는지, 오류가 없는지 확인 불가
  • 파일 전송과 같은 신뢰성이 필요한 서비스보다 성능이 중요시 되는 경우 사용

흐름제어(Flow Control)와 혼잡제어(Congestion Control)란?
흐름제어
데이터를 송신하는 곳과 수신하는 곳의 데이터 처리 속도를 조절하여 수신자와 버퍼 오버플로우를 방지하는 것. 예를 들어, 송신하는 곳에서 감당이 안되게 데이터를 빠르게 많이 보내면 수신자에게 문제가 발생하기 때문이다.
혼잡제어
네트워크 내의 패킷 수가 넘치게 증가하지 않도록 방지하는 것. 만약 정보의 소통량이 과다하면 패킷을 조금만 전송하여 혼잡 붕괴 현상이 일어나는 것을 방지

UDP Flow

TCP vs UDP

정리
1. TCP와 UDP는 둘 다 전송 계층에서 데이터를 보내기위해 사용하는 프로토콜
2. TCP는 연결형 서비스로 가상회선 방식을 제공하고 높은 신뢰성을 보장하며 흐름제어 및 혼잡 제어 기능을 제공한다.
3. UDP는 비연결형 서비스로 데이터그램 방식을 제공하고 패킷에 순서 부여나 재조립등의 기능을 처리하지 않기 때문에 연속성이 중요한 서비스에 사용된다.

참고
트랜잭션 자료
TCP, UDP 자료
3-way handshaking, 4-way handshaking 자료

profile
개발자가 되고 싶은 취준생

0개의 댓글