CS 스터디 - 로드 밸런싱(Load Balancing)

또리·2024년 1월 22일
1

CS-STUDY

목록 보기
2/2

로드 밸런싱(Load Balancing)

서버가 처리해야 할 업무 혹은 요청(load)을 여러 대의 서버로 나누어(balancing) 처리하는 것이다. 여러 대의 서버에서 서비스를 제공하는 분산 처리 시스템에서 필요하다.

  • 한 대의 서버로 부하가 집중되지 않도록 트래픽을 관리해서 각각의 서버가 최적의 퍼포먼스를 보일 수 있도록 하는 것이 목적이다.
  • 서비스의 규모가 커지고, 이용자 수가 늘어나게 되면 기존의 서비스만으로는 원활한 서비스 동작이 불가능하게 되고, 이를 대처하는 방법으로는 크게 2가지가 있다.
    • 기존의 서버 성능을 확장하는 Scale-Up 방식
    • 기존의 서버와 동일하거나 낮은 성능의 서버를 증설하는 Scale-Out 방식
  • Scale-Out 방식으로 증가한 트래픽에 대처하기로 했다면, 여러 대의 서버로 트래픽을 균등하게 분산해주는 로드 밸런싱이 반드시 필요하다.

작동 방식

1. 애플리케이션에 대한 사용자 요청이 로드 밸런서로 이동함
2. 로드 밸런서가 요청을 처리하는 데 가장 적합한 서버 배열의 단일 서버로 각 요청을 라우팅함.

L4 로드 밸런싱 & L7 로드 밸런싱

  • 로드 밸런싱에는 L4 로드 밸런싱과 L7 로드 밸런싱이 가장 많이 활용된다.
  • L4, L7은 각각 Layer 4(전송 계층) 프로토콜과 Layer 7(응용 계층) 프로토콜의 헤더를 부하 분산에 이용하기 때문에 붙은 접두사이다. 모든 요청을 L4 혹은 L7 로드 밸런서가 받아 서버들에게 적절히 나누어준다.

L4 로드 밸런서

네트워크 계층(IP, IPX)이나 전송 계층(TCP, UDP)의 정보(IP 주소, 포트 번호, MAC 주소, 전송 프로토콜)를 바탕으로 로드를 분산한다.

L4 로드 밸런서 특징

  • 데이터 안을 들여다보지 않고 패킷 레벨에서만 로드를 분산하기 때문에 속도가 빠르고 효율이 높지만, 섬세한 라우팅이 불가능하다.
  • 데이터의 내용을 복호화할 필요가 없기 때문에 비교적 안전하다.
  • L7 로드 밸런서보다 가격이 저렴하다.
  • 사용자의 IP가 수시로 바뀌는 경우라면 연속적인 서비스를 제공하기 어렵다.

L7 로드 밸런서

애플리케이션 계층(HTTP, FTP, SMTP)에서 로드를 분산하기 때문에 HTTP 헤더, 쿠키 등과 같은 사용자의 요청을 기준으로 특정 서버에 트래픽을 분산한다. 쉽게 말해 패킷의 내용을 확인하고 그 내용에 따라 로드를 특정 서버에 분배한다.

L7 로드 밸런서 특징

  • 특정한 패턴을 지닌 바이러스를 감지해 바이러스를 보호할 수 있다.
  • Dos/DDoS와 같은 비정상적인 트래픽을 필터링할 수 있어 네트워크 보안 분야에서도 활용되고 있다.
  • 상위 계층에서 로드를 분산하기 때문에 섬세한 라우팅이 가능하다.
  • 캐싱 기능을 제공한다.
  • 패킷의 내용을 복호화 하므로 비용이 높다.
  • 클라이언트가 로드 밸런서와 인증서를 공유하기 때문에 로드 밸런서를 통해 클라이언트의 데이터에 접근할 수 있는 위험성이 존재한다.

L4 로드 밸런서의 로드 밸런싱 기법

라운드 로빈 방식(Round Robin Method)

  • 서버에 들어온 요청을 순서대로 돌아가며 배정하는 방식
  • 여러 대의 서버가 동일한 스펙을 갖고 있고, 서버와의 연결(세션)이 오래 지속되지 않는 경우에 활용하기 적합하다.

가중 라운드 로빈 방식(Weighted Round Robin Method)

  • 각각의 서버마다 가중치를 매기고 가중치가 높은 서버에 클라이언트 요청을 우선적으로 배분하는 방식
  • 주로 서버의 트래픽 처리 능력이 상이한 경우에 사용되는 부하 분산 방식이다.

IP 해시 방식(IP Hash Method)

  • 클라이언트의 IP 주소를 특정 서버로 매핑하여 요청을 처리하는 방식
  • 사용자의 IP를 해싱(Hashing)하여 로드를 분배하기 때문에 사용자가 항상 동일한 서버로 연결되는 것을 보장한다.

최소 연결 방식(Least Connection Method)

  • 요청이 들어온 시점에 가장 적은 연결 상태를 보이는 서버에 우선적으로 트래픽을 배분하는 방식
  • 자주 세션이 길어지거나, 서버에 분배된 트래픽들이 일정하지 않은 경우에 적합한 방식이다.

최소 응답 시간 방식(Least Response Time Method)

  • 서버의 현재 연결 상태와 응답 시간(Response Time, 서버에 요청을 보내고 최초 응답을 받을 때까지 소요되는 시간)을 모두 고려하여 트래픽을 분배하는 방식
  • 가장 적은 연결 상태와 가장 짧은 응답 시간을 보이는 서버에 우선적으로 로드를 배분하는 방식이다.

L7 로드 밸런서의 로드 밸런싱 기법

URL 스위칭 방식(URL Switching Method)

  • 특정 하위 URL들은 특정 서버로 처리하는 방식
  • ex) .../images 또는 .../video와 같은 URL은 서버가 아닌 별도의 스토리지에 있는 객체 데이터로 바로 연결되도록 구성

컨텍스트 스위칭 방식(Context Switching Method)

  • 클라이언트가 요청한 특정 리소스에 따라 특정 서버로 연결하는 방식
  • ex) 이미지 파일에 대해서는 확장자를 참조하여, 별도로 구성된 이미지 파일이 있는 서버 또는 스토리지로 직접 연결

쿠키 지속성(Persistence With Cookies)

  • 쿠키 정보를 바탕으로 클라이언트가 연결했었던 서버에 계속 할당 해주는 방식

로드 밸런서 주요 성능 지표

L4/L7 로드 밸런서의 성능을 결정하는 주요한 지표들

  • 초당 연결 수(Connections per second) : 최대 처리 가능한 초당 TCP 세션 개수를 의미
  • 동시 연결 수(Concurrent connections) : 동시에 유지할 수 있는 세션 개수를 의미
  • 처리 용량(Throughput) : UDP 프로토콜에 대한 로드 밸런싱 성능 지표

로드 밸런서 장애 대비

  • 갑작스러운 장애에 대비하여 로드 밸런서 서버는 이중화를 기본으로 구성한다.

  • 장애가 났을 경우의 시나리오

    • 이중화된 Load Balancer들은 서로 Health Check를 한다.
    • Main Load Balancer가 동작하지 않으면 가상 IP(Virtual IP)는 여분의 Load Balancer로 변경된다.
    • 여분의 Load Balancer로 운영한다.

참고

링크
링크
링크
링크

profile
Backend Developer

0개의 댓글

관련 채용 정보