로드밸런싱

이상민·2024년 10월 25일

CS공부

목록 보기
12/18

로드밸런싱이란 ?

웹 사이트가 생겨나고 웹 사이트를 이용하는 인원이 급격히 늘어나면서 이러한 서버 트래픽을 감당하기에는 1대의 서버로는 부족하다. 이러한 문제를 해결하기 위해서는 여러대의 서버를 나눠서 일하게 만드거나(Scale-Out), 하드웨어의 성능을 올리는(Scale-up) 등 다양한 방법이 있다.

하지만 하드웨어 향상 비용이 만만치 않게 비싸기도 하고, 서버가 여러대면 무중단 서비스를 제공하는 환경 구성이 용이하므로 이러한 서버를 나눠서 시스템을 확장하는 Scale-out방법이 효과적이다. 이때 여러 서버에게 균등하게 트래픽을 분산시켜주는 것이 바로 로드 밸런싱이다.

로드 밸런싱은 분산식 웹 서비스로, 여러 서버나 컴퓨터 자원에 작업을 고르게 분산하여 처리하는 것으로, 로드밸런서(Load Balancer)를 클라이언트와 서버 그룹 사이에 위치해 서버에 가해지는 트래픽을 여러 대의 서버에 고르게 분배하여 특정 서버의 부하를 덜어줍니다.

로드밸런싱의 장점

1) 애플리케이션 가용성

서버 장애 또는 유지 관리로 인해 애플리케이션 가동 중지 시간이 늘어 방문자가 애플리케이션을 사용할 수 없게 될 수 있습니다. 로드 밸런서는 서버 문제를 자동으로 감지하고 클라이언트 트래픽을 사용 가능한 서버로 리다이렉션하여 시스템의 내결함성을 높입니다. 로드 밸런싱을 사용하여 다음 태스크를 더 쉽게 수행할 수 있습니다.

  • 애플리케이션 가동 중지 없이 애플리케이션 서버 유지 관리 또는 업그레이드 실행

  • 백업 사이트에 자동 재해 복구 제공

  • 상태 확인을 수행하고 가동 중지를 유발할 수 있는 문제 방지

2) 애플리케이션 확장성

로드 밸런서를 사용하여 여러 서버 간에 네트워크 트래픽을 지능적으로 전달할 수 있습니다. 로드 밸런싱이 다음을 수행하므로 애플리케이션에서 수천 개의 클라이언트 요청을 처리할 수 있습니다.

  • 한 서버에서 트래픽 병목 현상 방지

  • 필요한 경우 다른 서버를 추가하거나 제거할 수 있도록 애플리케이션 트래픽을 예측

  • 안심하고 조정할 수 있도록 시스템에 중복성을 추가

3) 애플리케이션 보안

로드 밸런서에는 인터넷 애플리케이션에 또 다른 보안 계층을 추가할 수 있는 보안 기능이 내장되어 있습니다. 이는 공격자가 서버 장애를 일으키는 수백만 개의 동시 요청으로 애플리케이션 서버를 가득 채우는 분산 서비스 거부 공격을 처리하는 데 유용한 도구입니다. 로드 밸런서는 다음을 수행할 수도 있습니다.

  • 트래픽 모니터링 및 악성 콘텐츠 차단

  • 공격 트래픽을 여러 백엔드 서버로 자동으로 리다이렉션하여 영향 최소화

  • 추가 보안을 위해 네트워크 방화벽 그룹을 통해 트래픽 라우팅

4) 애플리케이션 성능

로드 밸런서는 응답 시간을 늘리고 네트워크 지연 시간을 줄여 애플리케이션 성능을 향상시킵니다. 다음과 같은 몇 가지 중요한 태스크를 수행합니다.

  • 서버 간에 로드를 균등하게 배포하여 애플리케이션 성능 향상

  • 클라이언트 요청을 지리적으로 더 가까운 서버로 리다이렉션하여 지연 시간 단축

  • 물리적 및 가상 컴퓨팅 리소스의 신뢰성 및 성능 보장

로드밸런싱 알고리즘

로드밸런싱에는 여러 알고리즘이 사용되는데, 가장 흔한 알고리즘은 라운드 로빈(Round Robin), 가중치 분배(Weighted Distribution), 최소 연결(Least Connections) 등입니다. 각 알고리즘은 서로 다른 목적과 케이스에 적합하므로, 사용할 로드밸런서의 유형을 잘 선택해야 합니다.

정적 로드 밸런싱

1) 라운드 로빈 방식(Round Robin Method)

클라이언트의 요청을 여러 대의 서버에 순차적으로 분배하는 방식이다. 클라이언트의 요청을 순서대로 분배하기 때문에 서버들이 동일 스펙을 가지고 있고, 서버와의 연결(세션)이 오래 지속되지 않는 경우 활용하기 적합하다.

A, B, C의 서버를 가지고 있을 경우 A → B → C → A 순서대로 순회합니다.

2) 가중치 기반 라운드 로빈 방식(Weighted Round Robin Method)

각각의 서버마다 가중치(Weight)를 매기고 가중치가 높은 서버에 클라이언트의 요청을 먼저 배분합니다. 여러 서버가 같은 사양이 아니고, 특정 서버의 스펙이 더 좋은 경우 해당 서버의 가중치를 높게 매겨 트래픽 처리량을 늘릴 수 있습니다.

서버 A의 가중치=8, 서버 B의 가중치=2, 서버 C의 가중치=3 → 서버 A에 8개, 서버 B에 2개, 서버 C에 3개의 Request를 할당합니다.

3) IP 해시 방식(IP Hash Method)

IP 해시 방식에서 로드밸런서는 클라이언트 IP 주소에 대해 해싱이라고 하는 수학적인 계산을 수행합니다. 클라이언트 IP 주소를 숫자로 변환한 다음 개별 서버에 매핑합니다. 사용자 IP를 해싱하여 부하를 분산하기 때문에 사용자가 항상 동일한 서버로 연결되는 것을 보장합니다.

동적 로드 밸런싱

1) 최소 연결 방법(Least Connection Method)

최소 연결 방법에서 로드 밸런서는 활성 연결이 가장 적은 서버를 확인하고 해당 서버로 트래픽을 전송합니다. 이 방법에서는 모든 연결에 모든 서버에 대해 동일한 처리 능력이 필요하다고 가정합니다.

2) 최소 응답 시간 방법(Least Response Time Method)

서버의 현재 연결 상태와 응답 시간을 모두 고려하여, 가장 짧은 응답 시간을 보내는 서버로 트래픽을 할당합니다. 각 서버의 가용 가능한 리소스와 성능, 처리 중인 데이터양 등이 상이할 경우 적합합니다. 조건에 잘 들어맞는 서버가 있을 시 여유 있는 서버보다 먼저 할당됩니다. 로드 밸런서는 이 알고리즘을 사용하여 모든 사용자에게 더 빠른 서비스를 보장합니다.

헬스 체크(Health Check)

그럼 만약 로드 밸런서를 통해 서비스하는 그룹의 서버에 서버장애가 발생하면 어떡할까? 혹시 서비스가 정상적으로 되지 않는 서버로 서비스를 분산해 일부 사용자에게 서비스되지 않는 경우가 발생하지 않을까 ? 이런 경우는 발생하지 않는다.

로드 밸런서에는 부하 분산을 하는 각 서버의 서비스를 주기적으로 헬스 채크(Health Check)해 정상적인 서비스쪽으로만 부하를 분산하고 비 정상적인 서버는 서비스 그룹에서 제외해 트래픽을 보내지 않는다. 심지어 서비스 그룹에서 제외된 후 에도 헬스 체크를 계속 수행해 다시 정상으로 확인되면 서비스 그룹에 해당 장비를 다시 넣어 트래픽이 서버 쪽으로 보내지도록 해준다.

헬스 체크 방법

헬스 체크에는 다양한 방법이 있는데 그 중 하나를 설명하면 HTTP 상태코드확인하는 방법으로, 로드 밸런서가 서버로 3방향 핸드셰이크를 거치고나서 HTTP를 요청해 정상적인 상태코드(200)을 응답하는지 여부를 체크해 헬스 체크를 수행할 수 있다.

0개의 댓글