서버 하나가 있을때 많은 사람들이 몰리게 되면 서버가 부하를 감당하지 못하는 경우가 있다. 이때 서버의 성능을 높이는 Scale-up과 서버를 여러개 증가 시키는 Scale-out하는 Auto Scaling 기능의 방식이 있다. Scale-up은 한계가 있기 마련이기에 분산 처리를 위해서 여러 서버를 증가 시키는 scale-up을 하는데 이 기술을 로드 밸런싱이라고 한다.
장비를 추가해서 확장하는 방식을 말한다.
기존 서버만으로 용량이나 성능의 한계에 도달했을 때, 비슷한 사양의 서버를 추가로 연결해 처리할 수 있는 데이터 용량이 증가할 뿐만 아니라 기존 서버의 부하를 분담해 성능 향상의 효과와 무중단 서비스를 기대할 수 있다.
서버를 추가로 확장하기 때문에 수평 스케일링(horizontal scaling)이라고도 불린다.
클라우드 서비스에서는 자원 사용량을 모니터링하여 자동으로 서버를 증설(Scale Out)하는 Auto Scaling 기능도 있음