구글이나 네이버에는 수많은 사람들이 이용하기 때문에 트래픽량을 감당하는 것이 중요할 것이다. 그래서 트래픽이 몰릴 때 트래픽을 분산시켜 줄 필요가 있다. 이렇게 트래픽량이 몰릴 때 트래픽을 분산시키는 것을 로드 밸런싱(load balancing)이라고 하고 이 일을 해주는 것이 바로 로드 밸런서(load balancer)이다.
로드 밸런서를 부착시키기 전은 다음 그림과 같다.

로컬에서 가상 머신에 접속하기 위해 퍼블릭 IP를 통해 연결하게 된다. 위에 그림에서는 트래픽량이 몰려도 컨트롤 할 수 없다. 이제 로드밸런서를 부착시켜보겠다.

위와 같이 로드밸런서를 가상 머신 앞 단에 부착시켜준다. 로컬에서 로드밸런서에 접속해서 가상머신에 접근하게 되는데, 로드 밸런서는 front, back이 존재한다.(개발에서 프론트 백엔드가 아님) 그래서 로컬에서 들어오는 포트와 로드 밸런서에서 가상 머신에 접근하는 포트 규칙을 추가해주어야 한다.
근데 지금은 가상머신이 1개이기 때문에 트래픽량이 몰려도 가상머신 한 대 내에서 처리해야 한다. 로드 밸런서와 같이 쓰이게 된다.
VMSS란 Virtual Machine Scale Sets로, 여러 VM이라고 이해하면 좋을 것 같다. 따라서 로드 밸런서를 VMSS 앞 단에 붙여주면 여러 VM을 사용하여 부하 분산을 할 수 있다.

기존에 우리가 봐오던 VM이 한 대가 아닌 여러 대임을 확인할 수 있다.
그래서 실제로 퍼블릭 ip로 로드밸런서에 접속한 다음 VM에 접근하려 할 때 로드밸런서에서 자동으로 접속할 VM을 보여준다. 1번 VM private ip를 줄 때도 있고 2번 VM private ip를 줄 때도 있다. 이런 식으로 로드밸런서가 접근할 VM을 분산시켜주는 것을 확인할 수 있다.
Azure portal을 사용하여 VM 부하 분산하는 내부 부하 분산 장치 만들기: https://learn.microsoft.com/ko-kr/azure/load-balancer/quickstart-load-balancer-standard-internal-portal
Azure portal을 사용하여 VMSS 만들기: https://learn.microsoft.com/ko-kr/azure/virtual-machine-scale-sets/flexible-virtual-machine-scale-sets-portal