Autoscaling이란 자동으로 컴퓨터의 리소스를 부하에 따라 늘렸다 줄였다 하는 것을 의미합니다. 클라우드 컴퓨팅 이전 기존의 인프라에서는 서버가 갑자기 높아지는 부하를 감당하기 위해서는 이미 구축된 서버가 있어서 그러한 부하를 감당할 수 있어야 했습니다. 서버라는 자원은 제한적이며, 작동하지 않는 상태에서도 비용이 발생하기 때문에 매우 비효율적이였습니다 갑자기 증가하게 될 사용자를 대비하여 미리 서버를 구매하고 환경을 구성해둬야 했기 때문에 비용적인 측면에서 매우 비효율적이었습니다. 또한 갑자기 늘어난 사용자수는 매일매일 달라지기 때문에 나중에는 줄어들수도 있습니다.
Auotoscaling은 이러한 문제점을 해결하기 위해 나온 개념입니다. Autoscaling은 Cloud 서버의 부하율에 따라서 현재 작동하는 서버의 수를 줄였다 늘렸다 하게 됩니다. 이렇게 서버를 늘렸다 줄였다 할 수 있게 된다면 미리 서버를 구매하여 사용할 필요가 없어지게 되며, 만약 갑자기 사용자의 수가 급격하게 증가하였다 하더라도 서버의 부하가 높아져 서버에게 장애가 발생하지 않고 늘어난 서버에서 모든 사용자를 감당할 수 있게 됩니다. 또한 사용자수가 줄어들더라도 서버를 구매하는등의 불필요한 비용이 발생하지 않게됩니다.