실시간 서빙이 필요한 환경에서는 대규모 model 을 사용하기 곤란함.latency 및 computing 자원 비용이 높기 때문 -> 이를 해결하기 위해 대규모 model 을 작은 model로 축소시키는 연구 진행: 특히 대규모 ensemble model의 결과를 하나