모델을 나누는 방법은 예전부터 사용, AlexNet도 모델 병렬화 C2와 C3 사이 병렬을 위해 GPU간 교차되는 부분이 존재. 당시 GPU 성능이 지금처럼 좋지 않아 2개의 GPU로 돌렸다고 한다.
문제점 GPU 2개를 사용하지만 동시에 학습하지 않고 한 GPU에서 학습이 끝나면 다른 GPU에서 시작하는 비효율적인 학습