안전성 및 설명가능성성능 극대화의 이론적 한계주변 agent trajectory prediction 모듈과, MPC의 cost function이 다르기 떄문에, 복잡한 환경에서 뛰어난 성능 기대 가능Multi-modal trajectory IL는 이론적으로 Diffusion 기반 플래닝처럼 다중 모달 특성을 잘 학습할 수 있는 잠재력을 가지고 있음. 다만 아래 3가지가 잘 갖춰져야 함.대규모 궤적 후보 집합의 품질확률 분포의 정확한 캘리브레이션| 항목 | Diffusion 기반 플래닝 | VADv2 (Probabilistic Planning) |
|---|---|---|
| 멀티모달 표현 | - 연속적인 확률 분포를 암시적으로 모델링하여 이론적으로 무한한 다양성을 생성할 수 있음 - 노이즈 제거(denoising) 과정을 통해 다양한 모드를 자연스럽게 캡처 | - 대규모 이산 궤적 후보 집합(trajectory vocabulary)을 사용하여, 각 후보에 대한 확률 분포를 학습 - 후보 집합 내에서 다양한 모드를 표현하려 함 |
| 확률적 샘플링 및 다양성 | - 반복적인 denoising 단계에서 내재된 확률성을 통해 매 실행마다 서로 다른 궤적을 생성 - 매우 다양한 행동 모드를 자연스럽게 샘플링 가능 | - 한 번의 순전파로 후보 궤적에 대한 확률 분포를 출력하고, 그 중 하나를 샘플링 - 후보 집합의 크기와 캘리브레이션에 따라 다양성 한계가 있을 수 있음 |
| 추론 속도 | - 다단계 iterative 샘플링이 필요하여 계산 비용이 높고, 실시간 적용에는 다소 느림 | - 단일 순전파로 확률 분포를 출력하므로 빠른 추론이 가능, 실시간 주행 플래닝에 유리 |
| 제약 조건 통합 | - 물리적/안전 제약을 명시적으로 반영하기 어려워 추가적인 guidance 메커니즘이 필요할 수 있음 | - 미리 정의된 후보 궤적이 물리적으로 실행 가능한 범위 내에 구성되어 있어, 제약 조건(예: 충돌 회피, 차선 준수 등)을 쉽게 반영할 수 있음 |
| 표현력 및 유연성 | - 연속적이고 세밀한 행동 변화까지 모델링할 수 있어 매우 높은 표현력을 가짐 - 다양한 상황에서 미세한 차이를 반영할 수 있음 | - 후보 집합의 크기와 품질에 따라 표현력이 결정됨 - 후보 집합에 포함되지 않은 미세한 변화는 표현하기 어려울 수 있음 |
| 데이터 의존성 | - 전체 데이터 분포를 학습하기 위해 매우 다양한 대규모 데이터가 필요함 - 데이터가 부족하면 모드 붕괴의 위험이 있음 | - 다중 모달 분포 학습 역시 충분한 다양성의 데이터에 의존 - 후보 집합이 데이터 내 모드를 충분히 반영하지 못하면, 제한된 모드만 표현될 위험이 있음 |
| 확률 분포 캘리브레이션 | - 최대우도 기반 학습으로 자연스럽게 확률 분포를 캘리브레이션함 | - 각 후보에 대한 확률을 정확히 학습해야 함 - 한 모드에 확률이 과도하게 집중되면, 다중 모달성이 제대로 표현되지 않을 위험이 있음 |
(2) 안전 및 복구 메커니즘 (Classifier Guidance):
(3) 학습 분포 밖 상황에 대한 유연한 대응:
요약: