아래 내용은 CVPR 2025에 게재된 “Scenario Dreamer: Vectorized Latent Diffusion for Generating Driving Simulation Environments” 논문을 ‘원문을 보지 않아도 될 정도’로 상세히 풀어 쓴 것입니다.
⸻
⸻
⸻
3‑1. 문제 설정
• 64 m × 64 m FOV를 Ego 중심·방향 기준으로 고정.
• 객체 집합
(x, y, speed, \cos\theta, \sin\theta, length, width, class)
• 차선 집합
(후속·선행·좌·우 인접관계). 
3‑2. 두 단계 학습
• (1) VAE 오토인코더
• 요소별 MLP + Factorized Attention
• lane→lane / lane→object / object→object 블록.
• 객체와 차선에 서로 다른 잠재 차원 Ko, K\ell 사용.
• lane latents가 object 정보에 의존하지 않도록 설계 → 차선 기반 객체 생성이 가능. 
• (2) Latent Diffusion
• 가변 토큰 수 (No,N\ell)를 조건으로 하는 Transformer DDPM.
• Factorized Attention 블록을 반복하며 AdaLN‑Zero로 스케일·시프트 조건 부여.
• 학습 목적
\mathcal L{\text{dm}}
=\mathbb E{\mathbf Ht,\boldsymbol\epsilon_t\sim\mathcal N(0,1),t}
\Bigl[|\boldsymbol\epsilon_t-\epsilon\theta(\mathbf H_t,t)|_2^2\Bigr] 
• Permutation Ambiguity 해결
벡터 셋은 고유 순서가 없기 때문에, 재귀적 (정렬 기반) 사인 위치 인코딩을 토큰에 가해 노이즈 단계에서도 상대 위치를 복원 가능하게 한다. 
3‑3. 세 가지 생성 모드
• 초기 장면 샘플링: 학습 분포에서 (No,N\ell)을 뽑거나 사용자가 지정.
• 차선 조건 객체 생성: 미리 주어진 맵 M을 인코딩 후 객체 토큰만 확산.
• 장면 인페인팅: 후면(F_N) 컨텍스트를 고정·노이즈 재설정하며 전방(F_P) 영역을 생성 → 연속 타일링 가능. 
⸻
⸻
5‑1. 데이터·평가 지표
• Waymo Open Motion·nuPlan 두 세트 모두 학습·테스트. 
• Lane Graph 품질: Urban Planning 4종(Connectivity, Density, Reach, Convenience) + Frechet Distance + 최대 Route Length 등.
• Agent 배치 품질: 6종 JSD(이웃 거리, 차선 편차·각도, 길이·폭, 속도) + 충돌률.
5‑2. 주요 결과
• Lane Graph
• Scenario Dreamer‑Base가 SLEDGE‑DiT‑XL보다 모든 항목 우수하면서 파라미터 2×, 추론 지연 6–7× 절감. 
• Agent Box
• Waymo·nuPlan 양쪽에서 JSD와 충돌률을 대폭 낮춤. 예: nuPlan 충돌률 22.3 % → 11.9 %(Base) / 9.3 %(Large). 
• Ablation
• Factorized Attention, Lane Ordering, 학습형 Topology가 모두 성능‑효율을 좌우함. Factorized 디자인 제거 시 지연 2× 증가. 
• RL Planner 벤치마크
• 동일 PPO 플래너(55 m 경로)는 Waymo 로그와 Scenario Dreamer 장면에서 유사 성적 → 현실성 입증.
• 경로 길이를 100 m로 늘리거나 Negative Tilting을 적용하면 성공률이 59.8 %→38.2 %→32.1 %까지 하락 → 더 긴·적대적 시나리오가 실제로 ‘더 어렵다’는 점을 보여줌. 
⸻
⸻
⸻
위 설명으로 논문의 동기, 방법, 수학적 기초, 구현·성능, 의의를 모두 포괄했으니 원문 없이도 연구 내용을 재현·확장하실 수 있을 것입니다.