
환경 설정(컨피그)
기본 엔진 설정(BaseEnv) → MetaDrive 기본 설정 → DiffusionPlanner 전용 설정의 세 단계를 합쳐 하나의 최종 설정을 만듭니다.
여기서 DiffusionPlanner 전용 설정은
차로 폭·차로 수 무작위화구간별 최고·최저 속도 제한사고 확률, 관측 범위, 트래픽 밀도 등을 따로 지정지도와 트래픽 관리
SpeedLimitPGMapManager가 블록 기반 도로를 만들고, 각 블록에 속도 제한을 부여합니다.DiffusionTrafficManager는 NPC 차량을 생성·관리합니다.TrafficObjectManager가 사고/장애물도 추가해 돌발 상황을 만듭니다.관측(Observation)
DiffusionPlannerObservation 클래스가 제공하는 전용 센서 패키지를 사용행동 정책(Policy)
외부 NPC 제어 인터페이스
set_external_npc_actions() 함수로
엔진 단축키
r 리셋, p 일시정지, b 탑뷰 전환 등 실험 중 빠른 반복·시각화를 지원합니다.행동 수집
DiffusionTrafficManager나 set_external_npc_actions()에서 채워진 NPC 행동을 모읍니다.시뮬레이터 진행
보상 계산
핵심식은 다음과 같이 요약할 수 있습니다.
: 진행 거리 × 차로 중심 유지 정도
: 현재 속도 비율
: 도착(+), 충돌·차선이탈(−) 등 종료 이벤트 보상/패널티
종료 조건
관측·정보 반환