항목 | nuPlan | OpenScene |
---|---|---|
목적 | 자율주행 차량의 종합적인 경로 계획 및 의사결정 평가를 위한 벤치마크 (Closed-loop 평가 기반) | nuPlan 데이터에서 핵심 정보를 선별·다운샘플링하여 3D 장면 이해, 점유(occupancy) 예측 및 open-vocabulary 3D scene understanding 등 다양한 응용 분야에 특화 |
원천 데이터 및 데이터 규모 | Motional이 수집한 1,200~1,500시간 이상의 주행 로그와 16TB 이상급 센서 데이터를 기반으로 함 | nuPlan의 방대한 데이터를 기반으로 핵심 센서 데이터와 어노테이션만 2Hz로 다운샘플링(약 120시간 분량)되어, 저장 용량은 20TB+에서 약 2TB로 90% 이상 축소됨 |
저장 용량 | 약 20TB 이상 | 약 2TB (원본 대비 약 90% 감소) |
샘플링 주파수 | 원본 로그는 10Hz 등 고주파수 센서 데이터 | 다운샘플링되어 2Hz |
주요 어노테이션 / 주석 유형 | 3D 바운딩 박스, 트래젝토리, planning 관련 메타데이터 (예: 목표, 신호등 상태 등) | nuPlan의 어노테이션(바운딩 박스, 트래젝토리 등)에 더해, 공간의 점유(occupancy grid)와 유동(flow) 어노테이션을 추가하여 3D 장면의 정적/동적 특성을 상세하게 파악할 수 있도록 제공 |
평가 방식 | Closed-loop 평가: 플래너가 예측한 경로를 차량 제어 알고리즘(예: LQR 등)을 통해 실제 제어 입력으로 반영하고, 그 결과를 시간에 따라 누적하여 평가 (주변 객체는 로그 기록대로 재생) | 주로 occupancy 예측 등 open-loop 평가 방식(NAVSIM 기반)으로, 주행 환경 내 점유 상태나 모션 정보를 기준으로 평가 |
활용 분야 | 자율주행 planning, 경로 계획 및 의사결정 평가, 차량 제어의 안전성 및 주행 편안성 등 planning 중심 연구 | 3D 점유 예측, open-vocabulary 3D scene understanding, 엔드투엔드 주행, occupancy grid 및 flow 예측 등 3D 장면의 다양한 특성을 분석하는 연구에 적합 |
추가 기능 및 사용성 | 매우 방대한 원천 데이터를 바탕으로 정밀한 planning 평가가 가능하나, 고주파수 센서 데이터로 인해 학습 및 실험에 많은 컴퓨팅 자원이 요구됨 | 다운샘플링과 핵심 정보 선별을 통해 연구자들이 보다 쉽게 접근하고 빠르게 실험할 수 있도록 최적화되어 있으며, occupancy, flow 등 추가 어노테이션을 통해 3D 장면의 다양한 특성을 파악할 수 있는 기능 제공 |
OpenScene은 nuPlan 데이터셋을 기반으로 재구성된 대규모 3D 점유 예측 벤치마크로, CVPR 2024 Autonomous Grand Challenge의 공식 데이터셋입니다. 핵심 목표는 자율주행의 계획(Planning)과 예측(Prediction) 연구를 위해 최적화된 데이터 인프라를 제공하는 것
# 점유 라벨 생성 예시
def generate_occupancy(lidar_frames):
voxel_grid = np.zeros((256,256,32), dtype=bool)
for frame in lidar_frames:
points = frame['points']
# 좌표 변환 (월드 → 에고 좌표계)
points_ego = transform_to_ego(points)
# 복셀화
indices = (points_ego / 0.2).astype(int)
voxel_grid[indices] = True
return voxel_grid
graph TD
A[nuPlan 원본] --> B[불필요 데이터 필터링]
B --> C[시나리오 태깅]
C --> D[점유 라벨 병합]
D --> E[최종 OpenScene 패키징]