
BEVFormer 논문을 리뷰한 후, nuScenes 데이터셋을 기반으로 학습 및 평가를 수행하도록 설계된 BEVFormer 공식 소스코드를 활용하여 Morai에서 제공된 데이터셋을 가공하고, 이를 통해 모델 학습과 실시간 추론 과정을 기록하고자 합니다.
향후 실세계 차량에 적용 가능한 자율주행 인지 모델을 개발하는 데 필요한 기초 기술(데이터셋 핸들링)를 마련하기 위해, 이 시리즈로 얻고자 하는 스킬은 아래와 같습니다.
1. 대규모 자율주행 데이터셋 구조의 이해
: Waymo, KITTI, nuScenes와 같은 대규모 자율주행 데이터셋을 다뤄보며 전체 구조를 파악하고, 이러한 데이터셋이 현재 자율주행 연구와 산업에서 어떤 역할을 하는지 탐구합니다.
2. 현 연구동향에서 인지 모델의 데이터 활용 방식
: 자율주행을 위한 인지 모델들이 대규모 데이터셋을 어떻게 활용하여 연구 분야에 적용되는지 분석합니다. 특히 BEVFormer가 nuScenes 데이터를 기반으로 어떻게 학습되고 최적화되는지 살펴봅니다.
3. 커스텀 데이터셋 설계 벤치마킹
: 대규모 데이터셋을 벤치마킹하여 최신 연구 결과를 빠르게 적용하고, 문제 검증을 효율적으로 수행할 수 있는 커스텀 데이터셋 구조를 설계하는 방법을 모색합니다. 이를 통해 실세계 적용 가능성을 높이고자 합니다.
4. OpenMMLab 기반 컴퓨터 비전 연구 입문
: OpenMMLab의 핵심 라이브러리인 MMCV, MMDetection, MMDetection3D를 활용하여 컴퓨터 비전 연구의 기초를 다지는 과정을 탐구합니다. 특히 자율주행과 관련된 2D/3D 객체 탐지 및 시각 데이터 처리 기술을 학습하며, nuScenes와 같은 대규모 데이터셋을 기반으로 한 모델 구현과 실습을 통해 실질적인 연구 역량을 키우고자 합니다.
다음 포스팅은 Nuscenes데이터셋에 대한 상세 구조와 설명으로 찾아뵈겠습니다.