Monocular / Stereo / RGB-D SLAM의 특징을 설명해주세요. 각각 방식의 장점과 단점은 무엇인가요?

SJ·2025년 7월 7일
0

이 게시글은 장형기님의 SLAM 기술면접 질문 100선에 대한 제 나름대로의 답을 정리해 놓은 것입니다.


Monocular SLAM

단일 카메라를 사용하는 SLAM으로 직접적으로 Depth를 얻기가 불가능하기 때문에 추정이 불가피한 방식입니다.

  • 장점

    • 저렴한 비용: 카메라 하나만 사용하기 때문에 매우 저렴

    • 낮은 전력 소비: 비교적 적은 데이터 처리량으로 전력 소비가 적음

    • 간단한 구현: 하드웨어 구성이 간단하여 시스템 구현이 용이

  • 단점

    • 스케일을 모름: 단안카메라는 멀리있는 큰 물체나 가까이 있는 작은 물체나 똑같이 보이기 때문에 그것을 보조해줄 수 있는 다른 것이 없다면 스케일을 알 방법이 없습니다. 이 단점이 가장 큰 단점 중 하나인 것 같습니다.
    • 드리프트에 취약: 갑자기 큰 움직임을 보이거나 회전을 한다면 단안 카메라는 아무것도 할 수 없을 것입니다.

요즘엔 학습을 통해 단안카메라의 depth를 추정하고 map을 구성하는 알고리즘도 많기 때문에 monocular slam의 장점을 극대화할 수 있는 방법이 점점 나올 것이라 생각합니다. 하지만 스케일은 여전히.. 모르겠죠..


Stereo SLAM

두대의 카메라를 사용하는 SLAM입니다.
사람의 눈처럼 일정한 간격을 두고 카메라가 있기 때문에 depth를 계산할 수 있습니다.

  • 장점

    • 비교적 정확한 깊이 및 스케일 정보: 단일 프레임만으로 실제 스케일을 가진 3D 정보를 얻을 수 있음
      (제가 쓸 때는 그래도 많이 부정확하더라고요..)
  • 단점

    • 많은 계산량: 두 장의 이미지에서 실시간으로 depth를 계산하는 과정은 많은 연산을 필요

    • depth 추정 가능 거리가 짧음: ZED 사용해봤을 때 RGB-D 카메라보다 depth 추정 가능 거리가 짧았습니다.


RGB-D SLAM

RGB-D 카메라를 사용하는 SLAM입니다.
계산 없이 직접적으로 깊이 정보를 얻을 수 있습니다.

  • 장점

    • 정확하고 dense한 정보를 얻을 수 있음

    • feature가 없는 환경에서도 작동이 잘됨

  • 단점

    • 하드웨어 비용: 다른 카메라에 비해 비쌉니다.

    • 데이터 처리량: RGB이미지와 depth 이미지를 동시에 처리하기 때문에 데이터 처리량이 많습니다.

그래도 visual SLAM 중엔 아직까지 RGB-D SLAM이 가장 정확한 것 같습니다.
LiDAR와 카메라를 calibration한 것보다는 떨어지지만 그것이 쉽지는 않기 때문에 좋은 방법이 될 것이라 생각합니다.


profile
student

0개의 댓글