[Paper Review]Look Closer: Bridging Egocentric and Third-Person Views with Transformers for Robotic Manipulation

gredora·2023년 7월 21일
0

Paper Review

목록 보기
16/20

Abstract

precision based manipulation from visual using RL는 기존 방식의 어려움을 해결했습니다. 하지만 정밀한 motor control은 visual input만으로 해결하기 여렵습니다. 이를 위해 egocentric view와 3인칭 view를 사용하여 cross attention으로 해결한 것이 본 논문의 contribution입니다.


Introduction

기존의 방식들은 세세한 calibration, predefined action 등 많은 세팅을 필요로 합니다. 이를 해결하기위해 calibration이 필요없는 egocentric, third person view system을 제안합니다. 3인칭에서의 global 정보 뿐아니라 egocentric으로 local 정보를(ROI) 얻으므로 더 좋은 성능을 보입니다. 정보 fusion을 위해 cross attention을 사용하고 이는 RL policy에 활용됩니다. 4개의 task를 제시하고 해당 task에서의 성능을 실험을 통해 제시합니다.


Related Work

추후 보완

profile
그래도라

1개의 댓글

comment-user-thumbnail
2023년 7월 21일

기존의 어려움을 해결하는 새로운 방식에 대한 논문이 정말 흥미롭게 읽혔습니다. 특히, egocentric view와 3인칭 view를 활용하여 정밀한 motor control 문제를 해결하는 아이디어가 독특하다는 생각이 들었습니다. 제시된 4개의 task에서 좋은 성능을 보여준 점도 멋진 점 같아요. 앞으로의 연구에 많은 기여를 할 것 같습니다. 잘 읽었습니다!

답글 달기