로봇이 손과 눈 역할을 하고
언어 모델이 높은 수준의 지식을 제공하는 아이디어
즉, 로봇에게 사람과 같은 추론 능력을 부여하자
Q) "어떻게 LLM을 물리적 Task 해결에 사용할 수 있을까?"
A) LLM에서 High-level 지식을 이끌어내는 연구
구현하기 위해서 지시(instruction)에 대한 실행 가능성 평가도 진행
LLM(Say) + affordance functions(Can)
LLM : high-level goal을 위한 유용한 동작들 결정
affordance functions : 계획에 따라 실행할 수 있는 것이 무엇인지 결정하는 기반 제공 (RL 사용)
High-level task를 low-level로 분해하는 작업이 필요
먼저 LLM이 지시문에 맞는 여러가지 답변들을 생성

이로 인해 답변들에 대한 해석력이 증가한다.
function을 계산할 때 BC-Z, MTOpt 등 강화학습 내용이 등장...
강화학습은 꼭 추후 공부 필요
새로운 능력
1. '서랍 열기'처럼 새로운 기술을 시스템에 결합시키기 쉽다..
2. CoT 활용하면 복잡한 Task도 해결 가능성이 있다.
3. 별도 설정없이 다국어 가능하다.
장기적인 Task에 대한 추론 능력이 중요해보인다.
이전 리뷰한 논문에서도 발견된 문제인 주변 환경 정보를 파악하는 능력이 있으면 해결 가능성이 조금 있을지도..