모호한 명령에 대해서 LLM이랑 질문을 주고 받으며 사용자 명령이 명확한지, 모호한지, 실행 불가능한지 추론하는 것
- 주요 타겟 : "he looks sleepy" 처럼 구조화되지 않는 자연어
2가지 방법
Uncertainty를 측정하는 방법
→ LLM 기반 상황 인식을 통해 Uncertainty한 명령의 실행 가능성을 확인하는 방식 소개
Benchmark
주요 Contribution
BERT, POMDP 등으로 Uncertainty를 해결하려 했지만 이는 고정된 데이터 기반에서만 가능
Uncertainty 추정
Uncertainty를 분석하고 설명하는 방법 제시
로봇이 프롬프트 마지막 줄을 작성하여 실행 가능성 검사 → "Yes" or "No"로 대답 가능하면 LLM이 이진 분류 수행
→ 생성된 답변으로 키워드 기반 구별 진행(모호함, 실행 불가능) → task를 실행 가능하다고 판별하면 Uncertainty를
줄이기 위한 질문을 생성하며 Certainty를 키워나간다