DroidBot-GPT: GPT-powered UI Automation for Android

DeepDIV!·2024년 6월 6일

DroidBot SKT AI Fellowship 6기 논문 리뷰

논문 리뷰

목록 보기

2/10

Paper : https://arxiv.org/pdf/2304.07061

간단하게 정리함 (선행 논문으로 판단되면, 추후 더 자세히 리뷰할 예정)

Contribution

GUI info를 natural language description으로 바꿈
LLM이 task input을 판단해서 앱 내에서 올바른 action을 취할 수 있도록 만듬
33개의 task에 대한 자체 dataset을 구축함

Model Architecture

Conclusion

AutoDroid에 비해 단점이 많음

HTML style이 아닌 natural language prompt를 사용함
- LLM에 들어가는 query양이 방대해짐
NLP를 사용하기 때문에, unnamed GUI element를 사용할 수 없음
task 수행 성공률이 낮음
- early termination
- redundant operation
- GPT’s response not meeting the requirements

연구에 DroidBot-GPT가 도움이 될 만한 부분

후속 논문인 AutoDroid가 더 뛰어난 method를 제공하고 있기 때문에 이 논문에서 얻어갈 부분이 크게 없을 것 같음

이전 포스트

DroidBot : A Lightweight UI-Guided Test Input Generator for Android

다음 포스트

AutoDroid: LLM-powered Task Automation in Android

0개의 댓글