
VLM이 text와 vision을 이해하고 추론하는 데 많은 발전을 해왔지만, 여전히 image를 text로 이해하는 방식 때문에 성능 저하가 있었음 따라서 성능 저하 없이 vision 그대로를 이해하는 방식을 제안하고자 함

OOD jailbreak attack에 대해서도 robust하기 위해 ternary inference step을 통해 core jailbreak intent을 알아내는 방식을 제안함

기존의 Backdoor 공격과 달리 VLM embodied agent backdoor로, 어떤 object trigger를 보면 위험한 행동을 하도록 유도하는 backdoor attack 방식을 제안한다.

memory store에 접근하지 않고도 한 번의 interaction으로 memory injection attack을 제안한다.

MLLM에서의 Multi-turn jailbreaking Attack 방법과 Defense 방법을 제안한다.

Rule-based message 구조와 Multi-turn 기법을 이용해 Agent prompt injection을 제안한다.

[논문 리뷰] BADROBOT: JAILBREAKING EMBODIED LLMS IN THE PHYSICAL WORLD (2025.02)

[논문 리뷰] Jailbreaking Embodied LLMs via Action-level Manipulation (2026.03)