-
이 논문은 컴퓨터 소프트웨어 에이전트를 사용하여 인간 행동을 모방하는 방법을 제안합니다.
-
이 에이전트들은 인간과 같은 일상적인 행동을 수행하며, 예를 들어 일어나서 아침 식사를 하고 일하러 갑니다.
-
또한 예술가나 작가처럼 창작 활동을 하며, 서로 의견을 나누고 대화를 합니다.
-
이러한 생성적 에이전트를 가능하게 하기 위해,
- 자연어를 사용하여 에이전트의 경험을 기록하고
- 시간이 지남에 따라 이를 고찰하고 계획하며
- 동적으로 검색하여 행동을 계획하는 방식으로 에이전트 아키텍처를 확장합니다.
-
이를 위해 The Sims에서 영감을 받은 대화형 샌드박스 환경에
- 25개의 에이전트를 인스턴스화하여 사용자가 자연어를 사용하여 상호 작용할 수 있도록 합니다.
-
평가 결과, 이러한 생성적 에이전트는 믿을 만한 개별 및 비상 교류 행동을 생성합니다.
-
예를 들어, 하나의 에이전트가 밸런타인 데이 파티를 열고 싶다는 것을 사용자가 지정하면,
- 다른 에이전트들은 이에 대한 초대장을 자동으로 퍼뜨리고 새로운 지인을 만들며 파티에 함께 참석하기 위해 날짜를 구합니다.
-
이 논문은 대규모 언어 모델과 컴퓨터 상호작용 에이전트를 융합하여
- 인간 행동의 믿을 만한 시뮬레이션을 가능하게 하는 아키텍처 및 상호작용 패턴을 제안합니다.
-
이러한 생성적 에이전트는 상호작용 게임, 대화형 시뮬레이션, 인간-컴퓨터 상호작용 등 다양한 분야에서 사용될 수 있습니다.
-
이 논문은 인공적인 사회를 구축하여 실제 인간 행동을 반영하는 상호작용적인 시스템을 만드는 방법을 제시합니다.
-
또한 이는 사람들이 드물지만
- 어려운 대인 관계 상황을 처리하는 방법을 연습하도록 교육하고
- 사회과학 이론을 검증하고
- 인간 처리 모델을 만들어 가설 검증 및 사용성 테스트에 사용할 수 있습니다.
-
이러한 시스템은 인간-컴퓨터 상호작용 및 사회 로봇 등에도 사용될 수 있으며, 복잡한 인간 관계를 탐색할 수 있는 비-게임 캐릭터와 같은 역할을 할 수 있습니다.
-
그러나 인간 행동의 공간은 방대하고 복잡합니다.
-
따라서 이 논문에서는 단일 시점에서 믿을 만한 인간 행동을 시뮬레이션하는 대규모 언어 모델을 기반으로 한 접근 방식보다는
- 상호작용 에이전트가 장기적인 일관성을 유지하도록 새로운 상호작용, 갈등 및 사건이 발생하고 사라지는 것과 관련된 경험을 지속적으로 기록하는 에이전트 아키텍처가 더욱 적합하다는 주장
- 그러나 이러한 접근 방식은 오랜 기간에 걸쳐 관련된 이벤트와 상호작용을 검색하고 이러한 기억들을 종합하여
- 높은 수준의 추론을 수행하고 이를 계획 및 반응에 적용하는 것이 필요
-
따라서 본 논문에서는 생성 모델을 활용하여 믿을 만한 인간 행동을 모방하는 생성적 에이전트를 소개하고, 그들이 개인 및 집단 행동의 믿을 만한 시뮬레이션을 생성하는 것을 증명합니다.
-
생성적 에이전트는
- 자신, 다른 에이전트 및 환경에 대한 다양한 추론을 수행하고
- 일상 계획을 작성하며,
- 그 계획을 실행하고 필요할 때 반응 및 재계획합니다.
-
예를 들어, 생성적 에이전트는
- 아침을 준비하고 출근하며,
- 작가는 작품을 창작하며, 의견을 형성하고 서로 인식하며 대화를 시작하며, 지난 날을 기억하고 다음 날을 계획합니다.
-
이러한 추론, 계획 및 반응은 에이전트의 행동의 순간적인 이해뿐만 아니라 에이전트 행동의 장기적인 추세에서도 의미가 있습니다.
-
이 논문에서 제안하는 에이전트 아키텍처는 대규모 언어 모델을 이용하여 생성적 에이전트를 활성화하며,
- 에이전트의 경험을 자연어로 기록하고
- 시간이 지남에 따라 이러한 기억을 상위 수준의 추론으로 합성하고 동적으로 검색하여 행동 계획을 수립하는 기능을 제공합니다.
- 이러한 아키텍처는 The Sims와 같은 게임에서 영감을 받은 대화식 샌드박스 환경을 채우기 위해 생성적 에이전트를 인스턴스화합니다.
- 최종 사용자는 자연어를 사용하여 25개의 작은 마을 에이전트와 상호작용할 수 있습니다.
- 이러한 에이전트는 사용자가 게임 환경을 변경하거나 명령을 내리면 반응하며, 자신의 부적절한 행동을 수정하며, 다른 에이전트와의 관계를 구축하며, 행동을 조정하여 계획대로 마을에 함께 나타납니다.
-
본 논문은 제안하는 에이전트 아키텍처 및 생성적 에이전트에 대한 두 가지 평가를 수행합니다.
- 첫째, 제어된 평가를 통해 에이전트가 고립되어 있을 때 개별적인 행동을 믿을 만한지를 테스트하였습니다.
- 둘째, 열린 환경에서 여러 에이전트 간의 상호작용이 어떻게 일어나는지 이해하기 위해 생성적 에이전트가 2일 동안 서로 상호작용하는 평가를 수행하였습니다.
- 기술적인 평가에서는 에이전트의 지식과 행동에 대해 자연어로 "인터뷰"하여
- 에이전트가 캐릭터를 유지, 기억, 계획, 반응 및 정확한 추론을 수행할 수 있는지를 평가했습니다.
- 이 때, 에이전트가 기억을 검색하지 못하거나 기억을 과장하거나 언어 모델에서 지나치게 형식적인 언어나 행동을 상속하는 경우에 가장 흔한 오류가 발생했습니다.
-
이 논문에서 제안하는 생성적 에이전트 및 에이전트 아키텍처의 기여는 다음과 같습니다.
- 동적으로 변화하는 경험과 환경에 따라 조건화된 믿을 만한 인간 행동의 실체인 생성적 에이전트
- 에이전트가 기억을 기록, 검색, 추론, 상호작용 및 동적으로 변화하는 상황을 통해 계획을 세울 수 있는 혁신적인 아키텍처
- 구성 요소의 중요성에 대한 인과 효과를 입증하는 제어 평가 및 엔드투엔드 평가
- 상호작용 시스템에서 생성적 에이전트의 기회, 윤리 및 사회적 위험에 대한 논의.
- 이 논문은 사용자가 팬덤적 관계를 형성하는 위험을 완화하고,
- 딥페이크 및 맞춤형 설득에 기인하는 위험을 완화하고,
- 디자인 프로세스에서 인간 이해 관계자를 대체하지 않고 보완하는 방식으로 생성적 에이전트를 적용해야 함을 주장합니다.