
1.Abstract = Introduction 요약. (거의 같음) 2.Introduction에서 언급하는 내용의 종류 (보통 모든 논문이 intro 에 쓰는 내용들이 있음) 파악하기. Intro와 Experiment 사이에 보통 무엇을 설명하는지, 설명하는 깊이의 정
원문 링크 : https://arxiv.org/pdf/2402.04559킹갓제너럴 뉴립스 2024 논문이다. 현재 상황 : LLM agents가 increasingly adoped as simulation tools to model humans in 사회과학

Personal Finance Use Case chatgpt, safefinance(데이터기반) 3.2. Banking Products and Product Discovery문제는, 사용자 배경에 따라 다른 응답이면 그걸 편향으로 하자! 이렇게 이름, 인종, 성별이 다

llm의 등장으로 편향이유 1) 데이터셋의 영향 2) 모델의 영향현재 연구방향 1) 편향을 어떻게 식별하지? 2) 어떤 때에 편향을 하는거지? 문제점 langchain으로 외부 데이터를 사용하면 어떻게 영향을 줄까??? BBQ?영어로 된 질문 세트? 두

상황 : llm이 계속해서 성장하고, 그들의 application 또한 엄청나게 성장하고 있다.문제 : evaluating llm behavior and crafting effective prompt chain을 하는 것은 remain challenge로 남아있다.구체
논문 제목 : Exploring Large Language Model Based Intelligent Agents : Definitios, Methods, and Prospects 논문 링크 : https://arxiv.org/pdf/2401.03428현재 상

5가지 모듈들을 분류해서, 그렇게 MAS의 모듈을 5가지를 제안했다.generation strategy contexualized : 풀이 없이 시나리오를 가지고 그 시나리오를 가지고 하나하나에 적합하게 만들기 ! pre-defined : 미리 풀을 만들고, 그걸 각각

P(Xn|X1,X2 ,,,, Xn-1) = p(Xn|Xn-1) : 처음부터 그 이전까지의 상태 = 그 이전만의 (X,U,P,R,Y)X : 상태들의 집합U : 행동들의 집합 P : 전이 확률 함수 특정 상태에서 특정 행동을 취하고 다음 상태로 전이될 확률 ! ! ! !

논문 링크 : https://www.nature.com/articles/s41599-024-03611-3.pdf무려 네이처지에 등장한 논문이다!simulation의 정의 ?simulaiton은, computational tool로써 인간 세계 혹은 시스템을 모

논문 링크 : https://dl.acm.org/doi/pdf/10.1145/3613904.3642349참 Problem Solution 구조에 따라 아주 잘 쓴 논문같다. LBT + teachable agent 의 장점 ⇒LBT + teachable age

Abstract llm 기반 모델들이 rapid하게 progress를 이뤄내고 있다. -> However, llm기반 모델들이 성장하는 가장 큰 이유는, '인간' 에 있다. (인간이 그 대화에 input을 집어넣어주기 때문에...!) -> 그렇다면, autonom

내가 정말 찾고 싶어하던 논문을 찾았다. 기쁘다 ! ! ! ! citation은 얼마 안되는 것 같지만, 내가 원하는 논문과 딱 일치 ! 2024 11월 논문이다. 문제 : LLMs가 unintended & harmful한 content를 elicit 할 수 있다.

ethical한 principle과 가치들은 사실 다양한 context와 culture에 따라 다르다.value들은 honesty, fairness, compassion 등등의 가치들이 있다. 자신과 가장 Resonate하는 하나 혹은 여러개의 value를 설정한다.\

2024년 8월 구글에서 발표한 논문이다. 너무나도 흥미로워서 미치겠는...!!https://arxiv.org/pdf/2406.12094”safety learning procdures, such as reinforcement learning with human

LLM은 엄청난 발전을 했다.하지만 customize하는 방법이 좋음(하나만 다 할 수는 없으니...)\-> persona setting! ( LLM-driven human behavior simulation can facilitate insightful exchan
Abstract 이 논문은 5주차-1의 도식화에 따르면 ‘5.해결 framework’에 초점을 맞춘 논문! → 알고보니 하늘님이 예전에 말씀하셨던 논문…인 것 같음ㅎㅎ Introduction 현재 상황 : 많은 llm연구들이 진행되고 있다. 문제 : 여기서의

https://arxiv.org/pdf/2408.15879 일단 acl논문이다. Abstract 일단 LLM이 다양한 분야에 쓰이고 있다. (credit card, Insurance 등등. 이때 insurance policy나 investment plan을 선택하도록
과연 tailored truth가 뭘까?https://arxiv.org/pdf/2501.17273연구 목적: LLM이 인간의 의견을 변화시키는 능력을 측정하고, 다양한 설득 전략(personalization, 조작된 통계 등)이 미치는 영향을 평가연구 방법:인
예시를 들어보자면, 로봇 협업 학습 (예: 물류창고, 공장 로봇들)문제: 서로 다른 환경에 있는 로봇들(예: 로봇 팔, 드론 등)이 유사한 작업을 하지만 환경이나 하드웨어가 조금씩 다름.FRL 활용:각 로봇은 자기가 있는 현장에서 로컬 강화 학습 수행.정책만 공유 →