learning_rate (보보)

learning_rate

보보

GIST 기계로봇공학부 석사과정 / 왕도는 없다.

글 시리즈 소개

태그 목록

전체보기(7)
RL(3)
marl(1)
Paper(1)
LLM(1)
Agentic AI(1)
aws(1)
agent(1)

전체보기 (7)RL(3)marl(1)Paper(1)LLM(1)Agentic AI(1)aws(1)agent(1)

AIX -2

에이전트 코딩 시대, 우리가 갖춰야 할 태도코덱스 5.4 써보기에이전트 시대는 세 가지 근본적 패러다임 전환을 요구한다.일하는 방식의 전환 : 결과물 -> 장치(결과물을 생성하는 시스템 harness: llm 을 제어하는 장치 느낌)(예를들면 지피티한테 영어로 하지마

2026년 3월 23일

0개의 댓글

AIX-1

유료버전을 써라,,기반 인프라 \-Vector DBapplication update?\-> 업데이트 요구하지않는 (자동으로 바뀌는)앱들은 전부 클라우드 사용서비스를 외국학생들한테 제공하고, 그 경험과 데이터 가져가세요앞으로 취업 비전 : 인재 흡수 과정 , 내가 만든

aws

2026년 3월 9일

0개의 댓글

(메모) 그림자 분신 Agent의 Policy는 어떻게

분신술의 분신-Agent들은 Policy 와 Reward 설계를 어떻게 했길래 어쩌구저쩌구 >### Multi Agent와 관련된 여러가지 내용들 . 그냥 저냥 정리 끄적끄적 SB3 StableBaseline 하는 이유는?? “멀티에이전트를 학습시키기 위해서

RL marl

2026년 1월 30일

0개의 댓글

Agentic AI 에 대한 생각들

1.LLM의 중요한 한계점1) 제한된 지식 : 개인정보라던가 회사의 내부 자료 같은건 알수가 없다. ( ex 내일 내 구글 캘린더에 어떤 약속이 잡혀있지 ? ) . 방대한 데이터를 학습했지만 독점적인 정보는 모름2) 수동적 : 능등적으로는 프롬프트 없이 작동하지 않음

Agentic AI LLM agent

2025년 7월 3일

0개의 댓글

Integrating Large Language Models for UAV Control in Simulated Environments: A Modular Interaction Approach 논문리뷰-GPT

최근, 인공지능 기술의 발전으로 자연어를 이용한 로봇 제어가 가능해지고 있습니다. 이번 논문에서는 "LLM (Large Language Model) 기반 UAV(Unmanned Aerial Vehicle, 무인항공기) 제어"라는 흥미로운 주제를 다룹니다.논문 제목은 다

2025년 4월 9일

0개의 댓글

(Paper) TD3 - Addressing Function Error in Actor-Critic Methods (2018)

누가 DRL을 묻거든 눈 들어 TD3 논문을 보게하라.

Paper RL

2025년 1월 25일

0개의 댓글

Reinforcement Learning Tutorial -1

행동을 잘 하란 말이야

2024년 12월 27일

0개의 댓글