
🎓 강화학습(Reinforcement Learning, RL)이란? >강화학습(Reinforcement Learning, RL)은 인공지능(AI)과 머신러닝의 한 분야로, 에이전트(Agent)가 환경(Environment)과 상호작용하면서 시행착오(Trial and

강화학습은 에이전트가 환경과 상호작용하며 시행착오를 통해 최적의 행동을 학습하는 순차적 의사결정 문제이다. 이러한 문제를 효과적으로 해결하기 위해서는 환경의 변화를 수학적으로 모델링해야 하며, 이를 설명하는 핵심 개념이 마르코프 과정(Markov Process)이다.마

Q-Learning을 배우기에 앞서, 먼저 DQN(Deep Q-Network)에 대해 이야기해보자.2013년, 구글 딥마인드는 "Playing Atari with Deep Reinforcement Learning"이라는 논문을 발표했다. 이 논문은 Atari 2600의

🎓 PPO(Proximal Policy Optimization) 알고리즘 개요 2017년, OpenAI는 "Proximal Policy Optimization Algorithms"이라는 논문을 통해, 기존 정책 기반 강화학습의 문제를 해결하고자 한 새로운 접근법을 제

🎓 자율 주차 강화학습 실험 개요 본 프로젝트는 PPO(Proximal Policy Optimization) 알고리즘의 내부 동작 원리를 심층적으로 이해하기 위해 구상되었다. 이를 위해 Unity ML-Agents 플랫폼 상에 자율 주차 시뮬레이션 환경을 신규 구축하