
머신러닝의 세 가지 기둥supervised learning (x를 넣었을 때 y가 나오도록 하는 방식을 찾도록)unsupervised learing (스스로 패턴을 학습하도록)Reinforcement learning (y를 정의하기 어렵기 때문에 reward를 주는 것

기계학습의 기본적인 세 가지 요건 🤔One of the three basic pillars of machine learningsupervised learning ; x를 받았을 때 어떤 y를 내보내야 하는지 찾는 모델unsupervised learning ; 클러스터
업로드중..업로드중..result는 agent의 state(상태)에 따라 결정 -> reward 제공terminal state이 state를 지날 경우 게임을 종료한다return이라는 개념Return = 𝑅1 + 𝛾𝑅2 + 𝛾^2𝑅3 + ⋯ (until ter

reward가 매우 중요함 !!state가 주어지면 어떤 actio을 할 지 policy 세우기Q function : Q(s, a) s상태에서 a할 때 얼마만큼의 보상을 받을지 알려주는 것어떤 s 상태에서 모든 a에 대해 Q(s,a)를 구하기벡터 두 개를 합치면 x =

Q(S,a)=Return if you손으로 계산할 수 없음어떻게 학습할 것인지가 주요한 포인트!최선을 다 했을 때 기대되는 returnBellman Equation을 통해 이를 계산할 수 있음우리는 optimal policy는 알 수 없음이미 알고 있다면, 굳이 Q(s