
David Silver Reinforcement Learning 강의를 참고한 정리글입니다. AI agent 붐이 휘몰아치는 요즘.. agent하면 또 강화학습..지도적 학습과 다르게 목적 agent가 (reward signal)만 알려줌리워드 = 피드백이라고 하면,

LDA(Linear Discriminant Analysis) PCA처럼 차원축소하는 방법 중 하나 다른점은 PCA보다 ‘분류’에 초점을 맞춘 것. PCA가 전체 데이터의 분산을 가장 크게 만들어, 가장 많은 정보를 담고 있는 축을 찾는 것에 집중했다면 (차원 축소가

NMF (Non-negative Matrix Factorization) 음수를 포함하지 않은 행렬 X를 음수를 포함하지 않은 W,H의 곱으로 분해하는 알고리즘. $$ X=WH $$ PCA가 데이터의 분산이 가장 크고 수직인 성분을 찾았다면, NMF 는 음수가 아닌
Gradient Descent - 경사하강법 경사하강법이란? 함수의 최솟값을 찾는 최적화 이론(optimization) 기법 주로 함수의 파라미터 (베타 값, w 가중치 등) 을 결정할 때 활용 파라미터 w이 무엇일 때, Loss function 변화가 가장 작은