정의
목적
NLL 과 크로스 엔트로피: MLE 기반 접근 방식에서 사용되는 비용함수.
선형 회귀에서 MLE
로지스틱 회귀에서 MLE
정의
목표
작동 방식
방정식
스텝 크기에 따른 트레이드 오프
각 데이터 예제마다 모델 파라미터를 업데이트 하는 경사 하강법의 변형
업데이트 규칙 (Update Rule)
왜 SGD 를 사용하는가
제곱 그라디언트의 지수적 감쇠 평균을 사용
옵티마이저가 그라디언트의 스케일에 적응하도록 도움
학습률이 너무 커져 글로벌 미니멈을 지나치는 것을 방지
공식
ADAM 최종 형태
장점