:경사를 따라 한 번 내려갈때 얼마만큼 움직일 지에 대한 수치
Gradient Descent Algorithm
알파값을 임의로 설정
learning_rate = 0.1로 임의로 설정
적절히 변경하여 사용 ( Step decay / Exponential decay / 1/t decay )
= Feature Scaling
: 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업
: Feature들의 크기, 범위를 정규화시켜주는 것
: 학습 데이터(Training Set)를 과하게 학습 하는 것
Training : 훈련 데이터
Validation : 모의테스트를 위한 데이터 (튜닝시 사용)
Testing : 테스트 데이터