딥러닝은 y = Wx + by=Wx+b 에서 최적의 WW(weight)와 bb(bias)를 찾는 과정!
Linear 레이어는 선형 변환을 활용해 데이터를 특정 차원으로 변환하는 기능을 합니다. 100차원의 데이터를 300차원으로 변환한다면 데이터를 더 풍부하게 표현하는 효과가 있고, 반대로 10차원의 데이터로 변환한다면 데이터를 집약시키는 효과가 있음.
Parameter가 많은 것이 최고인가?
No. 지나치게 많은 Parameter는 과적합(Overfitting) 을 야기. 학생이 문제만 보고 정답을 외우는 것과 같음.
Weight의 형태만 선언해 주면 그 파라미터 값을 임의의 실수가 채우고, 수많은 데이터를 거치며 가장 적합한 Weight를 알아서 찾아가는 과정이 바로 훈련(Training)
정보를 집약시키자
Convolution 연산이 입력의 형태를 변형시킨다
집약된 정보의 복원