- Perceptron (The simplest Neural Network) : 가장 간단한 Neural Network
- Activation Function전에 사실상 output이 나옴
- input과 output의 dimension을 먼저 확정한 후, Weight Matrix를 정해야함 (일반적인 정의)
Multilayer Perceptron (MLP)
- layer의 개수는 여러개로 늘릴수있음
- how can we add non-linearity? > Add Activation functions!
- Sigmoid : 이진분류 (로지스틱 회귀)
- Computing Gradients for MLP (2-layers) and Backpropagation
- 모델을 definition 할때, forward function에서 input이 들어왔을때 어떻게 처리할것인 가에 대해 definition함
- output를 가지고 Loss를 계산함 > 이후 계산된 Loss를 통해 Weight Matrix를 update하는 것이 Backpropagation 과정
IRCAN: Mitigating Knowledge Conflicts in LLM Generation via...