Vocabulary : [h, e, l, o]
Example training sequence : "hello"
첫 번째 output layer vector의 최대값을 보면 'o' 단어를 예측해 내게 된다. 하지만 target char가 'e'이므로 해당값 2.2에 집중하여 이에 맞게 학습이 진행되도록 loss가 계산이 된다.
At test-time, sample charactoers one at a time, feed back to model
이전의 강의에서 깊게 다루었던 내용이라, 다시 복기하는 마음으로 간단하게 정리했다.
adversial attack
defernce against adversarial attack