Back propagation에서 MNIST를 분류하고 싶다고 해서 해봤다.
코드와 결과는 여기에 있다. 추가된 건 모델클레스 밖에 없다. 지금와서 생각해보면 셔플하고 나서 train / validation set으로 나눠주면 더 나을 것 같기도 하다.
호기심에 tanh와 relu 두 가지를 비교해봤는데 이 과제에서는 relu가 좀더 안정적으로 보인다는 점 말고는 큰 차이를 모르겠다.