cs231n 강의 중 'Lecture 2 | Image Classification' 을 정리한 내용이다.
Semantic gap
Viewpoint variation
Illumination
Deformation
Occulsion
Background Clutter
Intraclass variation
training 과정에서 시간은 오래 걸려도 test 과정에서 시간은 짧은 것이 좋다. training은 미리 진행해놓고 나중에 실전에서 test를 여러번 적용할 수 있기 때문이다.
K-Nearest Neighbors
L1 Distance와 L2 Distance
k-Nearest Neighbors에서의 k를 몇으로 설정할지, distance는 어떤 것을 선택할지 등 hyperparameter를 잘 설정해야 한다.
문제에 따라 다르므로 여러 번 시도해보는 것이 좋다.
Hyperparmeter를 설정하는 여러 방법이 있을텐데, training data에만 잘 적용되는 아이디어는 좋지 않다. train, validation, test set으로 나누는 것이 이후 unseen data를 다룸에 있어 효과가 좋다.
Parametric Approach