예전에 공부해두었던 것을 블로그로 포스팅
softmax처럼 값을 class별로 분류할 때, 크게 4개의 거리를 고민해야 한다.
들어가기 전에 geodesic distance란..?

쉽게 말해 구의 표면(구면)을 공간으로 하는 두 점을 잇는 최단 경로
한글로 된 설명은 여기를 참조하시라.

class center와 class 내 샘플 간의 geodesic distance margin을 insert
class center와 class 내 샘플 간의 geodesic distance를 decrease
다른 centers 사이의 geodesic distance를 increase
triplet sample 사이에 geodesic margin 삽입
triplet network에 대한 자세한 설명은 여기를 참고하세요

softmax는 explicit하지 않아서 intra-class appearance variations와 test-scenario 간의 gap 有
inter-class sample의 다양성과 intra-class sample의 유사도를 높이기 위한 식 변경이 필요함
bias (SphereFace 논문에 따라서)로 하고
dot product에 의해 로 바꿀 수 있음
L2 norm에서는 이고 는 radius 로 변경 가능
이 식에 margin을 붙일 수 있다. 이게 바로 마진이 붙은 softmax 식!
마진을 어떻게 주냐 따라 좋게 작용한다.
마진은 이런 것
논문
블로그
Triplet Network : [DeepLearning]Triplet Network
Margin :
- Additive Margin Softmax Loss (AM-Softmax)
- Additive Margin Softmax Loss
- Comparing Angular Margin Loss Functions