Today I Learned
written by 602
뉴욕대학교 Lecun 교수의 Deep Learning Course,
2020년 강의영상으로 최신 트렌드도 반영한 강의라는 점에서 유용한 코스다.
이번 주차 딥러닝 스터디에서는 10강 Self-Supervised Learning을 다루었다.
처음 접하는 내용이 대부분이라 꽤나 어려웠다🤦♀️
세상의 대부분 이미지는 label이 없다.
Obtain labels using "semi-automatic" process instead
cf) SSL in NLP
비슷한 속성(색)의 이미지들은 embedding된 space내에서의 distance가 더 짧을 것이다
similarity를 이용한 loss function -> distance의 exponential을 softmax 연산을 통해 cross entropy 걸어줌
label이 없는데 이미지들이 관련있다라는걸 어떻게 정의하나?
Data Augmentation을 통해 해결하자!
일반적인 지도학습 과정은 target이 정해져있고 input이 target에 가까워지도록학습이 되는것이고 SSL은 비슷한 두 타겟이 가까워지도록 학습이되는 것인데 target들이 움직이는 문제 발생
즉, 타겟이 고정되지 않음
SimCLR - Google의 아이디어 (ICML 2020)
Using a lot of negative samples
batch size를 미친듯이 늘리자(16384 ...)
MoCo - Momentum Encoder