작성자 : 이화여자대학교 김수현
Matching networks for one-shot learning (2016'NIPS)
Siamese Neural network for one-shot image recognition (2015' ICML)
: CNN 기반의 feature extractor 도입
Prototypical networks for few-shot learning (2017' NIPS)
: Prototype - class별 support 데이터의 평균 위치로, 각 class를 대표하는 역할
: Prototype과 query 데이터끼리의 거리 계산 -> 기존 방식보다 계산량 감소, 구조 단순화
Meta-learns θ -> fine-tuning을 통한 transfer learning으로 빠른 학습을 가능하게 한다.
1) Support 데이터 S를 이용해 fine-tuning한다.
2) Query마다 classification score을 predict한다.
3) Query에 대한 loss를 이용해 θ를 optimize한다.
MAML은 약간의 업데이트로 서로 다른 task로 각각 최적화한 뒤(Adaptation), 이렇게 최적화된 각각의 모델로부터 gradient를 구해 서로 다른 task에 빠르게 최적화할 수 있는 공통의 초기 weight를 찾는 방식(meta-learning)으로 학습을 진행한다.
위 그림에서 adaptation을 의미하는 회색 실선은 각 task의 Loss(1, 2, 3)를 계산해 모델을 업데이트하는 것을 나타낸다. 이렇게 서로 다른 task로부터 업데이트함으로써 특정 task에 overfitting되는 것을 방지할 수 있다.
Meta-Learning을 의미하는 검은 선은 위에서 각각 task에서 계산했던 gradient를 모아 gradient의 gradient를 계산해 모델을 업데이트하는 것을 의미한다. 이 과정에서 여러 task에 빠르게 최적화할 수 있는 공통의 weight로 점점 업데이트되고(검은 실선), 이렇게 찾은 weight로부터 다시 특정 task에 모델을 adaptation함(회색 점선)으로써 우리가 원하는 target task에 빠르게 최적화할 수 있다. 이러한 adaptation/meta-learning 과정을 최적의 weight를 찾을 때까지 반복함으로써, 우리가 원하는 target task에 빠르게 수렴하는 모델을 얻을 수 있다.
Generater, Embedder, Discriminator
Meta learning architecture
https://lilianweng.github.io/lil-log/2018/11/30/meta-learning.html#model-based
https://www.youtube.com/watch?v=MaGudzppu3I&t=11567s
https://www.youtube.com/watch?v=hE7eGew4eeg&t=687s
http://dsba.korea.ac.kr/seminar/?mod=document&pageid=1&keyword=few&uid=63
https://openaccess.thecvf.com/content_ICCV_2019/html/Zakharov_Few-Shot_Adversarial_Learning_of_Realistic_Neural_Talking_Head_Models_ICCV_2019_paper.html
https://www.kakaobrain.com/blog/106
투빅스 14기 김상현
이번 강의는 few-shot learning에 대한 survey로 투빅스 김수현님이 진행해주셨습니다.
Few-shot learning의 개념과 알고리즘들의 종류 및 원리에 대해 이해할 수 있었습니다.
유익한 강의 감사합니다!
투빅스 14기 박준영
이번 강의는 few-shot learning에 대한 survey로 투빅스 김수현님이 진행해주셨습니다.
기존의 DNN은 큰 규모의 training dataset이 필요한 한계가 있다. 적은 수의 training set으로 학습시키기위해 Transfer Learning이 고안되었다.
few-shot learning 알고리즘의 종류는 metric-based, model-based, optimization based가 있다.
metric-based learning 방법 같은 경우 train data인 support data와 test data인 query데이터의 유사도를 측정하는 방식이다. 주어진 support 데이터를 feature space에 나타내어 같은 class의 데이터는 가깝게 두고, 다른 class 데이터는 멀어지게 학습한 뒤에 test데이터를 유클라디안 or cosine 유사도가 가까운 train 데이터의 class로 예측하는 방식이다.
optimization based learning의 경우 few-shot문제를 parameter optimization problem으로 생각하여 gradient의 backpropagation을 통해서 학습을 시킨다. 이때 few-shot optimization을 위해 MaML 최적화 방법을 사용했다. MAML 최적화 방식은 서로다른 task로 최적화 한뒤 각기다른 모델의 gradient를 구해 공통의 weight를 찾는 방식으로 최적화를 진행한다. 이를 통해 특정 task에 overfitting문제를 해결할 수 있었다. 하지만 계산량이 많고 복잡하고 large model의 경우 training하기 어렵고 class 별로 따로 학습해야하는 불편함이 있다.
model-based learning 방법의 경우 모델의 내부나 외부에 기억장치를 별도로 두어 모델의 학습 속도를 조절한다.
Few-shot learning의 개념과 종류에 대해 배울 수 있었던 유익한 강의였습니다. 감사합니다!
투빅스 13기 이예지:
이번 강의는 ‘Few-shot learning survey’ 강의로, 김수현님이 진행하였습니다.
기존 한계
Few-Shot Meta Learning
Few-shot Learning 알고리즘
헷갈리는 내용에 대해 정리할 수 있는 기회가 되는 강의였습니다!
좋은 강의 감사합니다 :)
투빅스 12기 김태한
이번 강의는 few-show learning에 대하여 김수현님께서 진행해주셨습니다.
few-shot learning은 기존의 많은 양의 dataset으로 학습을 해야하는 DNN을 transfer learning을 이용하여 적은 양의 dataset으로 학습시키는 방법입니다. 이때 meta learning은 학습하는 방법을 학습하는 것으로 few-shot meta learning을 통해 few-shot task의 분포를 학습하는 방법도 있습니다.
이러한 few-shot learning의 알고리즘에는 metric-based, model-based 등의 방법이 있으며, 각 task의 loss를 계산 후 초기 공통 weight를 찾는 optimization based learning도 있습니다.
특히 마지막에 나왔던 Few-Shot Adversarial Learning of Realistic Neural Talking Head Models (2019' ICCV) 논문의 내용과 결과는 매우 흥미로웠습니다.
좋은 강의 감사합니다!
투빅스 14기 김민경
투빅스 11기 이도연
Few-shot Learning survey로 few-shot에 대한 개념부터 few-shot을 적용한 generation task의 논문까지 다뤘습니다. 좋은 강의 감사합니다!
투빅스 13기 신민정
이번 세미나는 김수현님께서 강의해주셨습니다.
Few-Shot Meta Learning은 task자체에 optimization시키는 것입니다. 즉 meta-learner를 few-shot 분포에 맞게 학습시킵니다.
Few-Shot Meta Learning의 과정은 다음과 같습니다.
1. Training episode(S,Q)를 샘플링
2. Classification model()를 생성
3. Query의 label을 predict
4. Query classification loss로 θ를 optimize
Few-Shot Learning의 알고리즘은 Metric-based, Model-based,Optimization based로 분류할 수 있습니다.
Few-shot learning,Meta-learning의 개념을 잡을 수 있는 아주 유익한 강의였습니다. 감사합니다.
투빅스 14기 정재윤
이번 주는 few-shot learning survey를 주제로 김수현님께서 강의해주셨습니다.
Few- shot learning에 대해서 한 번 깔끔하게 집고 넘어갈 수 있었던 강의였습니다.
투빅스 14기 한유진
meta learning, transfer learning, fine tuning 등 헷갈리는 것들을 다시한번 정리해볼수 있었던 수업이었습니다. 내용이 무척 어려움에도 불구하고 알고리즘을 이해하기 쉽게 열심히 설명해주셔서 좋았습니다! 감사합니다!