작성자 : 투빅스 13기 이재빈
Contents
- Introduction
- Meta-Learning & Few-shot Scenario
- Approaches
Summary : Learning to learn
기존 ML/DL 방법론에는 한계가 존재합니다.
Large dataset
(+Large model) 을 통해 학습을 진행해야만 좋은 성능이 보장됩니다. one task
에만 적용 가능합니다. (= 학습한 것만 수행할 수 있습니다.)Problem
large dataset
? general-purpose
AI system in the real world?long tail
?적은 데이터만을 가지고도, 새로운 개념과 기술을 빠르게 학습하고자 합니다.
우리는 Braque 와 Cezanne 를 잘 알지 못해도, 몇 개의 그림만으로 그림 간의 유사성을 파악하여, 새로운 그림을 봤을 때 판단을 내릴 수 있습니다.
이처럼 사람은 기존의 경험을 기반으로, 몇 번의 학습만으로 구분하는 방법을 배워, 여러 개의 개념을 빠르게 학습할 수 있습니다.
Goal : Learning to learn
학습을 위한 학습
적은 데이터로도 일반화가 가능하도록 학습시키는 것이 목표입니다.
Like Human Brain!
적은 데이터를 통해, 이미 알고 있는 것 처럼,
기존의 경험 (experience) 을 기반으로 새로운 다양한 (+ 관련 있는!) Task 를 처리하고자 합니다.
ex. 개와 고양이를 보고 코끼리로 분류하기
관측치마다 정답 label이 달려 있는 데이터셋을 이용하여 학습
ex. Regression, Classification, Neural Network, ...
train
: task data 를 learning algorithm 으로 학습시켜, predictor 를 만들고,
test
: 새로운 test data 를 predictor 를 통해 예측하여 prediction 값을 도출합니다.
높은 정확도를 비교적 짧은 시간 내에 달성하고자,
pre-trained 되어 있는 모델을 가져와서, 주어진 목적에 맞게 fine-tuning 시키는 것
pre-trained
: 대규모 말뭉치 & 컴퓨팅 파워를 통해 만들어진 embedding 값을 가져옵니다. 해당 embedding 에는 말뭉치의 의미적, 문법적 맥락이 모두 포함되어 있습니다.
fine-tuning
: 이후 embedding을 입력으로 하는 새로운 딥러닝 모델을 만듭니다. 우리가 풀고 싶은 구체적인 task와, 가지고 있는 소규모 데이터에 맞추어, embedding을 포함한 모델 전체를 update 합니다.
머신러닝 모델 개발 시간이 많이 걸리는 반복적인 작업을 자동화 하는 프로세스
[Data Prep → Feature Engineering → Modeling → HyperParameter Tuning]
🎞 Facebook Research - Learning to learn: An Introduction to Meta Learning
1. Transfer Learning / 2. Multi-task Learning / 3. Semi-supervised Learning
- Multi-task Learning
서로 연관 있는 과제들을 동시에 학습
- Semi-supervised Learning
label 이 달려있는 데이터와 label 이 달려있지 않은 데이터를 동시에 학습
위의 세 개의 Learning Algorithm 과 Meta-Learning 은,
Supervised Learning 에서는,
input 를 통해 output 를 가장 잘 설명해 주는 함수 를 찾는 것을 목표로 하며,
학습 Dataset 가 주어졌을 때 이에 최적화 된 weight 를 찾는 것을 목표로 합니다.
Meta Learning 에서는,
와 를 함께 이용하여, 를 찾아 감으로써 new task 에 빠르게 적용하고자 합니다.
N
: class 수, K
: example 수 N-way K-shot
Training Set 을 여러 개 sampling 합니다. 모델은 다양한 범주로부터 훈련된 Task 를 통해 최적의 성능을 낼 수 있도록 Training 됩니다. Training 을 마치게 되면, novel data 로 구성된 Task 로 Test 를 진행합니다.Task Sampling
: Support Set Sampling
: Query Set Sampling
: Meta-Learning 의 범위는 매우 다양합니다.
📑 Meta-Learning in Neural Networks: A Survey (2020, T Hospedales)
Meta-Learning 에는 크게 세 가지의 접근 방식이 존재합니다.
🗣 Meta-Learning Symposium Talk (NIPS 2018, Oriol Vinyals)
✔︎ Learning the Metric Space
Train Neural Networks trying to Ingest Datasets
모델의 내부나 외부에 기억장치(memory)를 별도로 둠으로써, 모델 학습속도를 조절할 수 있게끔 합니다.
✔︎ Learning the Initializations
Joining Blooket has been a game-changer for my virtual classrooms! The ease of Blooket Join and interactive features make learning so much more enjoyable for my students. I'm curious if there are any specific tips you have for maximizing the collaborative aspect of Blooket Join. Would love to hear your thoughts!