Language Model : ELMo GPT

Ko Hyejung·2021년 12월 3일

2021 SKT AI

목록 보기

8/12

ELMo

LM pre-training using deep bidirectional LSTM(2 layers)
Contextualized word embedding by linear combinatoin of hidden states

GPT: Transformer Decoder LM

Pretrain large 12 layer left-to-right decoder transformer
Uni-directoinal (forward) LM

GPT: Supervised Fine Tuning

Supervised fine-tuning for each NLP tasks(classification, similarity, multiple choice)
Sentence representation from last token output of last transformer layer

Ko Hyejung

이전 포스트

Pre-trained Language Modeling

다음 포스트

Language Model : ELMo GPT

2021 SKT AI

ELMo

GPT: Transformer Decoder LM

GPT: Supervised Fine Tuning

Pre-trained Language Modeling

Language Model: BERT

0개의 댓글

관련 채용 정보