시리즈

[Paper Review] Transformer for NLP

1.Attention Is All You Need

Authors : Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhinsubject : neural inf

2024년 4월 2일

2.(simple) [GPT-1] [GPT-2] [GPT-3]

GPT1은 transformer의 decode 부분의 Masked multi-head self-attention만을 사용함.unlabeld corpus는 labeled corpus보다 훨씬 많으니까, unlabeld corpus(대량 언어 데이터)에 pretrainin

2024년 4월 20일