Encoder/Decoder Transforer 구조인 BART 는 Denosing 학습 방식을 적용하여, Discriminative Task 에 대해서는 RoBERTa 와 유사한 성능, Generation Task 에 대해서는 SOTA 를 달성함.