give noise to the parameters of PLMs before finetuning
reduce the risk of overfitting the pretraining tasks and data.
PLM에서 사용하는 다양한 파라미터들이 있다.
다른 방법들에 붙였을 때에도 성능이 높게 나옴.
데이터가 적게 사용되었을 때에도 비교적 높은 성능을 보임.
람다가 너무 작거나(0에 가깝거나) 크면 (0.3에 가까울때) 최적점을 찾아가지 못함.