https://github.com/huggingface/transformers/issues/25063
decoder 모델이나 seq2seq 모델처럼 생성을 하는 모델에서 사용한다. encoder 모델에서는 작동하지 않는다.