Reference
참고사항 \- 이때 디코더 멀티헤드 어텐션에 들어가는 인코딩 아웃풋은 각각 키와 밸류의 역할을, 첫번째 멀티헤드 어텐션의 아웃풋은 두번째 멀티헤드 어텐션의 쿼리로 기능을 한다 \- 마스크드 멀티헤드 어텐션은 예측시 정답지를 보는 것을 방지하기 위하여, 아래삼각행렬
전처리 함수 transformers 정의불러오기 함수 CustomedDataset 정의torch용으로 전처리하는 함수 DataLoader 정의신경망 제작/ 불러오기신경망 수정하기사용할 optimizer 정의파라미터 업데이트될 레이어 정하기criterion (loss f