
https://www.samsungsds.com/kr/insights/multi-modal-ai.html다음 글을 읽고 정리해봅니다.이번 연구에 multi-modal 관련한 논문을 읽게 되었습니다. 멀티모달이라고 하면, 여러 종류의 입력 데이터를 동시에 처리하

https://www.youtube.com/watch?v=XwlLeVhWCCc위의 영상을 정리한 글입니다.Transformer 기반(red)encoder only우리의 말을 모델이 잘 이해하도록 (blue)decoder only우리가 말을 했을 때 잘 받아침(

참고 블로그: https://inhovation97.tistory.com/31: https://jeinalog.tistory.com/13공부하며 다음 블로그들을 정리하였습니다.사전 학습된 모델(pre-trained model)을 이용하는 것즉, pre
실험을 돌렸는데 epoch 10 정도부터 overfitting이 발생하였고이에 대한 해결책으로 weight decay값 조정을 하라고 조언 받음그래도 50 epoch까지는 돌리는걸 목적으로 하자!그래서 weight decay가 뭔데..?일반적으로 overfittng을