NAVER ENGINEERING DAY(10월)에서 발표되었던 모델 경량화 관련 세션

카파씨 선생님께서 업로드하신 Tokenizer 강의 영상을 보고 정리한 글입니다. 이번 게시물은 강의의 tokenizer의 개념부터 BPE에 대한 설명 파트까지 다루고 있습니다.

이전 포스팅에서는 영상의 앞부분이었던 토크나이저의 개념과 쓰임에 대해서 다뤄봤는데요, 이번 포스팅은 토크나이저의 인코딩과 디코딩 등 실제 쓰임과 가까운 내용을 이야기했던 영상 뒷 부분을 다뤄보려고 합니다.

토크나이저를 다루기 위한 핵심적인 내용은 이미 영상 앞부분에서 다 다루었지만, 후반부에서 부가적으로 설명해주는 내용이 흥미로워서 정리합니다.
이 강의는 인프런에서 무료로 볼 수 있는 하용호 님의 1시간 40분의 짧은 강의입니다. 약 80분 정도의 오프라인 밋업 영상과 20분의 질의응답 세션으로 구성되어 있는데요, 어려운 이론을 다루는 강의가 아니기 때문에 부담스럽지 않게 볼 수 있습니다.
글또에서 진행한 데이터/AI 빌리지 반상회에 다녀온 후기를 작성해봅니다.