
안녕하세요. 오늘은 LLM을 추론하는 방법론을 제시한 논문을 리뷰해보도록 하겠습니다. 논문에서 제시하는 프레임워크인 SELF-DISCOVER는 이름 그대로 주어진 작업(task)에 대해서 스스로 추론 방식을 찾아내도록 구성한 구조인데요.

이번 포스트에서는 음성 컨퍼런스로 유명한 interspeech의 2024 논문들을 소개해보려고 합니다. Interspeech 컨퍼런스는 등재되는 논문이 워낙 많아서 저도 다 볼 수는 없었고, LLM 관련된 논문을 골라 읽어보았습니다.

이번 게시물에서는 최근에 뜨거운 관심을 받았던 dialogue모델인 Moshi를 소개해보려고 합니다. Technical report가 워낙 분량이 많아서 전부 다루기는 어려웠고, 3.Model, 4.Training 파트 위주로 다뤄보려고 합니다.

이번 포스팅에서는 Meta에서 10월에 공개한 SpiritLM 논문에 대해서 리뷰해보도록 하겠습니다.

3.8B 파라미터를 가진 소형 언어 모델Phi-3.5-Mini에 audio와 vision을 연결한 멀티모달 모델에 대한 논문 리뷰입니다.