[2025/W16] ๐Ÿค— Weekly AI Research

Skyยท2025๋…„ 4์›” 19์ผ

Weekly AI Research Digest

๋ชฉ๋ก ๋ณด๊ธฐ
16/89

2025๋…„ 16์ฃผ์ฐจ์— ๊ณต๊ฐœ๋œ ์ฃผ๋ชฉํ• ๋งŒํ•œ AI ๋ถ„์•ผ์˜ ๋…ผ๋ฌธ๋“ค์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

TL;DR

'์ฐจ์„ธ๋Œ€ AI ๋ชจ๋ธ ๊ฐœ๋ฐœ ๋ฐ ํ›ˆ๋ จ' ๋ถ„์•ผ์—์„œ๋Š” ๊ทผ๋ณธ์ ์ธ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜์™€ ํ•™์Šต ๋ฐฉ์‹์˜ ํ˜์‹ ์— ์ง‘์ค‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋Œ€ํ‘œ์ ์œผ๋กœ ํ…์ŠคํŠธ์™€ ์‹œ๊ฐ ์ •๋ณด๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ์ฒ˜์Œ๋ถ€ํ„ฐ ํ•จ๊ป˜ ์‚ฌ์ „ ํ›ˆ๋ จํ•˜๋Š” InternVL3 ๋ชจ๋ธ, ์ ์€ ์ปดํ“จํŒ… ์ž์›์œผ๋กœ๋„ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ๋น„๋””์˜ค ์ƒ์„ฑ์ด ๊ฐ€๋Šฅํ•œ Seaweed-7B์˜ ๋น„์šฉ ํšจ์œจ์  ํ›ˆ๋ จ ์ „๋žต, ์ด๋ฏธ์ง€ ์ƒ์„ฑ์„ ์œ„ํ•ด ์ˆ˜์‹ญ์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ๋กœ ์‹œ๊ฐ ํ† ํฌ๋‚˜์ด์ €๋ฅผ ํ™•์žฅํ•˜๋ฉฐ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•œ GigaTok, LLM ์‚ฌ์ „ ํ›ˆ๋ จ ์‹œ ์ตœ์ ์˜ ๋ฐ์ดํ„ฐ ํ˜ผํ•ฉ ๋น„์œจ์„ ์ž๋™์œผ๋กœ ์ฐพ์•„์ฃผ๋Š” CLIMB ํ”„๋ ˆ์ž„์›Œํฌ, ์™ธ๋ถ€์˜ ์ •๋‹ต ์—†์ด LLM ์Šค์Šค๋กœ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•˜๋Š” Genius์˜ ๋น„์ง€๋„ ์ž๊ฐ€ ํ•™์Šต ๊ธฐ๋ฒ•, ๊ทธ๋ฆฌ๊ณ  ์—ฐ์‚ฐ ํšจ์œจ์„ ๊ทน๋Œ€ํ™”ํ•œ 1๋น„ํŠธ ์•„ํ‚คํ…์ฒ˜๋ฅผ 20์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ๋กœ ๊ตฌํ˜„ํ•œ BitNet b1.58 2B4T์ด ๋ฐœํ‘œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

'AI ๋ชจ๋ธ ํ™œ์šฉ ๋ฐ ํšจ์œจํ™”' ๋ถ„์•ผ๋Š” ๊ฐœ๋ฐœ๋œ ๋ชจ๋ธ์„ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ํšจ๊ณผ์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ  ์ตœ์ ํ™”ํ•˜๋Š” ๋ฐ ์ค‘์ ์„ ๋‘ก๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ์ผ๋ฐ˜ ๊ฐ€์ •์šฉ PC ํด๋Ÿฌ์Šคํ„ฐ ๊ฐ™์€ ์ €์‚ฌ์–‘ ํ™˜๊ฒฝ์—์„œ๋„ ๋Œ€๊ทœ๋ชจ LLM์„ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜๋Š” ๋ถ„์‚ฐ ์ถ”๋ก  ์‹œ์Šคํ…œ PRIMA.CPP, ๊ฐ•ํ™” ํ•™์Šต์„ ํ†ตํ•ด LLM์ด ์ฝ”๋“œ ์‹คํ–‰๊ณผ ๊ฐ™์€ ์™ธ๋ถ€ ๋„๊ตฌ๋ฅผ ์ƒํ™ฉ์— ๋งž๊ฒŒ ์ „๋žต์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šต์‹œํ‚ค๋Š” ReTool, ๋ชจ๋ธ์˜ ํ•ต์‹ฌ ์ง€์‹์ด ์‰ฝ๊ฒŒ ๋ณต์ œ๋˜๊ฑฐ๋‚˜ ์œ ์ถœ๋˜๋Š” ์ฆ๋ฅ˜ ํ˜„์ƒ์„ ๋ฐฉ์ง€ํ•˜์—ฌ ์ง€์  ์žฌ์‚ฐ์„ ๋ณดํ˜ธํ•˜๋Š” Antidistillation Sampling ๊ธฐ๋ฒ•์ด ๋ฐœํ‘œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

'AI ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ๋ถ„์„' ๋ถ„์•ผ์—์„œ๋Š” ๋‚˜๋‚ ์ด ๋ฐœ์ „ํ•˜๋Š” AI ๋ชจ๋ธ๋“ค์˜ ์‹ค์ œ ๋Šฅ๋ ฅ๊ณผ ํ•œ๊ณ„๋ฅผ ์ •ํ™•ํžˆ ํŒŒ์•…ํ•˜๊ธฐ ์œ„ํ•œ ๋…ธ๋ ฅ์ด ์ด๋ฃจ์–ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณต์žกํ•œ ์ถ”๋ก  ๊ณผ์ •์„ ๊ฑฐ์นœ LLM ๋‹ต๋ณ€์˜ ์ •์˜ค๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํŒ๋ณ„ํ•˜๋Š” ๊ฒ€์ฆ๊ธฐ xVerify, ์‹œ๊ฐ-์–ธ์–ด ๋ชจ๋ธ์ด ์ƒ‰์ƒ์„ ์–ผ๋งˆ๋‚˜ ์ž˜ ์ธ์‹ํ•˜๊ณ  ์ถ”๋ก ํ•˜๋Š”์ง€๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ธก์ •ํ•˜๋Š” ColorBench ๋ฒค์น˜๋งˆํฌ ๊ฐœ๋ฐœ, ๊ทธ๋ฆฌ๊ณ  ํŠน์ • ์ตœ์‹  ๋ชจ๋ธ์ธ GPT-4o๋ฅผ ๋Œ€์ƒ์œผ๋กœ ์ง€์‹ ๊ธฐ๋ฐ˜ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ฐ ํŽธ์ง‘ ๋Šฅ๋ ฅ์˜ ๊ฐ•์ ๊ณผ ์•ฝ์ ์„ ์‹ฌ์ธต์ ์œผ๋กœ ๋ถ„์„ํ•œ GPT-4o Study๊ฐ€ ๋ฐœํ‘œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ฐจ์„ธ๋Œ€ AI ๋ชจ๋ธ ๊ฐœ๋ฐœ ๋ฐ ํ›ˆ๋ จ

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

Paper, Project

InternVL3๋Š” ํ…์ŠคํŠธ ์ „์šฉ LLM์„ ๋‚˜์ค‘์— ์‹œ๊ฐ ๊ธฐ๋Šฅ์— ๋งž๊ฒŒ ์กฐ์ •ํ•˜๋Š” ๊ธฐ์กด ๋ฐฉ์‹์˜ ๋ณต์žก์„ฑ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ฒ˜์Œ๋ถ€ํ„ฐ ํ…์ŠคํŠธ์™€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ๋ฅผ ํ•จ๊ป˜ ํ•™์Šตํ•˜๋Š” '๋„ค์ดํ‹ฐ๋ธŒ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์‚ฌ์ „ํ›ˆ๋ จ' ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๋„์ž…ํ•œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ๋” ๊ธด ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ V2PE, ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์œ„ํ•œ SFT ๋ฐ MPO ๊ฐ™์€ ๊ณ ๊ธ‰ ํ›„์ฒ˜๋ฆฌ ๊ธฐ๋ฒ•, ํ…Œ์ŠคํŠธ ์‹œ์  ์Šค์ผ€์ผ๋ง ์ „๋žต ๋“ฑ์„ ํ™œ์šฉํ•˜์—ฌ MMMU ๋ฒค์น˜๋งˆํฌ์—์„œ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ ์ค‘ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ์ฃผ์š” ์ƒ์šฉ ๋ชจ๋ธ๊ณผ ๊ฒฝ์Ÿํ•˜๋ฉด์„œ๋„ ๋›ฐ์–ด๋‚œ ์–ธ์–ด ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๊ณ  ์—ฐ๊ตฌ ํ™œ์„ฑํ™”๋ฅผ ์œ„ํ•ด ๋ฐ์ดํ„ฐ์™€ ๋ชจ๋ธ์„ ๊ณต๊ฐœํ•  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

Paper, Project

์ด ์—ฐ๊ตฌ๋Š” ๋น„๊ต์  ์ ์€ 66๋งŒ 5์ฒœ H100 GPU ์‹œ๊ฐ„์˜ ์ปดํ“จํŒ… ์ž์›์„ ์‚ฌ์šฉํ•˜์—ฌ ์ฒ˜์Œ๋ถ€ํ„ฐ ํ›ˆ๋ จ๋œ 70์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ์˜ ๋™์˜์ƒ ์ƒ์„ฑ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ 'Seaweed-7B'๋ฅผ ํ†ตํ•ด, ๋น„์šฉ ํšจ์œจ์ ์ธ ๋™์˜์ƒ ๋ชจ๋ธ ํ›ˆ๋ จ ์ „๋žต์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ์ž์› ์ œ์•ฝ ํ™˜๊ฒฝ์—์„œ์˜ ์‹ ์ค‘ํ•œ ์„ค๊ณ„๋ฅผ ํ†ตํ•ด, Seaweed-7B๋Š” ํ›จ์”ฌ ๋” ๋งŽ์€ ์ž์›์œผ๋กœ ํ›ˆ๋ จ๋œ ๋Œ€ํ˜• ๋ชจ๋ธ๋“ค๊ณผ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ๋›ฐ์–ด๋‚œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์œผ๋กœ ๋‹ค์–‘ํ•œ ์‘์šฉ ๋ถ„์•ผ์— ์‰ฝ๊ฒŒ ์ ์šฉ๋  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation

Paper, Project

์ž๊ธฐํšŒ๊ท€ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ์‹œ ์‹œ๊ฐ ํ† ํฌ๋‚˜์ด์ €๋ฅผ ํ™•์žฅํ•˜๋ฉด ๋ณต์› ํ’ˆ์งˆ์€ ์ข‹์•„์ง€์ง€๋งŒ ์ƒ์„ฑ ํ’ˆ์งˆ์€ ๋‚˜๋น ์ง€๋Š” ๋”œ๋ ˆ๋งˆ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด 'GigaTok' ์ ‘๊ทผ๋ฒ•์ด ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. GigaTok์€ ์ž ์žฌ ๊ณต๊ฐ„ ๋ณต์žก์„ฑ ์ฆ๊ฐ€๋ฅผ ๋ฌธ์ œ์˜ ์›์ธ์œผ๋กœ ๋ณด๊ณ , ํ† ํฌ๋‚˜์ด์ € ํŠน์ง•์„ ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ์ธ์ฝ”๋” ํŠน์ง•๊ณผ ์ •๋ ฌ์‹œํ‚ค๋Š” '์˜๋ฏธ๋ก ์  ์ •๊ทœํ™”'๋ฅผ ์ œ์•ˆํ•˜์—ฌ ์ด ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ–ˆ์œผ๋ฉฐ, 1D ํ† ํฌ๋‚˜์ด์ € ์‚ฌ์šฉ ๋“ฑ ํšจ์œจ์ ์ธ ํ™•์žฅ ๊ธฐ๋ฒ•์„ ํ†ตํ•ด 30์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ์—์„œ ๋ณต์›, ์ƒ์„ฑ, ํ‘œํ˜„ ํ•™์Šต ๋ชจ๋‘์—์„œ ์ตœ์ฒจ๋‹จ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

Paper, Project

์‚ฌ์ „ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ตœ์ ์˜ ๋ฐ์ดํ„ฐ ํ˜ผํ•ฉ ๋น„์œจ์„ ์ฐพ๋Š” ๊ฒƒ์ด ์–ด๋ ต๋‹ค๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ด ์—ฐ๊ตฌ๋Š” ๋ฐ์ดํ„ฐ์…‹์„ ์˜๋ฏธ๋ก ์ ์œผ๋กœ ํด๋Ÿฌ์Šคํ„ฐ๋งํ•˜๊ณ  ๋ฐ˜๋ณต์ ์œผ๋กœ ์ตœ์ ์˜ ํ˜ผํ•ฉ ๋น„์œจ์„ ํƒ์ƒ‰ํ•˜๋Š” ์ž๋™ํ™”๋œ ํ”„๋ ˆ์ž„์›Œํฌ 'CLIMB'๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. CLIMB์„ ํ†ตํ•ด ์–ป์€ ๋ฐ์ดํ„ฐ ํ˜ผํ•ฉ์œผ๋กœ ํ›ˆ๋ จ๋œ 1B ๋ชจ๋ธ์€ ๊ธฐ์กด ์ตœ๊ณ  ๋ชจ๋ธ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์œผ๋ฉฐ, ํŠน์ • ๋„๋ฉ”์ธ ์ตœ์ ํ™” ์‹œ ๋” ํฐ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ํ™•์ธํ–ˆ๊ณ , ์—ฐ๊ตฌ ์ปค๋ฎค๋‹ˆํ‹ฐ๋ฅผ ์œ„ํ•ด ๋Œ€๊ทœ๋ชจ ํด๋Ÿฌ์Šคํ„ฐ๋ง๋œ ๋ฐ์ดํ„ฐ์…‹(ClimbLab)๊ณผ ํšจ์œจ์ ์ธ ์‚ฌ์ „ํ›ˆ๋ จ์šฉ ๋ฐ์ดํ„ฐ์…‹(ClimbMix)์„ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning

Paper, Project

LLM ์ถ”๋ก  ๋Šฅ๋ ฅ ํ–ฅ์ƒ์„ ์œ„ํ•œ ๊ธฐ์กด์˜ ์ง€๋„ ํ•™์Šต ๋ฐฉ์‹์ด ๊ฐ€์ง„ ํ™•์žฅ์„ฑ ๋ฐ ๋น„์šฉ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, 'Genius'๋ผ๋Š” ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•˜๊ณ  ์ˆœ์ˆ˜ํ•œ ๋น„์ง€๋„ ์ž๊ฐ€ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์ œ์•ˆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Genius๋Š” ์™ธ๋ถ€ ๊ฐ๋… ์—†์ด ๋‹จ๊ณ„๋ณ„ ์˜ˆ์ธก ๋ฆฌ์ƒ˜ํ”Œ๋ง๊ณผ ์ด์  ๋ณด์ • ์ตœ์ ํ™”(ACO) ์†์‹ค ํ•จ์ˆ˜ ๋“ฑ์„ ํ†ตํ•ด ์ตœ์ ์˜ ์‘๋‹ต์„ ํƒ์ƒ‰ํ•˜๊ณ  ์Šค์Šค๋กœ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๋ฐฉ๋Œ€ํ•œ ์ผ๋ฐ˜ ์งˆ์˜๋ฅผ ํ™œ์šฉํ•˜์—ฌ LLM ์ถ”๋ก  ๋Šฅ๋ ฅ ํ™•์žฅ์˜ ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

BitNet b1.58 2B4T Technical Report

Paper, Project

์ด ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ๋Š” 4์กฐ ๊ฐœ์˜ ํ† ํฐ์œผ๋กœ ํ›ˆ๋ จ๋œ 20์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ์˜ ์ตœ์ดˆ ์˜คํ”ˆ์†Œ์Šค ๋„ค์ดํ‹ฐ๋ธŒ 1๋น„ํŠธ LLM์ธ 'BitNet b1.58 2B4T'๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€ ๊ฒฐ๊ณผ, ์ด ๋ชจ๋ธ์€ ๋น„์Šทํ•œ ํฌ๊ธฐ์˜ ๊ธฐ์กด ์™„์ „ ์ •๋ฐ€๋„ LLM๊ณผ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ๋„ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰, ์—๋„ˆ์ง€ ์†Œ๋น„, ๋””์ฝ”๋”ฉ ์†๋„ ์ธก๋ฉด์—์„œ ํ›จ์”ฌ ๋›ฐ์–ด๋‚œ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ์„ ์ œ๊ณตํ•˜๋ฉฐ, ์—ฐ๊ตฌ ์ด‰์ง„์„ ์œ„ํ•ด ๋ชจ๋ธ ๊ฐ€์ค‘์น˜์™€ GPU/CPU ์ถ”๋ก  ์ฝ”๋“œ๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

AI ๋ชจ๋ธ ํ™œ์šฉ ๋ฐ ํšจ์œจํ™”

PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters

Paper, Project

๊ณ ์„ฑ๋Šฅ LLM์„ ์ผ๋ฐ˜ ๊ฐ€์ •์šฉ ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰ํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ด ๋…ผ๋ฌธ์€ CPU/GPU ํ˜ผํ•ฉ, ๋‚ฎ์€ ๋ฉ”๋ชจ๋ฆฌ, Wi-Fi ํ™˜๊ฒฝ ๋“ฑ ์ €์‚ฌ์–‘ ๊ฐ€์ •์šฉ ํด๋Ÿฌ์Šคํ„ฐ์—์„œ๋„ 70B ๊ทœ๋ชจ ๋ชจ๋ธ์˜ ๋ถ„์‚ฐ ์ถ”๋ก ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ์‹œ์Šคํ…œ 'prima.cpp'๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ mmap์„ ์ด์šฉํ•œ ๊ฐ€์ค‘์น˜ ๊ด€๋ฆฌ, ํŒŒ์ดํ”„-๋ง ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ๋ฐ ์„ ํ–‰ ๋กœ๋”ฉ ๊ธฐ๋ฒ•, ๊ทธ๋ฆฌ๊ณ  ๊ธฐ๊ธฐ๋ณ„ ์ด์งˆ์„ฑ์„ ๊ณ ๋ คํ•œ ์ตœ์  ๋ ˆ์ด์–ด ํ• ๋‹น ์•Œ๊ณ ๋ฆฌ์ฆ˜(Halda)์„ ํ†ตํ•ด ๊ธฐ์กด ์‹œ์Šคํ…œ๋“ค๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉด์„œ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋ฅ ์„ ๋‚ฎ์ถฐ, ์ตœ์ฒจ๋‹จ LLM์˜ ๊ฐœ์ธ์  ์ ‘๊ทผ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Paper, Project

๊ฐ•ํ™” ํ•™์Šต์œผ๋กœ ํ›ˆ๋ จ๋œ LLM์ด ํ…์ŠคํŠธ ์ถ”๋ก ์—๋Š” ๊ฐ•ํ•˜์ง€๋งŒ ๊ณ„์‚ฐ ๋„๊ตฌ ํ™œ์šฉ์ด ํ•„์š”ํ•œ ๊ตฌ์กฐ์  ๋ฌธ์ œ ํ•ด๊ฒฐ์—๋Š” ์•ฝํ•˜๋‹ค๋Š” ์ ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, 'ReTool' ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์ œ์•ˆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ReTool์€ ์ž์—ฐ์–ด ์ถ”๋ก  ๊ณผ์ •์— ์‹ค์‹œ๊ฐ„ ์ฝ”๋“œ ์‹คํ–‰์„ ๋™์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๊ณ , ๊ฒฐ๊ณผ ๊ธฐ๋ฐ˜์˜ ์ž๋™ํ™”๋œ ๊ฐ•ํ™” ํ•™์Šต์„ ํ†ตํ•ด ๋ชจ๋ธ์ด ์–ธ์ œ ์–ด๋–ป๊ฒŒ ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ• ์ง€ ์Šค์Šค๋กœ ํ•™์Šตํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. MATH AIME ๋ฒค์น˜๋งˆํฌ์—์„œ ReTool์€ ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ํ›จ์”ฌ ํšจ์œจ์ ์œผ๋กœ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•˜๊ณ  ์ฝ”๋“œ ์ž๊ฐ€ ์ˆ˜์ •๊ณผ ๊ฐ™์€ ๋ฐœ์ „๋œ ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ๋ณต์žกํ•œ ์ˆ˜ํ•™ ์ถ”๋ก  ๋ฐ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์‹œ์Šคํ…œ ์—ฐ๊ตฌ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค.

Antidistillation Sampling

Paper, Project

LLM์ด ์ƒ์„ฑํ•˜๋Š” ์ƒ์„ธํ•œ ์ถ”๋ก  ๊ณผ์ •์„ ๋‹ค๋ฅธ ๋ชจ๋ธ์ด ์‰ฝ๊ฒŒ ํ•™์Šต(์ฆ๋ฅ˜)ํ•˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๊ณ ์ž ํ•˜๋Š” ๋ชจ๋ธ ์†Œ์œ ์ž์˜ ์š”๊ตฌ์— ๋ถ€์‘ํ•˜์—ฌ, '๋ฐ˜์ฆ๋ฅ˜ ์ƒ˜ํ”Œ๋ง' ๊ธฐ๋ฒ•์ด ์ œ์•ˆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋ชจ๋ธ์˜ ๋‹ค์Œ ํ† ํฐ ์˜ˆ์ธก ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ์ „๋žต์ ์œผ๋กœ ์ˆ˜์ •ํ•˜์—ฌ, ๋ชจ๋ธ์˜ ์‹ค์ œ ์‚ฌ์šฉ์„ฑ์€ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ ์ƒ์„ฑ๋œ ์ถ”๋ก  ๊ณผ์ •์ด ์ฆ๋ฅ˜์— ๋œ ํšจ๊ณผ์ ์ด๋„๋ก ๋งŒ๋“ค์–ด ๋ชจ๋ธ์˜ ์ง€์  ์žฌ์‚ฐ์„ ๋ณดํ˜ธํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

AI ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ๋ถ„์„

xVerify: Efficient Answer Verifier for Reasoning Model Evaluations

Paper, Project

๋ณต์žกํ•œ ์ถ”๋ก  ๊ณผ์ •์„ ํฌํ•จํ•˜๋Š” ์ตœ์‹  LLM์˜ ๋‹ต๋ณ€์„ ์ •ํ™•ํžˆ ํ‰๊ฐ€ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, 'xVerify'๋ผ๋Š” ํšจ์œจ์ ์ธ ๋‹ต๋ณ€ ๊ฒ€์ฆ๊ธฐ๊ฐ€ ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ฒ€์ฆ๊ธฐ๋Š” ๋ชจ๋ธ์˜ ์ถœ๋ ฅ๊ณผ ์ฐธ์กฐ ๋‹ต์•ˆ ์‚ฌ์ด์˜ ์˜๋ฏธ๋ก ์  ๋“ฑ๊ฐ€์„ฑ์„ ํšจ๊ณผ์ ์œผ๋กœ ํŒ๋‹จํ•˜๋ฉฐ, ์ด๋ฅผ ์œ„ํ•ด ๋‹ค์–‘ํ•œ LLM๊ณผ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๊ตฌ์ถ•๋œ VAR ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ›ˆ๋ จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ‰๊ฐ€ ๊ฒฐ๊ณผ, xVerify๋Š” 95% ์ด์ƒ์˜ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋ณด์˜€๊ณ , ์ผ๋ถ€ ๋ชจ๋ธ์€ GPT-4o๋ณด๋‹ค๋„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋‚ด๋ฉฐ ๊ทธ ํšจ๊ณผ์„ฑ๊ณผ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness

Paper, Project

์‹œ๊ฐ-์–ธ์–ด ๋ชจ๋ธ(VLM)์ด ์ธ๊ฐ„์ฒ˜๋Ÿผ ์ƒ‰์ƒ์„ ์ธ์‹ํ•˜๊ณ  ์ดํ•ดํ•˜๋Š”์ง€ ๋ถˆ๋ถ„๋ช…ํ•˜๋‹ค๋Š” ๋ฌธ์ œ์˜์‹ ํ•˜์—, VLM์˜ ์ƒ‰์ƒ ์ธ์‹, ์ถ”๋ก , ๊ฒฌ๊ณ ์„ฑ์„ ํฌ๊ด„์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ๋ฒค์น˜๋งˆํฌ 'ColorBench'๊ฐ€ ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. 32๊ฐœ VLM์„ ํ‰๊ฐ€ํ•œ ๊ฒฐ๊ณผ, ๋ชจ๋ธ ๊ทœ๋ชจ๊ฐ€ ์ค‘์š”ํ•˜์ง€๋งŒ ๊ธฐ์กด ๋ชจ๋ธ๋“ค์ด ์ƒ‰์ƒ ์ดํ•ด๋ฅผ ๊ฐ„๊ณผํ•ด์™”์œผ๋ฉฐ, ์‚ฌ๊ณ  ์—ฐ์‡„(CoT)๊ฐ€ ๋„์›€์ด ๋˜๊ณ  VLM์ด ์ƒ‰์ƒ ๋‹จ์„œ๋ฅผ ํ™œ์šฉํ•˜์ง€๋งŒ ์˜ค๋„๋  ์ˆ˜๋„ ์žˆ์Œ์„ ๋ฐœ๊ฒฌํ•˜์—ฌ, ColorBench๊ฐ€ ํ–ฅํ›„ VLM์˜ ์ƒ‰์ƒ ์ดํ•ด ๋Šฅ๋ ฅ ์—ฐ๊ตฌ ๋ฐ ๊ฐœ์„ ์— ๊ธฐ์—ฌํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability

Paper

OpenAI์˜ GPT-4o๊ฐ€ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ฐ ํŽธ์ง‘์—์„œ ๊ฐ•๋ ฅํ•œ ๋Šฅ๋ ฅ์„ ๋ณด์ด์ง€๋งŒ, ์„ธ์ƒ ์ง€์‹๊ณผ ๋ฌธ๋งฅ์„ ํ†ตํ•ฉํ•˜๋Š” ์ง„์ •ํ•œ ์˜๋ฏธ๋ก ์  ํ•ฉ์„ฑ ๋Šฅ๋ ฅ์ด ์žˆ๋Š”์ง€ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ์ด ์—ฐ๊ตฌ๊ฐ€ ์ˆ˜ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ง€์‹œ ์‚ฌํ•ญ ์ค€์ˆ˜, ํŽธ์ง‘ ์ •๋ฐ€๋„, ์ƒ์„ฑ ํ›„ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ‰๊ฐ€ํ•œ ๊ฒฐ๊ณผ, GPT-4o๊ฐ€ ์ง€์‹œ๋ฅผ ๋ฌธ์ž ๊ทธ๋Œ€๋กœ ํ•ด์„ํ•˜๊ฑฐ๋‚˜ ์ง€์‹ ์ œ์•ฝ ์ ์šฉ์— ์ผ๊ด€์„ฑ์ด ๋ถ€์กฑํ•˜๊ณ  ์กฐ๊ฑด๋ถ€ ์ถ”๋ก ์— ์–ด๋ ค์›€์„ ๊ฒช๋Š” ๋“ฑ ํ•œ๊ณ„๊ฐ€ ์žˆ์Œ์„ ๋ฐœ๊ฒฌํ–ˆ์œผ๋ฉฐ, ์ด๋Š” ๋” ์ •๊ตํ•œ ๋ฒค์น˜๋งˆํฌ์™€ ์ถ”๋ก  ๊ธฐ๋ฐ˜ ํ›ˆ๋ จ ์ „๋žต์˜ ํ•„์š”์„ฑ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

profile
XR๊ณผ AI์— ๊ด€์‹ฌ์ด ๋งŽ์€ Sky ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€