[2025/W24] ๐Ÿค— Weekly AI Research

Skyยท2025๋…„ 6์›” 14์ผ

Weekly AI Research Digest

๋ชฉ๋ก ๋ณด๊ธฐ
32/89

๊ฒŒ์ž„์ฒ˜๋Ÿผ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ๊ฐ•ํ™”ํ•™์Šต๋ถ€ํ„ฐ, ์Šค๋งˆํŠธํฐ์—์„œ ๋™์ž‘ํ•˜๋Š” ์ดˆ์†Œํ˜• ๊ณ ์„ฑ๋Šฅ ์–ธ์–ด๋ชจ๋ธ์˜ ๊ฐœ๋ฐœ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ๋ชจ๋ธ์˜ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ๋ถ„์•ผ ํ™•์žฅ๊ณผ ๋น„๋””์˜ค, 3D ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๋ฐœ์ „

TL;DR

-'Reinforcement Pre-Training' ๋…ผ๋ฌธ์€ LLM์˜ ๋‹ค์Œ ๋‹จ์–ด ๋งž์ถ”๊ธฐ๋ฅผ ๋ณด์ƒ์„ ์ฃผ๋Š” '๊ฒŒ์ž„'์ฒ˜๋Ÿผ ํ›ˆ๋ จ์‹œ์ผœ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ์‹์„ ๊ฐœ๋ฐœํ–ˆ๋‹ค.
-'Will It Still Be True Tomorrow?' ์—ฐ๊ตฌ๋Š” LLM ๋‹ต๋ณ€์ด ์‹œ๊ฐ„์ด ์ง€๋‚˜๋„ ์œ ํšจํ• ์ง€(์ƒ๋ก์„ฑ)๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ธฐ์ˆ ๋กœ, ์ž˜๋ชป๋œ ์ •๋ณด ์ƒ์„ฑ์„ ์ค„์ด๊ณ  ์‹ ๋ขฐ๋„๋ฅผ ๋†’์˜€๋‹ค.
-'Lingshu' ๋…ผ๋ฌธ์€ ์˜๋ฃŒ ์ด๋ฏธ์ง€์™€ ํ…์ŠคํŠธ๋ฅผ ํ•จ๊ป˜ ์ดํ•ดํ•˜๊ณ  ์ถ”๋ก ํ•˜๋Š” ์˜๋ฃŒ ์ „๋ฌธ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI๋ฅผ ๊ฐœ๋ฐœํ•ด ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.
-'Confidence Is All You Need' ์—ฐ๊ตฌ๋Š” ๋น„์‹ผ ๋ฐ์ดํ„ฐ ์—†์ด AI ์Šค์Šค๋กœ '์ž์‹ ๊ฐ'์„ ๋А๋ผ๋Š” ๋‹ต๋ณ€์— ๋ณด์ƒ์„ ์ฃผ๋Š” ๋ฐฉ์‹์œผ๋กœ ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค.
-'MiniCPM4' ๋…ผ๋ฌธ์€ ์Šค๋งˆํŠธํฐ ๊ฐ™์€ ์ผ๋ฐ˜ ๊ธฐ๊ธฐ์—์„œ๋„ ๋น ๋ฅด๊ณ  ํšจ์œจ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋Š” ์ดˆ์†Œํ˜• ๊ณ ์„ฑ๋Šฅ ์–ธ์–ด ๋ชจ๋ธ์„ ๋งŒ๋“ค์—ˆ๋‹ค.
-'Saffron-1' ๋…ผ๋ฌธ์€ LLM์„ ์‚ฌ์šฉํ•  ๋•Œ(์ถ”๋ก  ์‹œ) ๋” ์•ˆ์ „ํ•˜๊ฒŒ ๋งŒ๋“ค์–ด, ํ•ดํ‚น์ด๋‚˜ ํƒˆ์˜ฅ ๊ณต๊ฒฉ์„ ๋ง‰๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ์–ด ๊ธฐ์ˆ ์„ ๊ฐœ๋ฐœํ–ˆ๋‹ค.
-'Geopolitical biases in LLMs' ์—ฐ๊ตฌ๋Š” LLM๋“ค์ด ๋ฏธ๊ตญ, ์ค‘๊ตญ ๋“ฑ ํŠน์ • ๊ตญ๊ฐ€์˜ ์ž…์žฅ์„ ํŽธ๋“œ๋Š” ํŽธํ–ฅ์ด ์‹ฌ๊ฐํ•˜๋ฉฐ, ๊ฐ„๋‹จํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ํ•ด๊ฒฐํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ๊ฒƒ์„ ๋ฐํ˜”๋‹ค.
-'ReasonMed' ๋…ผ๋ฌธ์€ AI์˜ ์˜๋ฃŒ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‚ค์šฐ๊ธฐ ์œ„ํ•ด, 37๋งŒ ๊ฑด์˜ ๊ณ ํ’ˆ์งˆ ์˜๋ฃŒ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜๊ณ  ์ด๋ฅผ ํ†ตํ•ด ๋” ๋˜‘๋˜‘ํ•œ ์˜๋ฃŒ AI๋ฅผ ํ›ˆ๋ จ์‹œ์ผฐ๋‹ค.
-'Seedance 1.0' ๋ณด๊ณ ์„œ๋Š” ์ง€์‹œ๋ฅผ ์ž˜ ๋”ฐ๋ฅด๋ฉด์„œ๋„ ์ž์—ฐ์Šค๋Ÿฝ๊ณ  ํ’ˆ์งˆ ์ข‹์€ ์˜์ƒ์„ ๋งค์šฐ ๋น ๋ฅด๊ฒŒ ๋งŒ๋“ค์–ด๋‚ด๋Š” ์ฐจ์„ธ๋Œ€ ๋น„๋””์˜ค ์ƒ์„ฑ AI๋ฅผ ๊ณต๊ฐœํ–ˆ๋‹ค.
-'PartCrafter' ๋…ผ๋ฌธ์€ ์‚ฌ์ง„ ํ•œ ์žฅ๋งŒ ๋ณด๊ณ ๋„ ์‚ฌ๋ฌผ์„ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์˜๋ฏธ ์žˆ๋Š” '๋ถ€ํ’ˆ'์œผ๋กœ ๋‚˜๋ˆ„์–ด ์ž…์ฒด์ ์ธ 3D ๋ชจ๋ธ๋กœ ๋งŒ๋“ค์–ด์ฃผ๋Š” AI๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค.

Reinforcement Pre-Training

Paper, Project
'Reinforcement Pre-Training' ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ๊ณผ ๊ฐ•ํ™”ํ•™์Šต์„ ์œ„ํ•œ ์ƒˆ๋กœ์šด ํ™•์žฅ ํŒจ๋Ÿฌ๋‹ค์ž„์œผ๋กœ ๊ฐ•ํ™” ์‚ฌ์ „ ํ›ˆ๋ จ(RPT)์„ ์ œ์•ˆํ•œ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๊ธฐ์กด์˜ ๋‹ค์Œ ํ† ํฐ ์˜ˆ์ธก ๊ณผ์ œ๋ฅผ ๊ฐ•ํ™”ํ•™์Šต(RL) ๊ธฐ๋ฐ˜์˜ ์ถ”๋ก  ์ž‘์—…์œผ๋กœ ์žฌ์ •์˜ํ•œ๋‹ค. ๋ชจ๋ธ์ด ์ฃผ์–ด์ง„ ๋ฌธ๋งฅ์—์„œ ๋‹ค์Œ ํ† ํฐ์„ ์ •ํ™•ํžˆ ์˜ˆ์ธกํ•˜๋ฉด ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ๋ณด์ƒ์„ ๋ฐ›๋„๋ก ์„ค๊ณ„ํ•˜์—ฌ, ๋ฐฉ๋Œ€ํ•œ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฒ”์šฉ ๊ฐ•ํ™”ํ•™์Šต์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, RPT๋Š” ๋‹ค์Œ ํ† ํฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•จ์œผ๋กœ์จ ์–ธ์–ด ๋ชจ๋ธ์˜ ์˜ˆ์ธก ์ •ํ™•๋„๋ฅผ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ๋˜ํ•œ, ์ด๋Š” ํ–ฅํ›„์˜ ๊ฐ•ํ™” ๋ฏธ์„ธ์กฐ์ •์„ ์œ„ํ•œ ๊ฐ•๋ ฅํ•œ ์‚ฌ์ „ ํ›ˆ๋ จ ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ•˜๋ฉฐ, ํ›ˆ๋ จ ๊ทœ๋ชจ๊ฐ€ ์ปค์งˆ์ˆ˜๋ก ์„ฑ๋Šฅ์ด ๊พธ์ค€ํžˆ ํ–ฅ์ƒ๋˜์–ด ์œ ๋งํ•œ ์ฐจ์„ธ๋Œ€ ์‚ฌ์ „ ํ›ˆ๋ จ ํŒจ๋Ÿฌ๋‹ค์ž„์ž„์„ ์ž…์ฆํ–ˆ๋‹ค.

Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA

Paper, Project
'Will It Still Be True Tomorrow?' ์—ฐ๊ตฌ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ํ™˜๊ฐ ํ˜„์ƒ์ด ์งˆ๋ฌธ์˜ ์‹œ๊ฐ„์  ํŠน์„ฑ, ์ฆ‰ ๋‹ต๋ณ€์ด ๋ณ€ํ•˜์ง€ ์•Š๋Š” '์ƒ๋ก์„ฑ(evergreen)' ์งˆ๋ฌธ๊ณผ ๋ณ€ํ•˜๋Š” '๊ฐ€๋ณ€์„ฑ(mutable)' ์งˆ๋ฌธ์„ ๊ตฌ๋ถ„ํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒƒ์—์„œ ๊ธฐ์ธํ•œ๋‹ค๊ณ  ์ง€์ ํ•œ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” ์ตœ์ดˆ๋กœ ์ƒ๋ก์„ฑ ์—ฌ๋ถ€๊ฐ€ ํ‘œ์‹œ๋œ ๋‹ค๊ตญ์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ์…‹์ธ 'EverGreenQA'๋ฅผ ๊ตฌ์ถ•ํ–ˆ๋‹ค. ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ 12๊ฐœ์˜ ์ตœ์‹  LLM์„ ๋ฒค์น˜๋งˆํ‚นํ•˜๊ณ , ์งˆ๋ฌธ์˜ ์‹œ๊ฐ„์  ํŠน์„ฑ์„ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒฝ๋Ÿ‰ ๋‹ค๊ตญ์–ด ๋ถ„๋ฅ˜๊ธฐ 'EG-E5'๋ฅผ ๊ฐœ๋ฐœํ•˜์—ฌ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ƒ๋ก์„ฑ ๋ถ„๋ฅ˜๋Š” ๋ชจ๋ธ์˜ ์ž๊ธฐ ์ง€์‹ ์ถ”์ • ๋Šฅ๋ ฅ ํ–ฅ์ƒ, QA ๋ฐ์ดํ„ฐ์…‹ ํ•„ํ„ฐ๋ง, GPT-4o์˜ ๊ฒ€์ƒ‰ ํ–‰๋™ ๋ถ„์„ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ์‹ค์šฉ์  ์œ ์šฉ์„ฑ์„ ๊ฐ€์ง„๋‹ค๋Š” ์ ์„ ๋ณด์—ฌ์ค€๋‹ค.

Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning

Paper, Project
'Lingshu' ๋…ผ๋ฌธ์€ ์ผ๋ฐ˜์ ์ธ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(MLLM)์ด ์˜๋ฃŒ ๋ถ„์•ผ์—์„œ๋Š” ๋ฐ์ดํ„ฐ์™€ ๊ณผ์ œ์˜ ํŠน์ˆ˜์„ฑ์œผ๋กœ ์ธํ•ด ํ•œ๊ณ„๋ฅผ ๊ฐ€์ง„๋‹ค๊ณ  ๋ถ„์„ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์˜๋ฃŒ ๋ถ„์•ผ์— ํŠนํ™”๋œ ๋ฒ”์šฉ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ 'Lingshu'๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์˜๋ฃŒ ์˜์ƒ, ๋ฐฉ๋Œ€ํ•œ ํ…์ŠคํŠธ, ์ผ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ฅผ ํฌ๊ด„ํ•˜๋Š” ํฌ๊ด„์ ์ธ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์ ˆ์ฐจ๋ฅผ ์ œ์•ˆํ•˜์—ฌ ๊ณ ํ’ˆ์งˆ์˜ ์˜๋ฃŒ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค. ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ค๋‹จ๊ณ„ ํ›ˆ๋ จ์„ ๊ฑฐ์ณ Lingshu์— ์˜๋ฃŒ ์ „๋ฌธ ์ง€์‹์„ ์ฃผ์ž…ํ•˜๊ณ , ๊ณต์ •ํ•œ ํ‰๊ฐ€๋ฅผ ์œ„ํ•ด 'MedEvalKit'์ด๋ผ๋Š” ํ†ตํ•ฉ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋„ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, Lingshu๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ QA, ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ QA ๋“ฑ ๋Œ€๋ถ€๋ถ„์˜ ์˜๋ฃŒ ์ž‘์—…์—์„œ ๊ธฐ์กด ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ ์‹ค์ œ ์˜๋ฃŒ ํ™˜๊ฒฝ์—์„œ์˜ ๋†’์€ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค.

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper
'Confidence Is All You Need' ์—ฐ๊ตฌ๋Š” ๊ฐ•ํ™”ํ•™์Šต(RL) ๊ธฐ๋ฐ˜์˜ ์–ธ์–ด ๋ชจ๋ธ ๋ฏธ์„ธ์กฐ์ •์ด ๋น„์šฉ์ด ๋งŽ์ด ๋“œ๋Š” ์ธ๊ฐ„์˜ ์ฃผ์„์ด๋‚˜ ์™ธ๋ถ€ ๋ณด์ƒ ๋ชจ๋ธ์— ์˜์กดํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด '์ž๊ธฐ ์ž์‹ ๊ฐ ๊ธฐ๋ฐ˜ ๊ฐ•ํ™”ํ•™์Šต(RLSC)'์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์™ธ๋ถ€์˜ ์ •๋‹ต ๋ ˆ์ด๋ธ” ์—†์ด ๋ชจ๋ธ ์Šค์Šค๋กœ์˜ '์ž์‹ ๊ฐ'์„ ๋ณด์ƒ ์‹ ํ˜ธ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ํ–‰๋™์„ ๊ต์ •ํ•œ๋‹ค. ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ชจ๋ธ์— RLSC๋ฅผ ์ ์šฉํ•œ ๊ฒฐ๊ณผ, ์งˆ๋ฌธ๋‹น ๋‹จ 16๊ฐœ์˜ ์ƒ˜ํ”Œ๊ณผ ๋งค์šฐ ์งง์€ ํ•™์Šต๋งŒ์œผ๋กœ๋„ ์—ฌ๋Ÿฌ ์ˆ˜ํ•™ ๋ฒค์น˜๋งˆํฌ์—์„œ ์ •ํ™•๋„๋ฅผ ์ตœ๋Œ€ 21.7%๊นŒ์ง€ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ์ด๋Š” RLSC๊ฐ€ ์ ์€ ์ƒ˜ํ”Œ๊ณผ ๋ณ„๋„์˜ ๋ ˆ์ด๋ธ” ์—†์ด๋„ ๊ฐ€๋Šฅํ•œ ๊ฐ„๋‹จํ•˜๊ณ  ํ™•์žฅ์„ฑ ๋†’์€ ์‚ฌํ›„ ํ›ˆ๋ จ ๋ฐฉ๋ฒ•์ž„์„ ์ฆ๋ช…ํ•œ๋‹ค.

MiniCPM4: Ultra-Efficient LLMs on End Devices

Paper, Project
'MiniCPM4' ๋…ผ๋ฌธ์€ ์Šค๋งˆํŠธํฐ๊ณผ ๊ฐ™์€ ์ตœ์ข… ์‚ฌ์šฉ์ž ๊ธฐ๊ธฐ์—์„œ ํšจ์œจ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋„๋ก ์„ค๊ณ„๋œ ๊ณ ํšจ์œจ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ธ MiniCPM4๋ฅผ ์†Œ๊ฐœํ•œ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜, ํ•™์Šต ๋ฐ์ดํ„ฐ, ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜, ์ถ”๋ก  ์‹œ์Šคํ…œ์ด๋ผ๋Š” ๋„ค ๊ฐ€์ง€ ํ•ต์‹ฌ ์ฐจ์›์—์„œ ์ฒด๊ณ„์ ์ธ ํ˜์‹ ์„ ์ด๋ฃจ์—ˆ๋‹ค. ํŠนํžˆ ํ›ˆ๋ จ ๊ฐ€๋Šฅํ•œ ํฌ์†Œ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜(InfLLM v2), ํšจ์œจ์ ์ธ ๋ฐ์ดํ„ฐ ํ•„ํ„ฐ๋ง ์ „๋žต(UltraClean), ์ถ”๋ก  ์†๋„ ์ตœ์ ํ™”๋ฅผ ์œ„ํ•œ ์‹œ์Šคํ…œ(CPM.cu) ๋“ฑ์„ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, MiniCPM4๋Š” ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋น„์Šทํ•œ ํฌ๊ธฐ์˜ ๋‹ค๋ฅธ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ๊ณผ ํšจ์œจ์„ฑ์„ ๋ณด์˜€๋‹ค. ํŠนํžˆ ๊ธด ์‹œํ€€์Šค ์ฒ˜๋ฆฌ์—์„œ ๊ฒฝ์Ÿ ๋ชจ๋ธ๋ณด๋‹ค ํ›จ์”ฌ ๋น ๋ฅธ ์†๋„๋ฅผ ์ž๋ž‘ํ•˜๋ฉฐ ๋‹ค์–‘ํ•œ ์˜จ๋””๋ฐ”์ด์Šค ์‘์šฉ ๋ถ„์•ผ์—์„œ์˜ ๋„“์€ ์‚ฌ์šฉ์„ฑ์„ ์ž…์ฆํ–ˆ๋‹ค.

Saffron-1: Towards an Inference Scaling Paradigm for LLM Safety Assurance

Paper, Project
'Saffron-1' ๋…ผ๋ฌธ์€ ๊ธฐ์กด์˜ LLM ์•ˆ์ „์„ฑ ์—ฐ๊ตฌ๊ฐ€ ํ›ˆ๋ จ ๋‹จ๊ณ„์— ์ง‘์ค‘๋˜์–ด ๋‹ค์–‘ํ•œ ํƒˆ์˜ฅ(jailbreak) ๊ณต๊ฒฉ์— ์ทจ์•ฝํ•˜๋‹ค๋Š” ํ•œ๊ณ„๋ฅผ ์ง€์ ํ•œ๋‹ค. ์ด์— ๋Œ€ํ•œ ๋Œ€์•ˆ์œผ๋กœ ์ถ”๋ก  ๋‹จ๊ณ„์—์„œ ์•ˆ์ „์„ฑ์„ ๊ฐ•ํ™”ํ•˜๋Š” '์ถ”๋ก  ์Šค์ผ€์ผ๋ง' ์ ‘๊ทผ๋ฒ•์„ ์ตœ์ดˆ๋กœ ์ œ์•ˆํ•œ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ๊ธฐ์กด ์ถ”๋ก  ์Šค์ผ€์ผ๋ง ๊ธฐ๋ฒ•์ด ์•ˆ์ „์„ฑ ๋ฌธ์ œ์—๋Š” ๋น„ํšจ์œจ์ ์ž„์„ ๋ฐํžˆ๊ณ , ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด 'SAFFRON'์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๊ฐœ๋ฐœํ–ˆ๋‹ค. SAFFRON์€ ๋ณด์ƒ ๋ชจ๋ธ์˜ ํ‰๊ฐ€ ํšŸ์ˆ˜๋ฅผ ์ค„์ด๋Š” '๋‹ค์ค‘ ๋ถ„๊ธฐ ๋ณด์ƒ ๋ชจ๋ธ(MRM)'๊ณผ ์œ„ํ—˜ํ•œ ํƒ์ƒ‰์„ ๋ง‰๋Š” '๋ณด์ˆ˜์  ํƒ์ƒ‰ ์ œ์•ฝ' ๋“ฑ์„ ํ•ต์‹ฌ์œผ๋กœ ํ•œ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์ด ๋ฐฉ๋ฒ•์˜ ํšจ๊ณผ๋ฅผ ์‹คํ—˜์œผ๋กœ ๊ฒ€์ฆํ–ˆ์œผ๋ฉฐ, ๊ฐœ๋ฐœํ•œ ๋ณด์ƒ ๋ชจ๋ธ(Saffron-1)๊ณผ ์•ˆ์ „์„ฑ ๋ฐ์ดํ„ฐ์…‹(Safety4M)์„ ๊ณต๊ฐœํ•˜์—ฌ ํ–ฅํ›„ LLM ์•ˆ์ „์„ฑ ์—ฐ๊ตฌ์— ๊ธฐ์—ฌํ–ˆ๋‹ค.

Geopolitical biases in LLMs: what are the "good" and the "bad" countries according to contemporary language models

Paper, Project
'Geopolitical biases in LLMs' ์—ฐ๊ตฌ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ด ํŠน์ • ๊ตญ๊ฐ€์— ๋Œ€ํ•ด ๊ฐ–๋Š” ์ง€์ •ํ•™์  ํŽธํ–ฅ์„ ํ‰๊ฐ€ํ•œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋ฏธ๊ตญ, ์˜๊ตญ, ์†Œ๋ จ, ์ค‘๊ตญ ๋“ฑ ๊ตญ๊ฐ€๋ณ„ ๊ด€์ ์ด ์ถฉ๋Œํ•˜๋Š” ์—ญ์‚ฌ์  ์‚ฌ๊ฑด์— ๋Œ€ํ•œ ์ค‘๋ฆฝ์  ์„ค๋ช…๊ณผ ๊ฐ๊ตญ์˜ ๋Œ€์กฐ์  ๊ด€์ ์„ ๋‹ด์€ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค. ๋ถ„์„ ๊ฒฐ๊ณผ, LLM์€ ํŠน์ • ๊ตญ๊ฐ€์˜ ์„œ์‚ฌ๋ฅผ ๋šœ๋ ทํ•˜๊ฒŒ ์„ ํ˜ธํ•˜๋Š” ์ƒ๋‹นํ•œ ์ง€์ •ํ•™์  ํŽธํ–ฅ์„ ๋ณด์˜€๋‹ค. ๋˜ํ•œ, ๋‹จ์ˆœํ•œ ํŽธํ–ฅ ์ œ๊ฑฐ ํ”„๋กฌํ”„ํŠธ๋Š” ์ด๋Ÿฌํ•œ ํŽธํ–ฅ์„ ์ค„์ด๋Š” ๋ฐ ์ œํ•œ์ ์ธ ํšจ๊ณผ๋งŒ ์žˆ์—ˆ์œผ๋ฉฐ, ์‚ฌ๊ฑด์˜ ์ฃผ์ฒด๋ฅผ ์ธ์œ„์ ์œผ๋กœ ๋ฐ”๊พธ์ž ๋ชจ๋ธ์ด ๋ฏผ๊ฐํ•˜๊ฒŒ ๋ฐ˜์‘ํ•˜๋ฉฐ ํŽธํ–ฅ์ด ์ฆํญ๋˜๊ธฐ๋„ ํ–ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” LLM์— ๋‚ด์žฌ๋œ ๊ตญ๊ฐ€์  ์„œ์‚ฌ ํŽธํ–ฅ์„ ๋ช…ํ™•ํžˆ ํ•˜๊ณ , ํ–ฅํ›„ ๊ด€๋ จ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ์ค‘์š”ํ•œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ–ˆ๋‹ค.

ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning

Paper, Project
'ReasonMed' ๋…ผ๋ฌธ์€ ์ถ”๋ก  ๊ธฐ๋ฐ˜ LLM์ด ์ˆ˜ํ•™์ด๋‚˜ ํ”„๋กœ๊ทธ๋ž˜๋ฐ๊ณผ ๋‹ฌ๋ฆฌ, ๋ฐฉ๋Œ€ํ•œ ์ง€์‹์ด ํ•„์š”ํ•œ ์˜๋ฃŒ ๋ถ„์•ผ์˜ ์งˆ์˜์‘๋‹ต์—์„œ๋Š” ์•„์ง ๊ทธ ๋Šฅ๋ ฅ์ด ์ถฉ๋ถ„ํžˆ ํƒ๊ตฌ๋˜์ง€ ์•Š์•˜๋‹ค๊ณ  ๋ณธ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” 'ReasonMed'๋ผ๋Š” ๋Œ€๊ทœ๋ชจ ์˜๋ฃŒ ์ถ”๋ก  ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ์…‹์€ ๋‹ค์–‘ํ•œ LLM์ด ์ƒ์„ฑํ•œ 170๋งŒ ๊ฐœ์˜ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ๋‹ค์ค‘ ์—์ด์ „ํŠธ๊ฐ€ ๊ฒ€์ฆํ•˜๊ณ  ๊ฐœ์„ ํ•˜๋Š” ๊ณผ์ •์„ ๊ฑฐ์ณ 37๋งŒ ๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ์˜ˆ์‹œ๋กœ ๊ตฌ์„ฑ๋˜์—ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์ด ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•˜์—ฌ ์ƒ์„ธํ•œ '์‚ฌ๊ณ ์˜ ์—ฐ์‡„(CoT)'์™€ ๊ฐ„๊ฒฐํ•œ ๋‹ต๋ณ€ ์š”์•ฝ์„ ๊ฒฐํ•ฉํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ํšจ๊ณผ์ ์ธ ํ›ˆ๋ จ ์ „๋žต์ž„์„ ๋ฐœ๊ฒฌํ–ˆ๋‹ค. ์ด ์ „๋žต์œผ๋กœ ํ›ˆ๋ จ๋œ 'ReasonMed-7B' ๋ชจ๋ธ์€ 100์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๋ฏธ๋งŒ ๋ชจ๋ธ ์ค‘ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๊ธฐ๋กํ•˜๋ฉฐ LLaMA3.1-70B ๋ชจ๋ธ๋ณด๋‹ค๋„ ์šฐ์ˆ˜ํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์˜€๋‹ค.

Seedance 1.0: Exploring the Boundaries of Video Generation Models

Paper, Project
'Seedance 1.0' ๋ณด๊ณ ์„œ๋Š” ํ˜„์žฌ์˜ ๋น„๋””์˜ค ์ƒ์„ฑ ๋ชจ๋ธ์ด ํ”„๋กฌํ”„ํŠธ ์ดํ•ด๋„, ์›€์ง์ž„์˜ ์ž์—ฐ์Šค๋Ÿฌ์›€, ์‹œ๊ฐ์  ํ’ˆ์งˆ ๊ฐ„์˜ ๊ท ํ˜•์„ ๋งž์ถ”๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ๋‹ค๊ณ  ์ง€์ ํ•˜๋ฉฐ ๊ณ ์„ฑ๋Šฅ ๋น„๋””์˜ค ์ƒ์„ฑ ๋ชจ๋ธ 'Seedance 1.0'์„ ์†Œ๊ฐœํ•œ๋‹ค. ์ด ๋ชจ๋ธ์€ ์ •๋ฐ€ํ•œ ๋น„๋””์˜ค ์บก์…”๋‹์„ ํ†ตํ•œ ๋ฐ์ดํ„ฐ ํ๋ ˆ์ด์…˜, ํ…์ŠคํŠธ-๋น„๋””์˜ค์™€ ์ด๋ฏธ์ง€-๋น„๋””์˜ค ์ž‘์—…์„ ๋™์‹œ์— ํ•™์Šตํ•˜๋Š” ํšจ์œจ์ ์ธ ์•„ํ‚คํ…์ฒ˜, ๋น„๋””์˜ค ํŠนํ™” RLHF๋ฅผ ํ™œ์šฉํ•œ ์ตœ์ ํ™”๋œ ์‚ฌํ›„ ํ›ˆ๋ จ, ๊ทธ๋ฆฌ๊ณ  ์ถ”๋ก  ์†๋„๋ฅผ 10๋ฐฐ๊ฐ€๋Ÿ‰ ํ–ฅ์ƒ์‹œํ‚จ ๋ชจ๋ธ ๊ฐ€์†ํ™” ๋“ฑ ํ•ต์‹ฌ์ ์ธ ๊ธฐ์ˆ  ๊ฐœ์„ ์„ ํฌํ•จํ•œ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, Seedance 1.0์€ ์ตœ์ฒจ๋‹จ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ•˜์—ฌ ๋›ฐ์–ด๋‚œ ์‹œ๊ณต๊ฐ„์  ํ๋ฆ„๊ณผ ๊ตฌ์กฐ์  ์•ˆ์ •์„ฑ์„ ๊ฐ€์ง€๋ฉฐ, ๋ณต์žกํ•œ ์ง€์‹œ ์‚ฌํ•ญ์„ ์ •ํ™•ํžˆ ๋”ฐ๋ฅด๊ณ  ์ผ๊ด€๋œ ์ฃผ์ œ๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๊ณ ํ’ˆ์งˆ ๋น„๋””์˜ค๋ฅผ ๋น ๋ฅด๊ฒŒ ์ƒ์„ฑํ•œ๋‹ค.

PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers

Paper, Project
'PartCrafter' ๋…ผ๋ฌธ์€ ๋‹จ์ผ RGB ์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ์˜๋ฏธ์ ์œผ๋กœ ๊ตฌ๋ณ„๋˜๋Š” ์—ฌ๋Ÿฌ ๊ฐœ์˜ 3D ๋ฉ”์‹œ(mesh)๋ฅผ ๋™์‹œ์— ์ƒ์„ฑํ•˜๋Š” ์ตœ์ดˆ์˜ ๊ตฌ์กฐ์  3D ์ƒ์„ฑ ๋ชจ๋ธ 'PartCrafter'๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด๋Š” ์ด๋ฏธ์ง€๋ฅผ ๋จผ์ € ๋ถ„ํ• ํ•œ ํ›„ ๊ฐ ๋ถ€๋ถ„์„ ์žฌ๊ตฌ์„ฑํ•˜๋Š” ๊ธฐ์กด์˜ 2๋‹จ๊ณ„ ๋ฐฉ์‹๊ณผ ๋‹ฌ๋ฆฌ, ๋‹จ์ผ ์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ์—ฌ๋Ÿฌ 3D ํŒŒํŠธ๋ฅผ ๋™์‹œ์— ์ƒ์„ฑํ•˜๋Š” ํ†ตํ•ฉ๋œ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ฑ„ํƒํ•œ๋‹ค. ํ•ต์‹ฌ ํ˜์‹ ์œผ๋กœ๋Š” ๊ฐ 3D ํŒŒํŠธ๋ฅผ ๋ถ„๋ฆฌ๋œ ์ž ์žฌ ํ† ํฐ์œผ๋กœ ํ‘œํ˜„ํ•˜๋Š” '๊ตฌ์„ฑ์  ์ž ์žฌ ๊ณต๊ฐ„'๊ณผ, ํŒŒํŠธ ๊ฐ„์˜ ์ •๋ณด ํ๋ฆ„์„ ๊ตฌ์กฐํ™”ํ•˜์—ฌ ์ „์ฒด์  ์ผ๊ด€์„ฑ๊ณผ ์„ธ๋ถ€ ๋””ํ…Œ์ผ์„ ๋ชจ๋‘ ๋ณด์กดํ•˜๋Š” '๊ณ„์ธต์  ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜'์ด ์žˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, PartCrafter๋Š” ์ž…๋ ฅ ์ด๋ฏธ์ง€์— ์ง์ ‘ ๋ณด์ด์ง€ ์•Š๋Š” ๋ถ€๋ถ„๊นŒ์ง€ ํฌํ•จํ•˜์—ฌ ๋ถ„ํ•ด ๊ฐ€๋Šฅํ•œ 3D ๋ฉ”์‹œ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ์žˆ์–ด ๊ธฐ์กด ์ ‘๊ทผ๋ฒ•์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.

profile
XR๊ณผ AI์— ๊ด€์‹ฌ์ด ๋งŽ์€ Sky ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€