[2025/W39] ๐Ÿค— Weekly AI Research

Skyยท2025๋…„ 9์›” 27์ผ

Weekly AI Research Digest

๋ชฉ๋ก ๋ณด๊ธฐ
62/89

๊ตฌ์กฐ์  ๊ณ„ํš(๊ทธ๋ž˜ํ”„ยทํŠธ๋ฆฌ)๊ณผ ์ง€๋Šฅ์  ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ๋ง์„ ํ†ตํ•œ AI ์—์ด์ „์‹œ ๋ฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์˜ ํ˜์‹ 
๋น„์ „, 3D, ์ฝ”๋“œ ์ƒ์„ฑ์„ ํฌ๊ด„ํ•˜๋Š” ์ฐจ์„ธ๋Œ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌยท๊ต์ฐจํ•™๋ฌธ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ตฌํ˜„

RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation

Paper
๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์ด ์ „์ฒด ์†Œํ”„ํŠธ์›จ์–ด ๋ฆฌํฌ์ง€ํ† ๋ฆฌ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” ์ž์—ฐ์–ด์˜ ๋ชจํ˜ธํ•จ์„ ์ œ๊ฑฐํ•œ ๋ช…์‹œ์  ์ฒญ์‚ฌ์ง„์ธ ๋ฆฌํฌ์ง€ํ† ๋ฆฌ ๊ณ„ํš ๊ทธ๋ž˜ํ”„(RPG)๋ฅผ ์ œ์•ˆํ•œ๋‹ค. RPG๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ZeroRepo ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ œ์•ˆ, ๊ตฌ์ฒดํ™”, ์ƒ์„ฑ์˜ 3๋‹จ๊ณ„ ๊ณผ์ •์„ ํ†ตํ•ด ์ฝ”๋“œ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ๊ตฌ์ถ•ํ•˜๋ฉฐ, ์‹คํ—˜ ๊ฒฐ๊ณผ ๊ธฐ์กด ์ตœ๊ณ  ์„ฑ๋Šฅ ๋ชจ๋ธ๋ณด๋‹ค 3.9๋ฐฐ ๋” ํฐ ์ฝ”๋“œ๋ฒ ์ด์Šค๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ์›”๋“ฑํžˆ ๋†’์€ ํ…Œ์ŠคํŠธ ํ†ต๊ณผ์œจ์„ ๋‹ฌ์„ฑํ•จ์œผ๋กœ์จ ๊ตฌ์กฐํ™”๋œ ๊ณ„ํš์ด ๋Œ€๊ทœ๋ชจ ์ฝ”๋“œ ์ƒ์„ฑ์˜ ํšจ์œจ์„ฑ๊ณผ ์ •ํ™•์„ฑ์„ ํš๊ธฐ์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚ด์„ ์ž…์ฆํ–ˆ๋‹ค.

Qwen3-Omni Technical Report

Paper, Project
ํ…์ŠคํŠธ, ์ด๋ฏธ์ง€, ์˜ค๋””์˜ค, ๋น„๋””์˜ค๋ฅผ ๋ชจ๋‘ ๋‹ค๋ฃจ๋ฉด์„œ๋„ ๊ฐ ๋ถ„์•ผ์˜ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ์—†๋Š” ํ†ตํ•ฉ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์„ ๋ชฉํ‘œ๋กœ ๊ฐœ๋ฐœ๋œ Qwen3-Omni๋Š” Thinker-Talker MoE ์•„ํ‚คํ…์ฒ˜๋ฅผ ํ†ตํ•ด ์—ฌ๋Ÿฌ ์–‘์‹์˜ ์ธ์‹๊ณผ ์ƒ์„ฑ์„ ํ•˜๋‚˜๋กœ ๋ฌถ๋Š”๋‹ค. ํŠนํžˆ ์ด ๋ชจ๋ธ์€ ์‹ค์‹œ๊ฐ„์— ๊ฐ€๊นŒ์šด ๋น ๋ฅธ ์Œ์„ฑ ํ•ฉ์„ฑ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๊ณ  ์žˆ์œผ๋ฉฐ, ๋‹ค์ˆ˜์˜ ์˜ค๋””์˜ค ๋ฐ ์‹œ์ฒญ๊ฐ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ๋น„๊ณต๊ฐœ ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์ตœ๊ณ  ์ˆ˜์ค€(SOTA)์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•จ์œผ๋กœ์จ, ๋‹จ์ผ ๋ชจ๋ธ์ด ์—ฌ๋Ÿฌ ์–‘์‹์— ๊ฑธ์ณ ์ „๋ฌธํ™”๋œ ๋ชจ๋ธ๋งŒํผ์˜ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ์Œ์„ ์ตœ์ดˆ๋กœ ์ฆ๋ช…ํ–ˆ๋‹ค.

VCRL: Variance-based Curriculum Reinforcement Learning for Large Language Models

Paper
๊ธฐ์กด ๊ฐ•ํ™”ํ•™์Šต์ด LLM์˜ ์ˆ˜ํ•™ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ๋•Œ ๋ฌธ์ œ์˜ ๋‚œ์ด๋„๋ฅผ ๊ณ ๋ คํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” VCRL(๋ถ„์‚ฐ ๊ธฐ๋ฐ˜ ์ปค๋ฆฌํ˜๋Ÿผ ๊ฐ•ํ™”ํ•™์Šต) ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ํ•œ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์—ฌ๋Ÿฌ ํ’€์ด ์‹œ๋„์˜ ๋ณด์ƒ ๋ถ„์‚ฐ(variance)์„ ๋‚œ์ด๋„์˜ ์ง€ํ‘œ๋กœ ์‚ผ์•„, LLM์—๊ฒŒ ํ•™์Šต ํšจ๊ณผ๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ์ ๋‹นํžˆ ์–ด๋ ค์šด ๋ฌธ์ œ๋“ค์„ ๋™์ ์œผ๋กœ ์„ ๋ณ„ํ•˜์—ฌ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ์ปค๋ฆฌํ˜๋Ÿผ์„ ์ œ๊ณตํ•œ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ VCRL์€ ์—ฌ๋Ÿฌ ์ˆ˜ํ•™ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ๊ฐ•ํ™”ํ•™์Šต ๋ฐฉ๋ฒ•๋“ค์„ ํฌ๊ฒŒ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ์ธ๊ฐ„์˜ ํ•™์Šต ๊ณผ์ •์ฒ˜๋Ÿผ ๋‚œ์ด๋„๋ฅผ ์กฐ์ ˆํ•˜๋Š” ๊ฒƒ์ด LLM์˜ ํ•™์Šต ํšจ์œจ์„ ๋†’์ด๋Š” ๋ฐ ํšจ๊ณผ์ ์ž„์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค.

LIMI: Less is More for Agency

Paper, Project
AI ์—์ด์ „ํŠธ์˜ ์ž์œจ์  ํ–‰๋™ ๋Šฅ๋ ฅ์ธ ์—์ด์ „์‹œ๊ฐ€ ๋ฐ์ดํ„ฐ์˜ ์–‘์ด ์•„๋‹Œ ์งˆ์— ์˜ํ•ด ๊ฒฐ์ •๋œ๋‹ค๋Š” ๊ฐ€์„ค์„ ์ฆ๋ช…ํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” LIMI(Less Is More for Intelligent Agency)๋ฅผ ์ œ์‹œํ•œ๋‹ค. LIMI๋Š” ์ˆ˜๋งŒ ๊ฐœ์˜ ๋ฐ์ดํ„ฐ ๋Œ€์‹  ์ „๋žต์ ์œผ๋กœ ์„ค๊ณ„๋œ ๋‹จ 78๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋งŒ์„ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จ๋˜์—ˆ์œผ๋ฉฐ, ๊ทธ ๊ฒฐ๊ณผ ํ›จ์”ฌ ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•œ ๊ธฐ์กด ์ตœ๊ณ  ์„ฑ๋Šฅ ๋ชจ๋ธ๋“ค์„ ์••๋„์ ์ธ ์ฐจ์ด๋กœ ๋Šฅ๊ฐ€ํ–ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ๊ธฐ๊ณ„์˜ ์ž์œจ์„ฑ์ด ๋ฐ์ดํ„ฐ์˜ ์–‘์ด ์•„๋‹Œ ์ „๋žต์  ํ๋ ˆ์ด์…˜์—์„œ ๋น„๋กฏ๋œ๋‹ค๋Š” ์—์ด์ „์‹œ ํšจ์œจ์„ฑ ์›์น™์„ ํ™•๋ฆฝํ•˜๋ฉฐ AI ์—์ด์ „ํŠธ ํ›ˆ๋ จ์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์—ด์—ˆ๋‹ค.

SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines

Paper, Project
๋‹ค์–‘ํ•œ ๊ณผํ•™ ๋ถ„์•ผ์˜ ํ…์ŠคํŠธ, ํ™”ํ•™์‹, DNA ์„œ์—ด ๋“ฑ ์ด์งˆ์ ์ธ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉ์ ์œผ๋กœ ์ดํ•ดํ•˜๊ณ  ์ถ”๋ก ํ•˜๋Š” AI ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์˜ ํ•„์š”์„ฑ์— ๋ถ€์‘ํ•˜์—ฌ SciReasoner๊ฐ€ ๊ฐœ๋ฐœ๋˜์—ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ 2060์–ต ํ† ํฐ ๊ทœ๋ชจ์˜ ๋ฐฉ๋Œ€ํ•œ ๊ณผํ•™ ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ํ›„, ์ƒ์„ธํ•œ ์‚ฌ๊ณ  ๊ณผ์ •(chain-of-thought)์„ ์œ ๋„ํ•˜๊ณ  ๊ฐ•ํ™”ํ•™์Šต์„ ํ†ตํ•ด ์‹ ์ค‘ํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ฃผ์ž…ํ•˜๋Š” ๋‹ค๋‹จ๊ณ„ ์ •๋ ฌ ๊ณผ์ •์„ ๊ฑฐ์นœ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ SciReasoner๋Š” ํŠน์ • ๋ถ„์•ผ์— ํŠนํ™”๋œ ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ๋ฒ”์šฉ์„ฑ๊ณผ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ํ™•๋ณดํ–ˆ์œผ๋ฉฐ, ์—ฌ๋Ÿฌ ํ•™๋ฌธ ๋ถ„์•ผ๋ฅผ ์•„์šฐ๋ฅด๋Š” ํ•™์Šต ๋ฐฉ์‹์ด ๊ณผํ•™ AI์˜ ์ง€์‹ ์ „์ด ๋Šฅ๋ ฅ๊ณผ ์‹ ๋ขฐ๋„๋ฅผ ๋†’์ธ๋‹ค๋Š” ๊ฒƒ์„ ์ž…์ฆํ–ˆ๋‹ค.

MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources

Paper, Project
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก  ๋ชจ๋ธ์˜ ๋ฐœ์ „์„ ์ €ํ•ดํ•˜๋Š” ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ ๋ถ€์กฑ๊ณผ ๋ถˆ์•ˆ์ •ํ•œ ๊ฐ•ํ™”ํ•™์Šต(RL) ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด MMR1 ํ”„๋กœ์ ํŠธ๋Š” ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ๋ง ์ „๋žต๊ณผ ๋Œ€๊ทœ๋ชจ ๊ณต๊ฐœ ๋ฆฌ์†Œ์Šค๋ฅผ ํ•จ๊ป˜ ์ œ๊ณตํ•œ๋‹ค. ์ด ํ”„๋กœ์ ํŠธ๋Š” RL ํ›ˆ๋ จ์„ ์•ˆ์ •์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋ณด์ƒ ๋ถ„์‚ฐ์„ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์„ ํƒํ•˜๋Š” ๋ถ„์‚ฐ ์ธ์‹ ์ƒ˜ํ”Œ๋ง(VAS) ๊ธฐ๋ฒ•์„ ์ œ์•ˆํ•˜๊ณ , ์•ฝ 160๋งŒ ๊ฐœ์˜ ๊ธด ์‚ฌ๊ณ  ๊ณผ์ •(CoT) ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•œ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ์ฝ”๋“œ๋ฅผ ๊ณต๊ฐœํ•œ๋‹ค. ์‹คํ—˜์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ์™€ VAS ์ „๋žต์˜ ํšจ๊ณผ์„ฑ์„ ์ž…์ฆํ–ˆ์œผ๋ฉฐ, ์ฝ”๋“œ, ๋ฐ์ดํ„ฐ, ๋ชจ๋ธ์„ ๋ชจ๋‘ ๊ณต๊ฐœํ•จ์œผ๋กœ์จ ์ปค๋ฎค๋‹ˆํ‹ฐ์˜ ์—ฐ๊ตฌ ๋ฐœ์ „์— ํฌ๊ฒŒ ๊ธฐ์—ฌํ–ˆ๋‹ค.

Video models are zero-shot learners and reasoners

Paper, Project
์ƒ์„ฑํ˜• ๋น„๋””์˜ค ๋ชจ๋ธ์ด ์–ธ์–ด ๋ถ„์•ผ์˜ LLM์ฒ˜๋Ÿผ ๋ฒ”์šฉ ์‹œ๊ฐ ์ง€๋Šฅ์œผ๋กœ ๋ฐœ์ „ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ํƒ๊ตฌํ•œ ์ด ์—ฐ๊ตฌ๋Š”, ๊ตฌ๊ธ€์˜ Veo 3 ๋ชจ๋ธ์ด ๋ช…์‹œ์ ์œผ๋กœ ํ›ˆ๋ จ๋ฐ›์ง€ ์•Š์€ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ œ๋กœ์ƒท(zero-shot) ๋Šฅ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค. Veo 3๋Š” ๊ฐ์ฒด ๋ถ„ํ• ์ด๋‚˜ ์ด๋ฏธ์ง€ ํŽธ์ง‘๊ณผ ๊ฐ™์€ ๊ธฐ๋ณธ์ ์ธ ์‹œ๊ฐ ๊ณผ์ œ๋ถ€ํ„ฐ ๋ฏธ๋กœ ํ’€๊ธฐ์™€ ๊ฐ™์€ ์‹œ๊ฐ์  ์ถ”๋ก ์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ ๊ด‘๋ฒ”์œ„ํ•œ ๋Šฅ๋ ฅ์„ ๋ฐœํœ˜ํ–ˆ๋‹ค. ์ด๋Š” ๋Œ€๊ทœ๋ชจ ๋น„๋””์˜ค ๋ชจ๋ธ์ด ๋‹จ์ˆœํžˆ ์˜์ƒ์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด, ์‹œ๊ฐ ์„ธ๊ณ„๋ฅผ ์ดํ•ดํ•˜๊ณ  ์กฐ์ž‘ํ•˜๋Š” ๊ทผ๋ณธ์ ์ธ ๋Šฅ๋ ฅ์„ ํ•™์Šตํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ๊ถ๊ทน์ ์œผ๋กœ๋Š” ํ†ตํ•ฉ๋œ ๋ฒ”์šฉ ๋น„์ „ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ๋กœ ์ง„ํ™”ํ•˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฐ•๋ ฅํ•œ ์ฆ๊ฑฐ๋ฅผ ์ œ์‹œํ•œ๋‹ค.

Tree Search for LLM Agent Reinforcement Learning

Paper, Project
์—ฌ๋Ÿฌ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋œ ์—์ด์ „ํŠธ ์ž‘์—…์—์„œ ์ตœ์ข… ๊ฒฐ๊ณผ์—๋งŒ ๋ณด์ƒ์ด ์ฃผ์–ด์ง€๋Š” ํฌ์†Œํ•œ ๊ฐ๋… ๋ฌธ์ œ๋กœ ์ธํ•ด ๊ฐ•ํ™”ํ•™์Šต์˜ ํšจ์œจ์ด ์ €ํ•˜๋˜๋Š” ๊ฒƒ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” ํŠธ๋ฆฌ ๊ธฐ๋ฐ˜ ๊ทธ๋ฃน ์ƒ๋Œ€ ์ •์ฑ… ์ตœ์ ํ™”(Tree-GRPO)๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์—์ด์ „ํŠธ์˜ ํ–‰๋™ ๊ฒฝ๋กœ๋ฅผ ์„ ํ˜•์ด ์•„๋‹Œ ํŠธ๋ฆฌ ๊ตฌ์กฐ๋กœ ๋ชจ๋ธ๋งํ•˜์—ฌ ์ƒ˜ํ”Œ๋ง ํšจ์œจ์„ ๋†’์ด๊ณ , ์„œ๋กœ ๋‹ค๋ฅธ ๋ถ„๊ธฐ(branch)๋ฅผ ๋น„๊ตํ•จ์œผ๋กœ์จ ์ตœ์ข… ๋ณด์ƒ๋งŒ์œผ๋กœ๋„ ์ค‘๊ฐ„ ๊ณผ์ •์˜ ์ข‹๊ณ  ๋‚˜์จ์„ ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, ์ด ํŠธ๋ฆฌ ๊ธฐ๋ฐ˜ ๊ฐ•ํ™”ํ•™์Šต ๋ฐฉ์‹์€ ๊ธฐ์กด์˜ ์„ ํ˜• ๋ฐฉ์‹๋ณด๋‹ค ์›”๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ, ๋ณต์žกํ•œ ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” LLM ์—์ด์ „ํŠธ๋ฅผ ๋” ํšจ๊ณผ์ ์œผ๋กœ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ์ƒˆ๋กœ์šด ๊ธธ์„ ์—ด์—ˆ๋‹ค.

OmniInsert: Mask-Free Video Insertion of Any Reference via Diffusion Transformer Models

Paper, Project
๊ธฐ์กด ๋น„๋””์˜ค ์‚ฝ์ž… ๊ธฐ์ˆ ์ด ๋งˆ์Šคํฌ ์ง€์ •์˜ ๋ฒˆ๊ฑฐ๋กœ์›€, ์‚ฝ์ž… ๋Œ€์ƒ์˜ ์ผ๊ด€์„ฑ ๋ถ€์กฑ, ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๋ถ€์žฌ๋ผ๋Š” ํ•œ๊ณ„๋ฅผ ๊ฐ€์ง€๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” OmniInsert๋ผ๋Š” ๋งˆ์Šคํฌ ์—†๋Š” ๋น„๋””์˜ค ์‚ฝ์ž… ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. OmniInsert๋Š” ์ž์ฒด ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ํŒŒ์ดํ”„๋ผ์ธ(InsertPipe)์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ ๋ถ€์กฑ์„ ํ•ด๊ฒฐํ•˜๊ณ , ๋Œ€์ƒ๊ณผ ๋ฐฐ๊ฒฝ์˜ ๊ท ํ˜•์„ ๋งž์ถ”๋Š” ๋…์ž์ ์ธ ํ›ˆ๋ จ ์ „๋žต๊ณผ ์ธ๊ฐ„์˜ ์„ ํ˜ธ๋„๋ฅผ ๋ชจ๋ฐฉํ•œ ์ตœ์ ํ™” ๊ธฐ๋ฒ•์„ ํ†ตํ•ด ์‚ฝ์ž… ๊ฒฐ๊ณผ๋ฌผ์˜ ์กฐํ™”๋กœ์›€์„ ๊ทน๋Œ€ํ™”ํ•œ๋‹ค. ์ž์ฒด ๊ตฌ์ถ•ํ•œ InsertBench ํ‰๊ฐ€์—์„œ ์ตœ์‹  ์ƒ์šฉ ์†”๋ฃจ์…˜์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ๊ณ ํ’ˆ์งˆ ๋น„๋””์˜ค ์‚ฝ์ž…์„ ์œ„ํ•œ ํฌ๊ด„์ ์ธ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ–ˆ๋‹ค.

Hunyuan3D-Omni: A Unified Framework for Controllable Generation of 3D Assets

Paper, Project
ํ…์ŠคํŠธ๋‚˜ ์ด๋ฏธ์ง€ ์ž…๋ ฅ์— ์ฃผ๋กœ ์˜์กดํ•˜๋Š” ๊ธฐ์กด 3D ์ƒ์„ฑ ๋ชจ๋ธ๋“ค์ด ๊ธฐํ•˜ํ•™์  ๊ตฌ์กฐ๋‚˜ ํฌ์ฆˆ์— ๋Œ€ํ•œ ์„ธ๋ฐ€ํ•œ ์ œ์–ด ๋Šฅ๋ ฅ์ด ๋ถ€์กฑํ•˜๋‹ค๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž Hunyuan3D-Omni๊ฐ€ ๊ฐœ๋ฐœ๋˜์—ˆ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋‹จ์ผ ํ†ตํ•ฉ ์•„ํ‚คํ…์ฒ˜ ๋‚ด์—์„œ ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ, ๋ณต์…€, ๊ณจ๊ฒฉ ํฌ์ฆˆ ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ์ œ์–ด ์‹ ํ˜ธ๋ฅผ ์ˆ˜์šฉํ•˜๋ฉฐ, ํ›ˆ๋ จ ์‹œ ๋” ์–ด๋ ค์šด ์ œ์–ด ์‹ ํ˜ธ๋ฅผ ์šฐ์„ ์ ์œผ๋กœ ํ•™์Šตํ•˜๋Š” ๋‚œ์ด๋„ ์ธ์‹ ์ƒ˜ํ”Œ๋ง ์ „๋žต์„ ์‚ฌ์šฉํ•œ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ์ƒ์„ฑ๋ฌผ์˜ ์ •ํ™•๋„์™€ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ์œผ๋ฉฐ, ์ด๋Š” 3D ์—์…‹ ์ƒ์„ฑ์„ ๊ฒŒ์ž„, ์˜ํ™” ๋“ฑ ์‹ค์ œ ์‚ฐ์—… ํ˜„์žฅ์—์„œ ๋”์šฑ ์‹ค์šฉ์ ์œผ๋กœ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“ค์—ˆ๋‹ค.

SPATIALGEN: Layout-guided 3D Indoor Scene Generation

Paper, Project
๊ณ ํ’ˆ์งˆ 3D ์‹ค๋‚ด ์žฅ๋ฉด์„ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ์žˆ์–ด ๊ฐ€์žฅ ํฐ ๋ณ‘๋ชฉ์ด์—ˆ๋˜ ๋Œ€๊ทœ๋ชจ ๋งž์ถคํ˜• ๋ฐ์ดํ„ฐ์…‹์˜ ๋ถ€์žฌ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” ๋ฐฉ๋Œ€ํ•œ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์…‹์„ ์ง์ ‘ ๊ตฌ์ถ•ํ•˜๊ณ  ์ด๋ฅผ ํ™œ์šฉํ•˜๋Š” ์ƒ์„ฑ ๋ชจ๋ธ SpatialGen์„ ์„ ๋ณด์ธ๋‹ค. SpatialGen์€ 3D ๋ ˆ์ด์•„์›ƒ๊ณผ ์ฐธ์กฐ ์ด๋ฏธ์ง€๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ํŠน์ • ์‹œ์ ์—์„œ ๋ฐ”๋ผ๋ณธ ์žฅ๋ฉด์˜ ์™ธํ˜•(์ƒ‰์ƒ), ๊ธฐํ•˜ํ•™(์ขŒํ‘œ), ์˜๋ฏธ(๋ถ„ํ• ) ์ •๋ณด๋ฅผ ๋ชจ๋‘ ์ƒ์„ฑํ•˜๋ฉฐ, ๋ชจ๋“  ์‹œ์ ๊ณผ ์ถœ๋ ฅ ์ •๋ณด์— ๊ฑธ์ณ ๊ณต๊ฐ„์  ์ผ๊ด€์„ฑ์„ ์™„๋ฒฝํ•˜๊ฒŒ ์œ ์ง€ํ•œ๋‹ค. ์‹คํ—˜์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์šฐ์ˆ˜ํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์˜€์œผ๋ฉฐ, ์ง์ ‘ ๊ตฌ์ถ•ํ•œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋ชจ๋ธ์„ ๋ชจ๋‘ ๊ณต๊ฐœํ•˜์—ฌ ๊ด€๋ จ ๋ถ„์•ผ์˜ ์—ฐ๊ตฌ ๋ฐœ์ „์— ํฌ๊ฒŒ ๊ธฐ์—ฌํ–ˆ๋‹ค.

Residual Off-Policy RL for Finetuning Behavior Cloning Policies

Paper, Project
์ธ๊ฐ„์˜ ์‹œ์—ฐ์— ์˜์กดํ•˜๋Š” ํ–‰๋™ ๋ณต์ œ(BC)์™€ ์‹ค์ œ ๋กœ๋ด‡์— ์ ์šฉํ•˜๊ธฐ ์–ด๋ ค์šด ๊ฐ•ํ™”ํ•™์Šต(RL)์˜ ์žฅ์ ์„ ๊ฒฐํ•ฉํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” ์ž”์ฐจ ์˜คํ”„-ํด๋ฆฌ์‹œ ๊ฐ•ํ™”ํ•™์Šต์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋ฏธ๋ฆฌ ํ›ˆ๋ จ๋œ BC ์ •์ฑ…์„ ๊ธฐ๋ฐ˜์œผ๋กœ, RL์ด ์ „์ฒด ํ–‰๋™์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ฐฐ์šฐ๋Š” ๋Œ€์‹  BC ์ •์ฑ…์˜ ํ–‰๋™์— ๋งค ์ˆœ๊ฐ„ ์ž‘์€ ์ˆ˜์ •๊ฐ’(์ž”์ฐจ)์„ ๋”ํ•˜๋Š” ๋ฒ•๋งŒ์„ ํ•™์Šตํ•˜๊ฒŒ ํ•œ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ์ •๊ตํ•œ ์†์„ ๊ฐ€์ง„ ์‹ค์ œ ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡์— ๊ฐ•ํ™”ํ•™์Šต์„ ์„ฑ๊ณต์ ์œผ๋กœ ์ ์šฉํ•œ ์ตœ์ดˆ์˜ ์‚ฌ๋ก€๋ฅผ ๋งŒ๋“ค์–ด๋ƒˆ์œผ๋ฉฐ, ๋ณต์žกํ•œ ์‹ค์ œ ์‹œ์Šคํ…œ์— RL์„ ํšจ์œจ์ ์œผ๋กœ ๋ฐฐํฌํ•  ์ˆ˜ ์žˆ๋Š” ์‹ค์šฉ์ ์ธ ๊ฒฝ๋กœ๋ฅผ ์—ด์—ˆ๋‹ค.

CHARM: Control-point-based 3D Anime Hairstyle Auto-Regressive Modeling

Paper, Project
๋…ํŠนํ•œ ๊ธฐํ•˜ํ•™์  ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ ์• ๋‹ˆ๋ฉ”์ด์…˜ ํ—ค์–ด์Šคํƒ€์ผ์„ ๊ธฐ์กด ๋ฐฉ์‹์œผ๋กœ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์–ด๋ ต๊ณ , ๊ด€๋ จ ๋ฐ์ดํ„ฐ์…‹์ด ๋ถ€์กฑํ•˜๋‹ค๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด CHARM์ด ์ œ์•ˆ๋˜์—ˆ๋‹ค. CHARM์€ ํ—ค์–ด ๋ฉ์–ด๋ฆฌ๋ฅผ ์†Œ์ˆ˜์˜ ์ œ์–ด์ ์œผ๋กœ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ํ‘œํ˜„ํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ์‹์„ ๋„์ž…ํ•˜๊ณ , ์ง์ ‘ ๊ตฌ์ถ•ํ•œ ๋Œ€๊ทœ๋ชจ AnimeHair ๋ฐ์ดํ„ฐ์…‹์„ ๋ฐ”ํƒ•์œผ๋กœ ํ—ค์–ด ์–ธ์–ด๋ฅผ ํ•™์Šตํ•˜๋Š” ์ž๊ธฐํšŒ๊ท€ ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ด๋ฏธ์ง€๋‚˜ ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ๋งŒ์œผ๋กœ ๊ณ ํ’ˆ์งˆ์˜ 3D ์• ๋‹ˆ๋ฉ”์ด์…˜ ํ—ค์–ด์Šคํƒ€์ผ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ณต์›๊ณผ ์ƒ์„ฑ ์–‘์ชฝ์—์„œ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ ํ•ด๋‹น ๋ถ„์•ผ๋ฅผ ์œ„ํ•œ ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ–ˆ๋‹ค.

profile
XR๊ณผ AI์— ๊ด€์‹ฌ์ด ๋งŽ์€ Sky ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€