[2025/W38] ๐Ÿค— Weekly AI Research

Skyยท2025๋…„ 9์›” 19์ผ

Weekly AI Research Digest

๋ชฉ๋ก ๋ณด๊ธฐ
60/89

์ง€์†์  ์‚ฌ์ „ํ•™์Šต๊ณผ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ๊ณ ๋„ํ™”๋œ AI ์—์ด์ „ํŠธ์˜ ์‹ฌ์ธต ์—ฐ๊ตฌ ๋ฐ ์ถ”๋ก  ๋Šฅ๋ ฅ
๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹ ๊ธฐ๋ฐ˜์˜ 4D ์›”๋“œ ๋ชจ๋ธ๋ง๊ณผ AI ํŒŒ์ดํ”„๋ผ์ธ์„ ํ†ตํ•œ 3D ์• ์…‹ ์ƒ์„ฑ ์ž๋™ํ™”

OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling

Paper, Project
AI๊ฐ€ 3์ฐจ์› ๊ณต๊ฐ„๊ณผ ์‹œ๊ฐ„์˜ ํ๋ฆ„์„ ํ•จ๊ป˜ ์ดํ•ดํ•˜๋Š” 4D ์›”๋“œ ๋ชจ๋ธ๋ง ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์„ ์œ„ํ•ด์„œ๋Š” ์–‘์งˆ์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์ˆ˜์ ์ด์ง€๋งŒ, ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹์€ ๋ณต์žก์„ฑ์ด ๋ถ€์กฑํ•˜์—ฌ ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ๊ณผ ํ˜„์‹ค์ ์ธ ์ƒํ˜ธ์ž‘์šฉ์„ ๋‹ด์€ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹ 'OmniWorld'๋ฅผ ๊ณต๊ฐœํ–ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•ด AI ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚จ ๊ฒฐ๊ณผ, 4D ๊ณต๊ฐ„ ์žฌ๊ตฌ์„ฑ ๋ฐ ์˜์ƒ ์ƒ์„ฑ ์ž‘์—…์—์„œ ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋จ์„ ํ™•์ธํ–ˆ์œผ๋ฉฐ, ์ด๋Š” ํ–ฅํ›„ ๋” ๋ฐœ์ „๋œ 4D ์›”๋“œ ๋ชจ๋ธ ๊ฐœ๋ฐœ์„ ๊ฐ€์†ํ•˜๋Š” ์ค‘์š”ํ•œ ์ž์›์ด ๋  ๊ฒƒ์ด๋‹ค.

WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

Paper, Project
๊ธฐ์กด AI๋Š” ์›น์˜ ๋ฐฉ๋Œ€ํ•œ ์ •๋ณด๋กœ ์‹ฌ์ธต ๋ณด๊ณ ์„œ๋ฅผ ์ž‘์„ฑํ•  ๋•Œ, ๊ณ ์ •๋œ ๊ณ„ํš์œผ๋กœ ๊ธด ๊ธ€์„ ํ•œ ๋ฒˆ์— ์ƒ์„ฑํ•˜๋ ค๋‹ค ๋ณด๋‹ˆ ๋‚ด์šฉ์ด ๋ถ€์‹คํ•ด์ง€๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์—ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์ธ๊ฐ„์˜ ์—ฐ๊ตฌ ๊ณผ์ •์ฒ˜๋Ÿผ ๋™์ ์œผ๋กœ ๊ณ„ํš์„ ์ˆ˜์ •ํ•˜๋Š” 'WebWeaver' ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. WebWeaver๋Š” ์ •๋ณด๋ฅผ ์ˆ˜์ง‘ํ•˜๋ฉฐ ๋ณด๊ณ ์„œ ๊ฐœ์š”๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ์ตœ์ ํ™”ํ•˜๋Š” 'ํ”Œ๋ž˜๋„ˆ'์™€, ์ด ๊ฐœ์š”์— ๋”ฐ๋ผ ํ•„์š”ํ•œ ๋ถ€๋ถ„๋งŒ ์ง‘์ค‘์ ์œผ๋กœ ์ž‘์„ฑํ•˜๋Š” '๋ผ์ดํ„ฐ'๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ์ด ์ ‘๊ทผ๋ฒ•์„ ํ†ตํ•ด ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ ์ ์‘ํ˜• ๊ณ„ํš์˜ ์ค‘์š”์„ฑ์„ ์ž…์ฆํ–ˆ๋‹ค.

Scaling Agents via Continual Pre-training

Paper, Project
์˜คํ”ˆ์†Œ์Šค ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ ๊ธฐ๋ฐ˜์˜ AI ์—์ด์ „ํŠธ๋Š” ๋ณต์žกํ•œ ์ž‘์—…์—์„œ ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ๋ณด์ด๋Š”๋ฐ, ์ด๋Š” ๋ฒ”์šฉ ๋ชจ๋ธ์— ์—์ด์ „ํŠธ ํ–‰๋™๊ณผ ์ „๋ฌธ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ๋™์‹œ์— ํ•™์Šต์‹œํ‚ฌ ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์ตœ์ ํ™” ์ถฉ๋Œ ๋•Œ๋ฌธ์ด์—ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ๋ณธ๊ฒฉ์ ์ธ ํŠœ๋‹ ์ „์— ์—์ด์ „ํŠธ์˜ ๊ธฐ์ดˆ ๋Šฅ๋ ฅ์„ ๋ฏธ๋ฆฌ ํ•™์Šต์‹œํ‚ค๋Š” '์—์ด์ „ํŠธ ์ง€์†์  ์‚ฌ์ „ํ•™์Šต(Agentic CPT)' ๋‹จ๊ณ„๋ฅผ ๋„์ž…ํ–ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•๋ก ์„ ์ ์šฉํ•ด ๊ฐœ๋ฐœํ•œ 'AgentFounder' ๋ชจ๋ธ์€ ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ์ด๋Š” ๊ฐ•๋ ฅํ•œ ์—์ด์ „ํŠธ ๊ตฌ์ถ•์„ ์œ„ํ•ด ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ์„ ์‚ฌ์ „ํ•™์Šต์œผ๋กœ ๋จผ์ € ๋‹ค์ง€๋Š” ๊ฒƒ์ด ํšจ๊ณผ์ ์ž„์„ ๋ณด์—ฌ์ค€๋‹ค.

WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning

Paper, Project
์˜คํ”ˆ์†Œ์Šค AI ์—์ด์ „ํŠธ๋Š” ๋…์  ์—์ด์ „ํŠธ์— ๋น„ํ•ด ๋ณต์žกํ•œ ์ •๋ณด ํƒ์ƒ‰ ๋Šฅ๋ ฅ์ด ๋’ค์ฒ˜์กŒ๋Š”๋ฐ, ๊ทธ ์›์ธ์€ ๋ฐฉ๋Œ€ํ•œ ์ •๋ณด ์†์—์„œ ๋ถˆํ™•์‹ค์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ค„์—ฌ๋‚˜๊ฐ€๋Š” ์ถ”๋ก  ๋Šฅ๋ ฅ์˜ ๋ถ€์žฌ์— ์žˆ์—ˆ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž 'WebSailor' ๋ฐฉ๋ฒ•๋ก ์„ ํ†ตํ•ด ์ผ๋ถ€๋Ÿฌ ๋ถˆํ™•์‹ค์„ฑ์„ ๋†’์ธ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ํšจ์œจ์ ์ธ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œ์ผฐ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ์˜คํ”ˆ์†Œ์Šค ์—์ด์ „ํŠธ์˜ ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผœ ๋…์  ์—์ด์ „ํŠธ์™€์˜ ๊ธฐ์ˆ  ๊ฒฉ์ฐจ๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ์ค„์ผ ์ˆ˜ ์žˆ์—ˆ๋‹ค.

ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data

Paper, Project
AI๊ฐ€ ์ธ๊ฐ„์ฒ˜๋Ÿผ ์ปดํ“จํ„ฐ GUI๋ฅผ ์กฐ์ž‘ํ•˜๋Š” ์—์ด์ „ํŠธ ๊ธฐ์ˆ ์€ ๋Œ€๊ทœ๋ชจ ์˜คํ”ˆ์†Œ์Šค ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถ€์กฑํ•˜์—ฌ ๋ฐœ์ „์ด ๋”๋Ž ๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด 6๊ฐœ์˜ ์šด์˜์ฒด์ œ๋ฅผ ์•„์šฐ๋ฅด๋Š” ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹ 'ScaleCUA'๋ฅผ ๊ตฌ์ถ•ํ–ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์€ ์—ฌ๋Ÿฌ ํ”Œ๋žซํผ์„ ๋„˜๋‚˜๋“ค๋ฉฐ ์ž‘์—…์„ ์›ํ™œํžˆ ์ˆ˜ํ–‰ํ–ˆ๊ณ , ๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ์ตœ๊ณ  ๊ธฐ๋ก์„ ๊ฒฝ์‹ ํ•˜๋ฉฐ ๋ฒ”์šฉ ์ปดํ“จํ„ฐ ์‚ฌ์šฉ ์—์ด์ „ํŠธ์˜ ๋ฐœ์ „์— ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ํ™•์žฅ์ด ๋งค์šฐ ์ค‘์š”ํ•จ์„ ์ฆ๋ช…ํ–ˆ๋‹ค.

FlowRL: Matching Reward Distributions for LLM Reasoning

Paper, Project
๊ธฐ์กด์˜ ์–ธ์–ด ๋ชจ๋ธ ๊ฐ•ํ™”ํ•™์Šต์€ ๊ฐ€์žฅ ๋†’์€ ๋ณด์ƒ๋งŒ ์ข‡๋‹ค ๋ณด๋‹ˆ, ๋œ ์ผ๋ฐ˜์ ์ด์ง€๋งŒ ์œ ํšจํ•œ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ๋†“์ณ ๋ชจ๋ธ์˜ ๋‹ค์–‘์„ฑ์„ ํ•ด์น˜๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์—ˆ๋‹ค. 'FlowRL'์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‹จ์ผ ๋ณด์ƒ ๊ทน๋Œ€ํ™” ๋Œ€์‹  ์ „์ฒด '๋ณด์ƒ ๋ถ„ํฌ'๋ฅผ ํ•™์Šต ๋ชฉํ‘œ๋กœ ์‚ผ์•˜๋‹ค. ์ฆ‰, ๋‹ค์–‘ํ•œ ์ •๋‹ต ๊ฒฝ๋กœ๋ฅผ ๊ณจ๊ณ ๋ฃจ ๋ฐฐ์šฐ๋„๋ก ์œ ๋„ํ•œ ๊ฒฐ๊ณผ, ์ˆ˜ํ•™ ๋ฐ ์ฝ”๋“œ ์ถ”๋ก  ๋ฌธ์ œ์—์„œ ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ์›”๋“ฑํžˆ ๋†’์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ ํšจ์œจ์ ์ธ ํƒ์ƒ‰๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ ํ–ฅ์ƒ์„ ์ด๋Œ์–ด๋ƒˆ๋‹ค.

WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents

Paper, Project
์žฅ๊ธฐ์ ์ธ ์‹ฌ์ธต ์—ฐ๊ตฌ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” AI ์—์ด์ „ํŠธ๋Š” ๋‹จ์ผ ๋ฌธ๋งฅ ์•ˆ์—์„œ ๋„ˆ๋ฌด ๋งŽ์€ ์ •๋ณด๋ฅผ ์ฒ˜๋ฆฌํ•˜๋‹ค ๋‚ด์šฉ์˜ ํ•ต์‹ฌ์„ ๋†“์น˜๋Š” '๋ฌธ๋งฅ ์งˆ์‹' ๋ฌธ์ œ๋ฅผ ๊ฒช์–ด์™”๋‹ค. 'WebResearcher'๋Š” ์—ฐ๊ตฌ ๊ณผ์ •์„ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„๋กœ ๋‚˜๋ˆ„์–ด ์ฃผ๊ธฐ์ ์œผ๋กœ ์ค‘๊ฐ„ ๊ฒฐ๊ณผ๋ฅผ ์ •๋ฆฌํ•˜๊ณ  ๋‹ค์‹œ ์ง‘์ค‘ํ•˜๋Š” ๋ฐ˜๋ณต์  ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๋„์ž…ํ•˜์—ฌ ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ–ˆ๋‹ค. ๋˜ํ•œ ๋ณต์žกํ•œ ์—ฐ๊ตฌ ๊ณผ์ œ๋ฅผ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ๋ฐ์ดํ„ฐ ์—”์ง„์„ ํ™œ์šฉํ•ด ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚จ ๊ฒฐ๊ณผ, ์—ฌ๋Ÿฌ ๊นŒ๋‹ค๋กœ์šด ๋ฒค์น˜๋งˆํฌ์—์„œ ์ตœ์ฒจ๋‹จ ๋…์  ์‹œ์Šคํ…œ๋งˆ์ € ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.

Hunyuan3D Studio: End-to-End AI Pipeline for Game-Ready 3D Asset Generation

Paper, Project
๊ฒŒ์ž„ ๊ฐœ๋ฐœ์— ํ•„์ˆ˜์ ์ธ ๊ณ ํ’ˆ์งˆ 3D ์• ์…‹ ์ œ์ž‘์€ ์‹œ๊ฐ„๊ณผ ๋…ธ๋ ฅ์ด ๋งŽ์ด ๋“œ๋Š” ๋…ธ๋™ ์ง‘์•ฝ์  ์ž‘์—…์ด์—ˆ๋‹ค. 'Hunyuan3D Studio'๋Š” ํ…์ŠคํŠธ๋‚˜ ์ด๋ฏธ์ง€ ํ•œ ์žฅ๋งŒ์œผ๋กœ ๊ฒŒ์ž„ ์—”์ง„์— ๋ฐ”๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ตœ์ ํ™”๋œ 3D ๋ชจ๋ธ๊ณผ ํ…์Šค์ฒ˜๋ฅผ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ํ†ตํ•ฉ AI ํ”Œ๋žซํผ์ด๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ์ฐฝ์˜์ ์ธ ์•„์ด๋””์–ด๋ฅผ ๊ธฐ์ˆ ์ ์ธ ๊ฒฐ๊ณผ๋ฌผ๋กœ ์ฆ‰์‹œ ๋ณ€ํ™˜ํ•˜์—ฌ 3D ์ฝ˜ํ…์ธ  ์ œ์ž‘ ์‹œ๊ฐ„์„ ํš๊ธฐ์ ์œผ๋กœ ๋‹จ์ถ•ํ•˜๊ณ , ๊ฒŒ์ž„ ๊ฐœ๋ฐœ ๋ถ„์•ผ์˜ AI ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ํ˜์‹ ํ–ˆ๋‹ค.

X-Part: high fidelity and structure coherent shape decomposition

Paper
๊ธฐ์กด 3D ์ƒ์„ฑ ๊ธฐ์ˆ ์€ ๋ชจ๋ธ์„ ์˜๋ฏธ ์žˆ๋Š” ๋ถ€ํ’ˆ ๋‹จ์œ„๋กœ ๊น”๋”ํ•˜๊ฒŒ ๋ถ„ํ•ดํ•˜์ง€ ๋ชปํ•ด ํ›„์† ํŽธ์ง‘ ์ž‘์—…์— ์–ด๋ ค์›€์ด ์žˆ์—ˆ๋‹ค. 'X-Part'๋Š” 3D ๊ฐ์ฒด๋ฅผ ์˜์ž์˜ ๋‹ค๋ฆฌ, ๋“ฑ๋ฐ›์ด์ฒ˜๋Ÿผ ๊ตฌ์กฐ์ ์œผ๋กœ ์ผ๊ด€๋˜๊ณ  ์˜๋ฏธ ์žˆ๋Š” ์—ฌ๋Ÿฌ ๋ถ€ํ’ˆ์œผ๋กœ ์ •๊ตํ•˜๊ฒŒ ๋ถ„ํ•ดํ•˜๋Š” ์ƒˆ๋กœ์šด ์ƒ์„ฑ ๋ชจ๋ธ์ด๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ถ€ํ’ˆ ๋‹จ์œ„ 3D ์ƒ์„ฑ ๋ถ„์•ผ์—์„œ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ์‚ฌ์šฉ์ž๊ฐ€ ์‰ฝ๊ฒŒ ํŽธ์ง‘ํ•  ์ˆ˜ ์žˆ๋Š” ์ œ์ž‘ ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•˜์—ฌ ์ƒ์—…์šฉ 3D ์• ์…‹ ์ œ์ž‘์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ–ˆ๋‹ค.

profile
XR๊ณผ AI์— ๊ด€์‹ฌ์ด ๋งŽ์€ Sky ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€