[2025/W34] ๐Ÿค— Weekly AI Research

Skyยท2025๋…„ 8์›” 24์ผ

Weekly AI Research Digest

๋ชฉ๋ก ๋ณด๊ธฐ
52/89

๊ณผํ•™ ํŠนํ™” ๋ชจ๋ธ๊ณผ ์ž๊ธฐ์ง€๋„ ๋น„์ „์—์„œ ๋ฉ”๋ชจ๋ฆฌ ๊ธฐ๋ฐ˜ ์ถ”๋ก ๊นŒ์ง€
๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ, ๋ฉ”๋ชจ๋ฆฌ ์กฐ์ง ๊ฒ€์ƒ‰, ๊ทธ๋ฆฌ๊ณ  3D ๊ฐ์ฒด ์žฌ๊ตฌ์„ฑ์˜ ํ˜์‹ ์  ๋ฐœ์ „

Intern-S1: A Scientific Multimodal Foundation Model

Paper, Project
Intern-S1์€ ๊ณผํ•™ ๋ถ„์•ผ์— ํŠนํ™”๋œ ๋‹ค์ค‘ ๋ชจ๋‹ฌ ๊ธฐ์ดˆ ๋ชจ๋ธ๋กœ, 28B ํ™œ์„ฑํ™” ๋งค๊ฐœ๋ณ€์ˆ˜์™€ 241B ์ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง„ MoE ๊ตฌ์กฐ๋ฅผ ์ฑ„ํƒํ–ˆ๋‹ค. 5T ํ† ํฐ(2.5T ๊ณผํ•™ ๋„๋ฉ”์ธ ํ† ํฐ ํฌํ•จ)์œผ๋กœ ์‚ฌ์ „ ํ•™์Šตํ•œ ํ›„ 1000๊ฐœ ์ด์ƒ์˜ ์ž‘์—…์— ๋Œ€ํ•œ ๊ฐ•ํ™”ํ•™์Šต์„ ์ง„ํ–‰ํ–ˆ์œผ๋ฉฐ, Mixture-of-Rewards ๊ธฐ๋ฒ•์„ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์ž‘์—…์— ๋Œ€ํ•œ ํ›ˆ๋ จ ์‹œ๋„ˆ์ง€ ํšจ๊ณผ๋ฅผ ์ฐฝ์ถœํ–ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ์ผ๋ฐ˜ ์ถ”๋ก  ์ž‘์—…์—์„œ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ ์ค‘ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ํŠนํžˆ ๋ถ„์ž ํ•ฉ์„ฑ ๊ณ„ํš, ๋ฐ˜์‘ ์กฐ๊ฑด ์˜ˆ์ธก ๋“ฑ ๊ณผํ•™ ๋„๋ฉ”์ธ์—์„œ ํด๋กœ์ฆˆ๋“œ ์†Œ์Šค SOTA ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

DINOv3

Paper, Project
DINOv3๋Š” ์ž๊ธฐ์ง€๋„ํ•™์Šต ๊ธฐ๋ฐ˜ ๋น„์ „ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ๋กœ, ๋ฐ์ดํ„ฐ ๋ฐ ๋ชจ๋ธ ํฌ๊ธฐ ํ™•์žฅ์˜ ์ด์ ์„ ํ™œ์šฉํ•œ ์„ธ์‹ฌํ•œ ๋ฐ์ดํ„ฐ ์ค€๋น„ ๋ฐ ์ตœ์ ํ™”๋ฅผ ํŠน์ง•์œผ๋กœ ํ•œ๋‹ค. ์ด ๋ชจ๋ธ์€ "Gram anchoring" ๊ธฐ๋ฒ•์„ ๋„์ž…ํ•˜์—ฌ ๊ธด ํ›ˆ๋ จ ์ผ์ • ๋™์•ˆ ๋ฐ€์ง‘ ํŠน์ง• ๋งต ํ’ˆ์งˆ ์ €ํ•˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ–ˆ์œผ๋ฉฐ, ํ•ด์ƒ๋„, ๋ชจ๋ธ ํฌ๊ธฐ, ํ…์ŠคํŠธ ์ •๋ ฌ ๊ด€๋ จ ์‚ฌํ›„ ์ „๋žต์„ ์ ์šฉํ•ด ๋ชจ๋ธ ์œ ์—ฐ์„ฑ์„ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ๋‹ค์–‘ํ•œ ๋น„์ „ ์ž‘์—…์—์„œ ๊ธฐ์กด ์ž๊ธฐ์ง€๋„ ๋ฐ ์•ฝ์ง€๋„ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ฆฌ์†Œ์Šค ์ œ์•ฝ ๋ฐ ๋ฐฐํฌ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋งž๋Š” ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•œ๋‹ค.

Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL

Paper, Project
Chain-of-Agents๋Š” ๋‹จ์ผ ๋ชจ๋ธ ๋‚ด์—์„œ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์ฒ˜๋Ÿผ ์ž‘๋™ํ•˜๋Š” ์ƒˆ๋กœ์šด LLM ์ถ”๋ก  ํŒจ๋Ÿฌ๋‹ค์ž„์œผ๋กœ, ๋ชจ๋ธ์ด ๋‹ค์–‘ํ•œ ๋„๊ตฌ ์—์ด์ „ํŠธ์™€ ์—ญํ•  ์—์ด์ „ํŠธ๋ฅผ ๋™์ ์œผ๋กœ ํ™œ์„ฑํ™”ํ•˜์—ฌ ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค. ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์ฆ๋ฅ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด ์ตœ์ฒจ๋‹จ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ Chain-of-Agents ๊ถค์ ์œผ๋กœ ์ฆ๋ฅ˜ํ•˜๊ณ , ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ์—์ด์ „ํŠธ ์ž‘์—…์— ๋Œ€ํ•œ ์—์ด์ „ํŠธ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ๋ชจ๋ธ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ์ด ์ ‘๊ทผ๋ฒ•์€ ์›น ์—์ด์ „ํŠธ์™€ ์ฝ”๋“œ ์—์ด์ „ํŠธ ์„ค์ • ๋ชจ๋‘์—์„œ SOTA ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ๋ชจ๋ธ ๊ฐ€์ค‘์น˜, ํ›ˆ๋ จ ๋ฐ ํ‰๊ฐ€ ์ฝ”๋“œ, ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ๋‘ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ–ˆ๋‹ค.

Ovis2.5 Technical Report

Paper, Project
Ovis2.5๋Š” ์›๋ณธ ํ•ด์ƒ๋„ ์‹œ๊ฐ ์ธ์‹ ๋ฐ ๊ฐ•๋ ฅํ•œ ๋‹ค์ค‘ ๋ชจ๋‹ฌ ์ถ”๋ก ์„ ์œ„ํ•œ ๋ชจ๋ธ๋กœ, ์›๋ณธ ๊ฐ€๋ณ€ ํ•ด์ƒ๋„๋กœ ์ด๋ฏธ์ง€๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ๋น„์ „ ํŠธ๋žœ์Šคํฌ๋จธ๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ๋ณต์žกํ•œ ์ฐจํŠธ์™€ ๊ฐ™์€ ์‹œ๊ฐ์  ๋ฐ€์ง‘ ์ฝ˜ํ…์ธ ์˜ ํ’ˆ์งˆ์„ ์œ ์ง€ํ•œ๋‹ค. ์ž๊ธฐ ๊ฒ€์‚ฌ ๋ฐ ์ˆ˜์ •์„ ํฌํ•จํ•œ "reflection" ๊ธฐ๋Šฅ์„ ๊ตฌํ˜„ํ•ด ์„ ํ˜• ์‚ฌ๊ณ  ์—ฐ์‡„๋ฅผ ๋„˜์–ด์„  ์ถ”๋ก ์„ ๊ฐ•ํ™”ํ–ˆ์œผ๋ฉฐ, 5๋‹จ๊ณ„ ์ปค๋ฆฌํ˜๋Ÿผ ํ›ˆ๋ จ๊ณผ DPO ๋ฐ GRPO๋ฅผ ํ†ตํ•œ ์ •๋ ฌ ๋ฐ ์ถ”๋ก  ํ–ฅ์ƒ ๊ณผ์ •์„ ๊ฑฐ์ณค๋‹ค. Ovis2.5-9B์™€ Ovis2.5-2B ๋‘ ๊ฐ€์ง€ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์„ ์ถœ์‹œํ–ˆ์œผ๋ฉฐ, OpenCompass ๋‹ค์ค‘ ๋ชจ๋‹ฌ ๋ฆฌ๋”๋ณด๋“œ์—์„œ ๊ฐ๊ฐ 78.3์ ๊ณผ 73.9์ ์œผ๋กœ SOTA ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

SSRL: Self-Search Reinforcement Learning

Paper, Project
SSRL์€ LLM์˜ ๋‚ด์žฌ์  ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ์™ธ๋ถ€ ๊ฒ€์ƒ‰ ์—”์ง„ ์˜์กด๋„๋ฅผ ์ค„์ด๋Š” ๊ฐ•ํ™”ํ•™์Šต ์ ‘๊ทผ๋ฒ•์ด๋‹ค. ๊ตฌ์กฐํ™”๋œ ํ”„๋กฌํ”„ํŒ…๊ณผ ๋ฐ˜๋ณต ์ƒ˜ํ”Œ๋ง์„ ํ†ตํ•œ "Self-Search" ๋ฐฉ์‹์œผ๋กœ LLM์˜ ๋‚ด์žฌ์  ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์„ ์ •๋Ÿ‰ํ™”ํ•˜๊ณ , ํ˜•์‹ ๊ธฐ๋ฐ˜ ๋ฐ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ๋ณด์ƒ์„ ํ†ตํ•ด LLM์˜ Self-Search ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์™ธ๋ถ€ ๋„๊ตฌ ์—†์ด ๋‚ด๋ถ€์ ์œผ๋กœ ์ง€์‹ ํ™œ์šฉ์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ์ œ๊ณตํ•˜๋ฉฐ, ์‹คํ—˜ ๊ฒฐ๊ณผ LLM์€ ํšจ๊ณผ์ ์œผ๋กœ ์ด๋Œ์–ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ์„ธ๊ณ„ ์ง€์‹์„ ๋ณด์œ ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ๋‚ด๋ถ€ ์ง€์‹ ํ™œ์šฉ์œผ๋กœ ํ™˜๊ฐ์„ ๊ฐ์†Œ์‹œํ‚ค๊ณ , ์™ธ๋ถ€ ๊ฒ€์ƒ‰ ์—”์ง„๊ณผ ์›ํ™œํ•˜๊ฒŒ ํ†ตํ•ฉ๋จ์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค.

Thyme: Think Beyond Images

Paper, Project
Thyme๋Š” ์ด๋ฏธ์ง€๋ฅผ ๋„˜์–ด์„  ์‚ฌ๊ณ  ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ๋‹ค์ค‘ ๋ชจ๋‹ฌ ์–ธ์–ด ๋ชจ๋ธ๋กœ, ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์ฝ”๋“œ๋ฅผ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ๋ฐ ๊ณ„์‚ฐ ์ž‘์—…์„ ์ž์œจ์ ์œผ๋กœ ์ƒ์„ฑํ•˜๊ณ  ์‹คํ–‰ํ•œ๋‹ค. ์ด๋ฏธ์ง€ ์กฐ์ž‘(์ž๋ฅด๊ธฐ, ํšŒ์ „, ๋Œ€๋น„ ํ–ฅ์ƒ ๋“ฑ)๊ณผ ์ˆ˜ํ•™์  ๊ณ„์‚ฐ์„ ๋™์‹œ์— ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ฝ”๋“œ ์ƒ์„ฑ์„ ์œ„ํ•œ 500K ์ƒ˜ํ”Œ์˜ SFT ํ›ˆ๋ จ ํ›„ ์˜์‚ฌ ๊ฒฐ์ • ๊ฐœ์„ ์„ ์œ„ํ•œ RL ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋œ 2๋‹จ๊ณ„ ํ›ˆ๋ จ ์ „๋žต์„ ์‚ฌ์šฉํ–ˆ๋‹ค. GRPO-ATS ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์•ˆํ•˜์—ฌ ํ…์ŠคํŠธ์™€ ์ฝ”๋“œ ์ƒ์„ฑ์— ์„œ๋กœ ๋‹ค๋ฅธ ์˜จ๋„๋ฅผ ์ ์šฉํ•จ์œผ๋กœ์จ ์ถ”๋ก  ํƒ์ƒ‰๊ณผ ์ฝ”๋“œ ์‹คํ–‰ ์ •๋ฐ€๋„ ์‚ฌ์ด์˜ ๊ท ํ˜•์„ ์œ ์ง€ํ–ˆ์œผ๋ฉฐ, 20๊ฐœ ๊ฐ€๊นŒ์šด ๋ฒค์น˜๋งˆํฌ์—์„œ ์ผ๊ด€๋œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์˜€๋‹ค.

DuPO: Enabling Reliable LLM Self-Verification via Dual Preference Optimization

Paper
DuPO๋Š” ์ผ๋ฐ˜ํ™”๋œ ์ด์ค‘์„ฑ์„ ํ†ตํ•ด ์ฃผ์„ ์—†๋Š” ํ”ผ๋“œ๋ฐฑ์„ ์ƒ์„ฑํ•˜๋Š” ์ด์ค‘ ํ•™์Šต ๊ธฐ๋ฐ˜ ์„ ํ˜ธ๋„ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค. ๊ธฐ๋ณธ ์ž‘์—…์˜ ์ž…๋ ฅ์„ ์•Œ๋ ค์ง„ ๋ถ€๋ถ„๊ณผ ์•Œ๋ ค์ง€์ง€ ์•Š์€ ๋ถ€๋ถ„์œผ๋กœ ๋ถ„ํ•ดํ•˜๊ณ , ์ด์ค‘ ์ž‘์—…์„ ๊ตฌ์„ฑํ•˜์—ฌ ์•Œ๋ ค์ง€์ง€ ์•Š์€ ๋ถ€๋ถ„์„ ์žฌ๊ตฌ์„ฑํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋น„๊ฐ€์—ญ์  ์ž‘์—…์—๋„ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํ™•์žฅํ–ˆ๋‹ค. ์ด ์žฌ๊ตฌ์„ฑ์˜ ํ’ˆ์งˆ์ด ๊ธฐ๋ณธ ์ž‘์—…์„ ์ตœ์ ํ™”ํ•˜๋Š” ์ž๊ธฐ์ง€๋„ ๋ณด์ƒ์œผ๋กœ ์ž‘์šฉํ•˜๋ฉฐ, 756๊ฐœ ๋ฐฉํ–ฅ์—์„œ ํ‰๊ท  ๋ฒˆ์—ญ ํ’ˆ์งˆ 2.13 COMET ํ–ฅ์ƒ, ์„ธ ๊ฐ€์ง€ ์ˆ˜ํ•™์  ์ถ”๋ก  ๋ฒค์น˜๋งˆํฌ์—์„œ ํ‰๊ท  6.4ํฌ์ธํŠธ ์ •ํ™•๋„ ํ–ฅ์ƒ, ์ถ”๋ก  ์‹œ๊ฐ„ ์žฌ์ˆœ์œ„ ์ง€์ •๊ธฐ๋กœ ์‚ฌ์šฉ ์‹œ 9.3ํฌ์ธํŠธ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

ComoRAG: A Cognitive-Inspired Memory-Organized RAG for Stateful Long Narrative Reasoning

Paper, Project
ComoRAG๋Š” ์žฅ๋ฌธ ๋‚ด๋Ÿฌํ‹ฐ๋ธŒ ์ถ”๋ก ์„ ์œ„ํ•œ ์ธ์ง€ ์˜๊ฐ ๋ฉ”๋ชจ๋ฆฌ ์กฐ์ง RAG ์‹œ์Šคํ…œ์œผ๋กœ, ์ „ํ†ต์ ์ธ RAG ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์ด๋‹ค. ์ถ”๋ก  ๋‚œ๊ด€์— ๋ถ€๋”ชํ˜”์„ ๋•Œ ๋™์  ๋ฉ”๋ชจ๋ฆฌ ์ž‘์—…๊ณต๊ฐ„๊ณผ ์ƒํ˜ธ์ž‘์šฉํ•˜๋Š” ๋ฐ˜๋ณต์  ์ถ”๋ก  ์‚ฌ์ดํด์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, ๊ฐ ์‚ฌ์ดํด์—์„œ ์ƒˆ๋กœ์šด ํƒ์ƒ‰ ๊ฒฝ๋กœ๋ฅผ ๊ณ ์•ˆํ•˜๊ธฐ ์œ„ํ•œ ํƒ์ƒ‰ ์ฟผ๋ฆฌ๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ์ƒˆ๋กœ์šด ์ธก๋ฉด์˜ ๊ฒ€์ƒ‰๋œ ์ฆ๊ฑฐ๋ฅผ ์ „์—ญ ๋ฉ”๋ชจ๋ฆฌ ํ’€์— ํ†ตํ•ฉํ•œ๋‹ค. 4๊ฐœ์˜ ์žฅ๋ฌธ ๋งฅ๋ฝ ๋‚ด๋Ÿฌํ‹ฐ๋ธŒ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ฐ•๋ ฅํ•œ RAG ๊ธฐ์ค€์„ ๋ณด๋‹ค ์ตœ๋Œ€ 11% ์ƒ๋Œ€์  ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์˜€์œผ๋ฉฐ, ํŠนํžˆ ๊ธ€๋กœ๋ฒŒ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•œ ๋ณต์žกํ•œ ์ฟผ๋ฆฌ์— ์œ ๋ฆฌํ•œ ์ ‘๊ทผ๋ฒ•์ž„์„ ์ž…์ฆํ–ˆ๋‹ค.

From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models

Paper
FinCDM์€ ๊ธˆ์œต LLM์„ ์œ„ํ•œ ์ฒซ ์ธ์ง€ ์ง„๋‹จ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ๋‹จ์ผ ์ ์ˆ˜๊ฐ€ ์•„๋‹Œ ์ง€์‹-๊ธฐ์ˆ  ์ˆ˜์ค€์—์„œ LLM์„ ํ‰๊ฐ€ํ•˜์—ฌ ๊ธˆ์œต ๊ธฐ์ˆ  ๋ฐ ์ง€์‹์„ ํŒŒ์•…ํ•œ๋‹ค. CPA ์‹œํ—˜์—์„œ ํŒŒ์ƒ๋œ ์ธ์ง€์ ์œผ๋กœ ์ •๋ณด๊ฐ€ ํ’๋ถ€ํ•œ ๊ธˆ์œต ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ CPA-QKA๋ฅผ ๊ตฌ์ถ•ํ–ˆ์œผ๋ฉฐ, ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€๊ฐ€ ์ž‘์„ฑ, ๊ฒ€์ฆ ๋ฐ ์ฃผ์„์„ ๋‹ฌ์•„ ๋†’์€ ์ฃผ์„์ž ๊ฐ„ ์ผ์น˜๋„์™€ ์„ธ๋ถ„ํ™”๋œ ์ง€์‹ ๋ผ๋ฒจ์„ ์ œ๊ณตํ–ˆ๋‹ค. 30๊ฐœ LLM์— ๋Œ€ํ•œ ์‹คํ—˜ ๊ฒฐ๊ณผ, ์ˆจ๊ฒจ์ง„ ์ง€์‹ ๊ฒฉ์ฐจ๋ฅผ ๋ฐœ๊ฒฌํ•˜๊ณ  ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ฐ„๊ณผ๋œ ์„ธ๊ธˆ ๋ฐ ๊ทœ์ œ ์ถ”๋ก ๊ณผ ๊ฐ™์€ ํ…Œ์ŠคํŠธ๊ฐ€ ๋ถ€์กฑํ•œ ์˜์—ญ์„ ์‹๋ณ„ํ•˜๋Š” ๋ฐ ํšจ๊ณผ์ ์ž„์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค.

LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos

Paper, Project
LongSplat์€ ๋ถˆ๊ทœ์น™ํ•œ ์นด๋ฉ”๋ผ ์›€์ง์ž„, ์•Œ๋ ค์ง€์ง€ ์•Š์€ ์นด๋ฉ”๋ผ ํฌ์ฆˆ, ๊ด‘๋ฒ”์œ„ํ•œ ์žฅ๋ฉด์ด ํŠน์ง•์ธ ์บ์ฃผ์–ผ ์žฅํŽธ ๋น„๋””์˜ค์—์„œ ์ƒˆ๋กœ์šด ๋ทฐ ํ•ฉ์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ฒฌ๊ณ ํ•œ Unposed 3D Gaussian Splatting ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค. ์นด๋ฉ”๋ผ ํฌ์ฆˆ์™€ 3D ๊ฐ€์šฐ์‹œ์•ˆ์„ ๋™์‹œ์— ์ตœ์ ํ™”ํ•˜๋Š” ์ ์ง„์  ๊ณต๋™ ์ตœ์ ํ™”, ํ•™์Šต๋œ 3D ์‚ฌ์ „ ์ง€์‹์„ ํ™œ์šฉํ•˜๋Š” ๊ฐ•๋ ฅํ•œ ํฌ์ฆˆ ์ถ”์ • ๋ชจ๋“ˆ, ๊ณต๊ฐ„ ๋ฐ€๋„์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ๋ฐ€์ง‘ ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ๋ฅผ ์•ต์ปค๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ํšจ์œจ์ ์ธ ์˜ฅํŠธ๋ฆฌ ์•ต์ปค ํ˜•์„ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํŠน์ง•์œผ๋กœ ํ•œ๋‹ค. ๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋ Œ๋”๋ง ํ’ˆ์งˆ, ํฌ์ฆˆ ์ •ํ™•๋„, ๊ณ„์‚ฐ ํšจ์œจ์„ฑ ์ธก๋ฉด์—์„œ ๊ธฐ์กด ์ ‘๊ทผ๋ฒ• ๋Œ€๋น„ ์ƒ๋‹นํ•œ ๊ฐœ์„ ์„ ๋ณด์˜€๋‹ค.

MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds

Paper, Project
MeshCoder๋Š” ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ์—์„œ ๋ณต์žกํ•œ 3D ๊ฐ์ฒด๋ฅผ ํŽธ์ง‘ ๊ฐ€๋Šฅํ•œ Blender Python ์Šคํฌ๋ฆฝํŠธ๋กœ ์žฌ๊ตฌ์„ฑํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค. ๋ณต์žกํ•œ ๊ธฐํ•˜ํ•™์„ ํ•ฉ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ํฌ๊ด„์ ์ธ Blender Python API ์„ธํŠธ๋ฅผ ๊ฐœ๋ฐœํ•˜๊ณ , ๊ฐ ๊ฐ์ฒด์˜ ์ฝ”๋“œ๊ฐ€ ๊ณ ์œ ํ•œ ์˜๋ฏธ ๋ถ€๋ถ„์œผ๋กœ ๋ถ„ํ•ด๋œ ๋Œ€๊ทœ๋ชจ ๊ฐ์ฒด-์ฝ”๋“œ ์Œ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค. 3D ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ๋ฅผ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ Blender Python ์Šคํฌ๋ฆฝํŠธ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๋‹ค์ค‘ ๋ชจ๋‹ฌ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œ์ผฐ์œผ๋ฉฐ, ํ˜•์ƒ-์ฝ”๋“œ ์žฌ๊ตฌ์„ฑ ์ž‘์—…์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ณ  ํŽธ๋ฆฌํ•œ ์ฝ”๋“œ ์ˆ˜์ •์„ ํ†ตํ•œ ์ง๊ด€์ ์ธ ๊ธฐํ•˜ํ•™์ , ์œ„์ƒํ•™์  ํŽธ์ง‘์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ–ˆ๋‹ค.

profile
XR๊ณผ AI์— ๊ด€์‹ฌ์ด ๋งŽ์€ Sky ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€