[2025/W20] ๐Ÿค— Weekly AI Research

Skyยท2025๋…„ 5์›” 16์ผ

Weekly AI Research Digest

๋ชฉ๋ก ๋ณด๊ธฐ
24/89

์ธ๊ฐ„์ฒ˜๋Ÿผ ๋ณด๊ณ  ๋“ฃ๊ณ  ํŒ๋‹จํ•˜๋ฉฐ ๊ณ ์ฐจ์› ์ถ”๋ก ๊ณผ ์ž๊ธฐ ๊ต์ •์œผ๋กœ ๋ณต์žกํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ ์ œ์‹œ
์ƒ์„ฑํ˜• AI๋Š” ๋‹ค๊ตญ์–ด ์Œ์„ฑยท3D ์—์…‹ ์ฐฝ์กฐ๋ฅผ ๋„˜์–ด, ํŠน์ • ์–ธ์–ด ์ตœ์ ํ™” ๋ฐ ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ๋กœ ๊ธฐ์ˆ  ํ˜์‹ ๊ณผ ์ ‘๊ทผ์„ฑ ํ™•์žฅ

TL;DR

์‹œ๊ฐ ์ •๋ณด์™€ ์–ธ์–ด ์ •๋ณด๋ฅผ ํ†ตํ•ฉ์ ์œผ๋กœ ์ดํ•ดํ•˜๊ณ  ์ƒํ˜ธ์ž‘์šฉํ•˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ๋ถ„์•ผ๋Š” (Seed1.5-VL, BLIP3-o, DeCLIP ๋“ฑ์˜ ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด) ๋‹จ์ˆœํ•œ ์ •๋ณด์˜ ๊ฒฐํ•ฉ์„ ๋„˜์–ด, GUI ์ œ์–ด๋‚˜ ๊ฒŒ์ž„ ํ”Œ๋ ˆ์ด์™€ ๊ฐ™์€ ๋ณต์žกํ•œ ์—์ด์ „ํŠธ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ณ  ๊ฐœ๋ฐฉ๋œ ์–ดํœ˜ ํ™˜๊ฒฝ์—์„œ๋„ ์ •๊ตํ•œ ์‹œ๊ฐ์  ์ธ์‹์„ ๋‹ฌ์„ฑํ•˜๋Š” ๋“ฑ ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ๋ฐฉ์‹์œผ๋กœ ์„ธ์ƒ์„ ์ดํ•ดํ•˜๊ณ  ์†Œํ†ตํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๋ชฉํ‘œ๋กœ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ๋‹ค. ์ด์™€ ํ•จ๊ป˜, ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ•ต์‹ฌ ์ง€๋Šฅ์ธ ์ถ”๋ก  ๊ธฐ๋Šฅ์„ ๊ฐ•ํ™”ํ•˜๋ ค๋Š” ๋…ธ๋ ฅ ๋˜ํ•œ ํ™œ๋ฐœํžˆ ์ด๋ฃจ์–ด์ ธ (MiMo, Beyond 'Aha!' ๊ฐ™์€ ์—ฐ๊ตฌ๋“ค์„ ํ†ตํ•ด) ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ, ํ”„๋กœ๊ทธ๋ž˜๋ฐ, ์ผ๋ฐ˜ ์ƒ์‹ ์ถ”๋ก  ๋Šฅ๋ ฅ ํ–ฅ์ƒ์€ ๋ฌผ๋ก , ์ž๊ธฐ ๊ต์ •์ด๋‚˜ ๋…ผ๋ฆฌ์  ๊ฒ€์ฆ๊ณผ ๊ฐ™์€ ๊ณ ์ฐจ์›์ ์ธ ์‚ฌ๊ณ  ๊ณผ์ •์„ ๋ชจ๋ธ์— ๋‚ด์žฌํ™”ํ•จ์œผ๋กœ์จ ๋”์šฑ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๊ณ  ์‹ฌ๋„ ์žˆ๋Š” ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๋„๋ก ์ง„ํ™”ํ•˜๊ณ  ์žˆ๋‹ค. ํ•œํŽธ, ํ…์ŠคํŠธ๋ฅผ ๋„˜์–ด ๋‹ค์ฑ„๋กœ์šด ํ˜•ํƒœ์˜ ์ฝ˜ํ…์ธ ๋ฅผ ์ฐฝ์กฐํ•˜๋Š” ์ƒ์„ฑํ˜• AI ๊ธฐ์ˆ ์€ (MiniMax-Speech, Step1X-3D ๋“ฑ์˜ ์—ฐ๊ตฌ์—์„œ ๋‚˜ํƒ€๋‚˜๋“ฏ์ด) ๊ณ ํ’ˆ์งˆ์˜ ๋‹ค๊ตญ์–ด ์Œ์„ฑ์„ ์ฆ‰์„์—์„œ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํ•ฉ์„ฑํ•˜๊ฑฐ๋‚˜, ์‚ฌ์šฉ์ž์˜ ์˜๋„์— ๋งž์ถฐ ์ •๊ตํ•˜๊ณ  ์ œ์–ด ๊ฐ€๋Šฅํ•œ 3D ์—์…‹์„ ์ƒ์„ฑํ•˜๋Š” ์ˆ˜์ค€์— ๋„๋‹ฌํ•˜๋ฉฐ ์˜ˆ์ˆ , ๋””์ž์ธ, ์—”ํ„ฐํ…Œ์ธ๋จผํŠธ ๋“ฑ ๋‹ค์–‘ํ•œ ์ฐฝ์˜์  ๋ถ„์•ผ์—์„œ ํ˜์‹ ์ ์ธ ๋„๊ตฌ๋กœ ์ž๋ฆฌ๋งค๊น€ํ•˜๊ณ  ์žˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ํด๋ž€๋“œ์–ด์™€ ๊ฐ™์ด ํŠน์ • ์–ธ์–ด ์ฒ˜๋ฆฌ์— ์ตœ์ ํ™”๋˜๊ฑฐ๋‚˜ (Bielik v3 ์—ฐ๊ตฌ์ฒ˜๋Ÿผ) ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋ฅผ ์ค„์—ฌ ์ž์› ํšจ์œจ์„ฑ์„ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๊ฒฝ๋Ÿ‰ํ™” ๋ชจ๋ธ ์—ฐ๊ตฌ ์—ญ์‹œ ์ค‘์š”ํ•œ ํ๋ฆ„์œผ๋กœ, AI ๊ธฐ์ˆ ์˜ ๋ณดํŽธ์ ์ธ ์ ‘๊ทผ์„ฑ์„ ๋†’์ด๊ณ  ์ œํ•œ๋œ ํ™˜๊ฒฝ์—์„œ๋„ ๊ณ ์„ฑ๋Šฅ AI๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ธธ์„ ์—ด์–ด์ฃผ๋ฉฐ ๊ธฐ์ˆ  ๋ฏผ์ฃผํ™”์— ๊ธฐ์—ฌํ•˜๊ณ  ์žˆ๋‹ค.

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ๋ถ„์•ผ

Seed1.5-VL Technical Report

Paper, Project

์ด ๋…ผ๋ฌธ์€ Seed1.5-VL์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๋น„์ „-์–ธ์–ด ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ ์†Œ๊ฐœํ•œ๋‹ค. ์ด ๋ชจ๋ธ์€ ์ผ๋ฐ˜์ ์ธ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ(์‹œ๊ฐ ์ •๋ณด์™€ ์–ธ์–ด ์ •๋ณด๋ฅผ ํ•จ๊ป˜ ์ดํ•ดํ•˜๋Š” ๋Šฅ๋ ฅ) ์ดํ•ด ๋ฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ์„ค๊ณ„๋˜์—ˆ๋‹ค. Seed1.5-VL์€ 5์–ต 3200๋งŒ ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋น„์ „ ์ธ์ฝ”๋”์™€ 200์–ต ๊ฐœ์˜ ํ™œ์„ฑ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ์ „๋ฌธ๊ฐ€ ํ˜ผํ•ฉ(MoE) ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค. ์ƒ๋Œ€์ ์œผ๋กœ ์ž‘์€ ๊ตฌ์กฐ์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , 60๊ฐœ์˜ ๊ณต๊ฐœ ๋น„์ „-์–ธ์–ด ๋ชจ๋ธ ๋ฒค์น˜๋งˆํฌ ์ค‘ 38๊ฐœ์—์„œ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ(SOTA)์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ํŠนํžˆ, ๊ทธ๋ž˜ํ”ฝ ์‚ฌ์šฉ์ž ์ธํ„ฐํŽ˜์ด์Šค(GUI) ์ œ์–ด๋‚˜ ๊ฒŒ์ž„ ํ”Œ๋ ˆ์ด์™€ ๊ฐ™์€ ์—์ด์ „ํŠธ ์ค‘์‹ฌ ์ž‘์—…์—์„œ๋Š” OpenAI์˜ CUA๋‚˜ Claude 3.7๊ณผ ๊ฐ™์€ ์ฃผ์š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์‹œ์Šคํ…œ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค. ๋˜ํ•œ, ์‹œ๊ฐ์  ํผ์ฆ๊ณผ ๊ฐ™์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก  ๋ฌธ์ œ ํ•ด๊ฒฐ์—๋„ ๊ฐ•์ ์„ ๋ณด์—ฌ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ์˜ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•œ๋‹ค.

BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset

Paper, Project

์ตœ๊ทผ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ ์—ฐ๊ตฌ์—์„œ ์ด๋ฏธ์ง€ ์ดํ•ด์™€ ์ƒ์„ฑ์„ ํ†ตํ•ฉํ•˜๋ ค๋Š” ์‹œ๋„๊ฐ€ ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ๋‹ค. ์ด๋ฏธ์ง€ ์ดํ•ด๋ฅผ ์œ„ํ•œ ์„ค๊ณ„๋Š” ๋งŽ์ด ์—ฐ๊ตฌ๋˜์—ˆ์ง€๋งŒ, ์ด๋ฏธ์ง€ ์ƒ์„ฑ๊นŒ์ง€ ํฌํ•จํ•˜๋Š” ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์œ„ํ•œ ์ตœ์ ์˜ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜์™€ ํ›ˆ๋ จ ๋ฐฉ์‹์€ ์•„์ง ์ถฉ๋ถ„ํžˆ ํƒ๊ตฌ๋˜์ง€ ์•Š์•˜๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ๊ณ ํ’ˆ์งˆ ์ƒ์„ฑ ๋ฐ ํ™•์žฅ์„ฑ ์ธก๋ฉด์—์„œ ์ž๋™ ํšŒ๊ท€ ๋ชจ๋ธ๊ณผ ํ™•์‚ฐ ๋ชจ๋ธ์˜ ๊ฐ•๋ ฅํ•œ ์ž ์žฌ๋ ฅ์— ์ฃผ๋ชฉํ•˜์—ฌ, ์ด๋ฏธ์ง€ ํ‘œํ˜„, ๋ชจ๋ธ๋ง ๋ชฉํ‘œ, ํ›ˆ๋ จ ์ „๋žต์„ ์ค‘์‹ฌ์œผ๋กœ ํ†ตํ•ฉ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ™˜๊ฒฝ์—์„œ์˜ ํ™œ์šฉ ๋ฐฉ์•ˆ์„ ํฌ๊ด„์ ์œผ๋กœ ์—ฐ๊ตฌํ•œ๋‹ค. ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ, ๊ธฐ์กด์˜ VAE(Variational Autoencoder) ๊ธฐ๋ฐ˜ ํ‘œํ˜„ ๋ฐฉ์‹๊ณผ ๋‹ฌ๋ฆฌ, ์˜๋ฏธ์ ์œผ๋กœ ํ’๋ถ€ํ•œ CLIP ์ด๋ฏธ์ง€ ํŠน์ง•์„ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ํ™•์‚ฐ ํŠธ๋žœ์Šคํฌ๋จธ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์•ˆํ•œ๋‹ค. ์ด ์„ค๊ณ„๋Š” ํ›ˆ๋ จ ํšจ์œจ์„ฑ๊ณผ ์ƒ์„ฑ ํ’ˆ์งˆ ๋ชจ๋‘๋ฅผ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค. ๋˜ํ•œ, ํ†ตํ•ฉ ๋ชจ๋ธ์„ ์œ„ํ•œ ์ˆœ์ฐจ์  ์‚ฌ์ „ ํ›ˆ๋ จ ์ „๋žต(์ด๋ฏธ์ง€ ์ดํ•ด ๋Šฅ๋ ฅ ์šฐ์„  ํ•™์Šต ํ›„ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋Šฅ๋ ฅ ํ•™์Šต)์ด ์ด๋ฏธ์ง€ ์ดํ•ด ๋Šฅ๋ ฅ์€ ์œ ์ง€ํ•˜๋ฉด์„œ ๊ฐ•๋ ฅํ•œ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ๊ฐœ๋ฐœํ•˜๋Š” ๋ฐ ์‹ค์šฉ์ ์ธ ์ด์ ์„ ์ œ๊ณตํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ๋‹ค์–‘ํ•œ ์žฅ๋ฉด, ๊ฐ์ฒด, ์ธ๊ฐ„ ์ œ์Šค์ฒ˜ ๋“ฑ์„ ํฌ๊ด„ํ•˜๋Š” ๋‹ค์–‘ํ•œ ์บก์…˜์„ GPT-4o์— ์ž…๋ ฅํ•˜์—ฌ ์ด๋ฏธ์ง€ ์ƒ์„ฑ์„ ์œ„ํ•œ ๊ณ ํ’ˆ์งˆ ๋ช…๋ น์–ด ํŠœ๋‹ ๋ฐ์ดํ„ฐ์…‹์ธ BLIP3o-60k๋ฅผ ์‹ ์ค‘ํ•˜๊ฒŒ ๊ตฌ์ถ•ํ–ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ˜์‹ ์ ์ธ ๋ชจ๋ธ ์„ค๊ณ„, ํ›ˆ๋ จ ๋ฐฉ์‹, ๋ฐ์ดํ„ฐ์…‹์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ตœ์ฒจ๋‹จ ํ†ตํ•ฉ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ ์ œํ’ˆ๊ตฐ์ธ BLIP3-o๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. BLIP3-o๋Š” ์ด๋ฏธ์ง€ ์ดํ•ด ๋ฐ ์ƒ์„ฑ ์ž‘์—…์„ ์•„์šฐ๋ฅด๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception

Paper, Project

๋ฐ€๋„ ๋†’์€ ์‹œ๊ฐ ์˜ˆ์ธก ์ž‘์—…์€ ๋ฏธ๋ฆฌ ์ •์˜๋œ ๋ฒ”์ฃผ์— ์˜์กดํ•˜๋Š” ํ•œ๊ณ„ ๋•Œ๋ฌธ์— ์‹œ๊ฐ์  ๊ฐœ๋…์ด ๋ฌดํ•œํ•œ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ์˜ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ์ œํ•œ๋˜์–ด ์™”๋‹ค. CLIP๊ณผ ๊ฐ™์€ ๋น„์ „-์–ธ์–ด ๋ชจ๋ธ(VLM)์€ ๊ฐœ๋ฐฉํ˜• ์–ดํœ˜ ์ž‘์—…์—์„œ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ์ง€๋งŒ, ์ง€์—ญ์  ํŠน์ง• ํ‘œํ˜„์˜ ํ•œ๊ณ„๋กœ ์ธํ•ด ๋ฐ€๋„ ์˜ˆ์ธก ์ž‘์—…์— ์ง์ ‘ ์ ์šฉํ•˜๋ฉด ์ตœ์ ์˜ ์„ฑ๋Šฅ์„ ๋‚ด์ง€ ๋ชปํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค. ์ด ์—ฐ๊ตฌ์—์„œ๋Š” CLIP์˜ ์ด๋ฏธ์ง€ ํ† ํฐ์ด ๊ณต๊ฐ„์ ์œผ๋กœ๋‚˜ ์˜๋ฏธ์ ์œผ๋กœ ๊ด€๋ จ๋œ ์˜์—ญ์˜ ์ •๋ณด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ข…ํ•ฉํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช์–ด, ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ง€์—ญ์  ๊ตฌ๋ณ„์„ฑ๊ณผ ๊ณต๊ฐ„์  ์ผ๊ด€์„ฑ์ด ๋ถ€์กฑํ•œ ํŠน์ง•์„ ์ƒ์„ฑํ•œ๋‹ค๋Š” ๊ด€์ฐฐ ๊ฒฐ๊ณผ๋ฅผ ์ œ์‹œํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” DeCLIP์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. DeCLIP์€ ์ž๊ธฐ ์ฃผ์˜(self-attention) ๋ชจ๋“ˆ์„ ๋ถ„๋ฆฌํ•˜์—ฌ "๋‚ด์šฉ(content)" ํŠน์ง•๊ณผ "๋งฅ๋ฝ(context)" ํŠน์ง•์„ ๊ฐ๊ฐ ์–ป๋Š” ๋ฐฉ์‹์œผ๋กœ CLIP์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค. "๋‚ด์šฉ" ํŠน์ง•์€ ์ด๋ฏธ์ง€์˜ ์ž˜๋ผ๋‚ธ ๋ถ€๋ถ„(crop) ํ‘œํ˜„๊ณผ ์ •๋ ฌ๋˜์–ด ์ง€์—ญ์  ๊ตฌ๋ณ„์„ฑ์„ ๋†’์ด๋Š” ๋ฐ˜๋ฉด, "๋งฅ๋ฝ" ํŠน์ง•์€ DINO์™€ ๊ฐ™์€ ๋น„์ „ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ง€๋„๋ฅผ ๋ฐ›์•„ ๊ณต๊ฐ„์  ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์œ ์ง€ํ•˜๋„๋ก ํ•™์Šตํ•œ๋‹ค. ๊ด‘๋ฒ”์œ„ํ•œ ์‹คํ—˜์„ ํ†ตํ•ด DeCLIP์€ ๊ฐ์ฒด ๊ฐ์ง€ ๋ฐ ์˜๋ฏธ๋ก ์  ๋ถ„ํ• ์„ ํฌํ•จํ•œ ์—ฌ๋Ÿฌ ๊ฐœ๋ฐฉํ˜• ์–ดํœ˜ ๋ฐ€๋„ ์˜ˆ์ธก ์ž‘์—…์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค์„ ํ›จ์”ฌ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค.

์ถ”๋ก  ๊ธฐ๋Šฅ ๊ฐ•ํ™” ๋ถ„์•ผ

MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining

Paper, Project

์ด ๋…ผ๋ฌธ์€ ์ถ”๋ก  ์ž‘์—…์— ํŠนํ™”๋œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ MiMo-7B๋ฅผ ์†Œ๊ฐœํ•˜๋ฉฐ, ์‚ฌ์ „ ํ•™์Šต๊ณผ ์‚ฌํ›„ ํ•™์Šต ๋‹จ๊ณ„ ๋ชจ๋‘์—์„œ ์ตœ์ ํ™”๋ฅผ ๊ฑฐ์ณค๋‹ค. ์‚ฌ์ „ ํ•™์Šต ๋‹จ๊ณ„์—์„œ๋Š” ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ๊ณผ์ •์„ ๊ฐœ์„ ํ•˜๊ณ  3๋‹จ๊ณ„ ๋ฐ์ดํ„ฐ ํ˜ผํ•ฉ ์ „๋žต์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ธฐ๋ณธ ๋ชจ๋ธ์˜ ์ถ”๋ก  ์ž ์žฌ๋ ฅ์„ ๊ฐ•ํ™”ํ–ˆ๋‹ค. MiMo-7B-Base๋Š” 25์กฐ ๊ฐœ์˜ ํ† ํฐ์œผ๋กœ ์‚ฌ์ „ ํ•™์Šต๋˜์—ˆ์œผ๋ฉฐ, ์„ฑ๋Šฅ ํ–ฅ์ƒ๊ณผ ์ถ”๋ก  ์†๋„ ๊ฐ€์†ํ™”๋ฅผ ์œ„ํ•ด ๋‹ค์ค‘ ํ† ํฐ ์˜ˆ์ธก ๋ชฉํ‘œ๋ฅผ ์ถ”๊ฐ€๋กœ ์‚ฌ์šฉํ–ˆ๋‹ค. ์‚ฌํ›„ ํ•™์Šต ๋‹จ๊ณ„์—์„œ๋Š” ๊ฐ•ํ™” ํ•™์Šต์„ ์œ„ํ•ด ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ์ˆ˜ํ•™ ๋ฐ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋ฌธ์ œ 13๋งŒ ๊ฐœ๋กœ ๊ตฌ์„ฑ๋œ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜๊ณ , ํฌ์†Œ ๋ณด์ƒ ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ํ…Œ์ŠคํŠธ ๋‚œ์ด๋„ ๊ธฐ๋ฐ˜ ์ฝ”๋“œ ๋ณด์ƒ ์ฒด๊ณ„๋ฅผ ํ†ตํ•ฉํ–ˆ์œผ๋ฉฐ, ํ•™์Šต ์•ˆ์ •ํ™”๋ฅผ ์œ„ํ•ด ์ „๋žต์  ๋ฐ์ดํ„ฐ ๋ฆฌ์ƒ˜ํ”Œ๋ง์„ ์‚ฌ์šฉํ–ˆ๋‹ค. ๊ด‘๋ฒ”์œ„ํ•œ ํ‰๊ฐ€ ๊ฒฐ๊ณผ, MiMo-7B-Base๋Š” ํ›จ์”ฌ ํฐ 32B ๋ชจ๋ธ๋ณด๋‹ค๋„ ๋›ฐ์–ด๋‚œ ์ถ”๋ก  ์ž ์žฌ๋ ฅ์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค. ์ตœ์ข…์ ์œผ๋กœ ๊ฐ•ํ™” ํ•™์Šต์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•œ MiMo-7B-RL ๋ชจ๋ธ์€ ์ˆ˜ํ•™, ์ฝ”๋“œ, ์ผ๋ฐ˜ ์ถ”๋ก  ์ž‘์—…์—์„œ OpenAI์˜ o1-mini ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.

Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

Paper, Project

๋Œ€๊ทœ๋ชจ ์ถ”๋ก  ๋ชจ๋ธ(LRM)์€ ์ด๋ฏธ ๊ธด ์—ฐ์‡„ ์‚ฌ๊ณ  ์ถ”๋ก ์„ ์œ„ํ•œ ์ž ์žฌ์ ์ธ ๋Šฅ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ์ด์ „ ์—ฐ๊ตฌ๋“ค์€ ๊ฒฐ๊ณผ ๊ธฐ๋ฐ˜ ๊ฐ•ํ™” ํ•™์Šต(RL)์ด ์ž๊ธฐ ๊ต์ •, ๋ฐฑํŠธ๋ž˜ํ‚น, ๊ฒ€์ฆ๊ณผ ๊ฐ™์€ ๊ณ ๊ธ‰ ์ถ”๋ก  ํ–‰๋™(์ข…์ข… ๋ชจ๋ธ์˜ "์•„ํ•˜ ๋ชจ๋ฉ˜ํŠธ"๋ผ๊ณ  ๋ถˆ๋ฆผ)์„ ์šฐ์—ฐํžˆ ์ด๋Œ์–ด๋‚ผ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Ÿฌํ•œ ํ–‰๋™์˜ ๋ฐœ์ƒ ์‹œ์ ๊ณผ ์ผ๊ด€์„ฑ์€ ์˜ˆ์ธกํ•˜๊ณ  ์ œ์–ดํ•˜๊ธฐ ์–ด๋ ค์›Œ LRM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ ํ™•์žฅ์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ์„ ์ œํ•œํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ด ์—ฐ๊ตฌ๋Š” ํ”„๋กฌํ”„ํŠธ๋‚˜ ์šฐ์—ฐํ•œ "์•„ํ•˜ ๋ชจ๋ฉ˜ํŠธ"์— ์˜์กดํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด, ์ž๋™์œผ๋กœ ์ƒ์„ฑ๋˜๊ณ  ์ž์ฒด ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ์ž‘์—…์„ ์‚ฌ์šฉํ•˜์—ฌ ์—ฐ์—ญ, ๊ท€๋‚ฉ, ๊ท€์ถ”๋ผ๋Š” ์„ธ ๊ฐ€์ง€ ๋ฉ”ํƒ€ ๋Šฅ๋ ฅ์— ๋ชจ๋ธ์„ ๋ช…์‹œ์ ์œผ๋กœ ์ •๋ ฌํ•œ๋‹ค. ์—ฐ๊ตฌํŒ€์˜ 3๋‹จ๊ณ„ ํŒŒ์ดํ”„๋ผ์ธ(๊ฐœ๋ณ„ ์ •๋ ฌ, ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ณต๊ฐ„ ๋ณ‘ํ•ฉ, ๋„๋ฉ”์ธ๋ณ„ ๊ฐ•ํ™” ํ•™์Šต)์€ ๋ช…๋ น์–ด ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•œ ๋ชจ๋ธ๋ณด๋‹ค ์„ฑ๋Šฅ์„ 10% ์ด์ƒ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ๋‚˜์•„๊ฐ€, ์ •๋ ฌ๋œ ์ฒดํฌํฌ์ธํŠธ์—์„œ ํŠน์ • ๋ถ„์•ผ(์ˆ˜ํ•™, ์ฝ”๋”ฉ, ๊ณผํ•™)์— ๋Œ€ํ•œ ๊ฐ•ํ™” ํ•™์Šต์„ ์ ์šฉํ•˜๋ฉด ๋ฒค์น˜๋งˆํฌ์—์„œ ํ‰๊ท  2%์˜ ์ถ”๊ฐ€์ ์ธ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์˜€๋‹ค. ์ด๋Š” ๋ช…์‹œ์ ์ธ ๋ฉ”ํƒ€ ๋Šฅ๋ ฅ ์ •๋ ฌ์ด ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์œ„ํ•œ ํ™•์žฅ ๊ฐ€๋Šฅํ•˜๊ณ  ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค€๋‹ค.

์ƒ์„ฑํ˜• AI ๊ธฐ์ˆ  ๋ถ„์•ผ

MiniMax-Speech: Intrinsic Zero-Shot Text-to-Speech with a Learnable Speaker Encoder

Paper, Project

์ด ๋…ผ๋ฌธ์€ ๊ณ ํ’ˆ์งˆ ์Œ์„ฑ์„ ์ƒ์„ฑํ•˜๋Š” ์ž๋™ ํšŒ๊ท€ ํŠธ๋žœ์Šคํฌ๋จธ ๊ธฐ๋ฐ˜์˜ ํ…์ŠคํŠธ ์Œ์„ฑ ๋ณ€ํ™˜(TTS) ๋ชจ๋ธ์ธ MiniMax-Speech๋ฅผ ์†Œ๊ฐœํ•œ๋‹ค. ํ•ต์‹ฌ ํ˜์‹ ์€ ์ฐธ์กฐ ์˜ค๋””์˜ค์˜ ํ…์ŠคํŠธ ๋‚ด์šฉ ์—†์ด๋„ ์Œ์ƒ‰ ํŠน์ง•์„ ์ถ”์ถœํ•  ์ˆ˜ ์žˆ๋Š” ํ•™์Šต ๊ฐ€๋Šฅํ•œ ์Šคํ”ผ์ปค ์ธ์ฝ”๋”๋‹ค. ์ด๋ฅผ ํ†ตํ•ด MiniMax-Speech๋Š” ์ฐธ์กฐ ์Œ์„ฑ๊ณผ ์Œ์ƒ‰์ด ์ผ์น˜ํ•˜๋Š” ๋งค์šฐ ํ‘œํ˜„๋ ฅ ํ’๋ถ€ํ•œ ์Œ์„ฑ์„ ์ œ๋กœ์ƒท(์‚ฌ์ „ ํ•™์Šต ์—†์ด ๋ฐ”๋กœ ์ ์šฉ)์œผ๋กœ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์›์ƒท(๋‹จ ํ•˜๋‚˜์˜ ์ƒ˜ํ”Œ๋งŒ์œผ๋กœ ํ•™์Šต) ์Œ์„ฑ ๋ณต์ œ ์‹œ์—๋„ ์ฐธ์กฐ ์Œ์„ฑ๊ณผ ๋งค์šฐ ๋†’์€ ์œ ์‚ฌ๋„๋ฅผ ๋ณด์ธ๋‹ค. ๋˜ํ•œ, ์ œ์•ˆ๋œ Flow-VAE ๊ธฐ์ˆ ์„ ํ†ตํ•ด ํ•ฉ์„ฑ๋œ ์˜ค๋””์˜ค์˜ ์ „์ฒด์ ์ธ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ์ด ๋ชจ๋ธ์€ 32๊ฐœ ์–ธ์–ด๋ฅผ ์ง€์›ํ•˜๋ฉฐ, ๋‹ค์–‘ํ•œ ๊ฐ๊ด€์  ๋ฐ ์ฃผ๊ด€์  ํ‰๊ฐ€ ์ง€ํ‘œ์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค. ํŠนํžˆ, ๊ฐ๊ด€์ ์ธ ์Œ์„ฑ ๋ณต์ œ ์ง€ํ‘œ(๋‹จ์–ด ์˜ค๋ฅ˜์œจ ๋ฐ ํ™”์ž ์œ ์‚ฌ๋„)์—์„œ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ๊ฒฐ๊ณผ๋ฅผ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ๊ณต๊ฐœ TTS Arena ๋ฆฌ๋”๋ณด๋“œ์—์„œ 1์œ„๋ฅผ ์ฐจ์ง€ํ–ˆ๋‹ค. ์Šคํ”ผ์ปค ์ธ์ฝ”๋”์˜ ๊ฐ•๋ ฅํ•˜๊ณ  ๋ถ„๋ฆฌ๋œ ํ‘œํ˜„๋ ฅ ๋•๋ถ„์— ๊ธฐ๋ณธ ๋ชจ๋ธ ์ˆ˜์ • ์—†์ด๋„ LoRA๋ฅผ ํ†ตํ•œ ์ž„์˜์˜ ์Œ์„ฑ ๊ฐ์ • ์ œ์–ด, ํ…์ŠคํŠธ ์„ค๋ช…์—์„œ ์ง์ ‘ ์Œ์ƒ‰ ํŠน์ง•์„ ํ•ฉ์„ฑํ•˜๋Š” ํ…์ŠคํŠธ ์Œ์„ฑ ๋ณ€ํ™˜(T2V), ์ถ”๊ฐ€ ๋ฐ์ดํ„ฐ๋กœ ์Œ์ƒ‰ ํŠน์ง•์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ์ „๋ฌธ๊ฐ€ ์Œ์„ฑ ๋ณต์ œ(PVC) ๋“ฑ ๋‹ค์–‘ํ•œ ์‘์šฉ์ด ๊ฐ€๋Šฅํ•˜๋‹ค.

Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets

Paper, Project

์ƒ์„ฑํ˜• ์ธ๊ณต์ง€๋Šฅ(AI)์€ ํ…์ŠคํŠธ, ์ด๋ฏธ์ง€, ์˜ค๋””์˜ค, ๋น„๋””์˜ค ๋ถ„์•ผ์—์„œ ํฌ๊ฒŒ ๋ฐœ์ „ํ–ˆ์ง€๋งŒ, 3D ์ƒ์„ฑ์€ ๋ฐ์ดํ„ฐ ๋ถ€์กฑ, ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ•œ๊ณ„, ์ƒํƒœ๊ณ„ ํŒŒํŽธํ™”์™€ ๊ฐ™์€ ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ œ๋กœ ์ธํ•ด ์ƒ๋Œ€์ ์œผ๋กœ ๋ฐœ์ „์ด ๋”๋””๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์ด ๋…ผ๋ฌธ์€ Step1X-3D๋ผ๋Š” ๊ฐœ๋ฐฉํ˜• ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋‹ค์Œ ์„ธ ๊ฐ€์ง€๋ฅผ ํ†ตํ•ด ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋“ค์„ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•œ๋‹ค: (1) 5๋ฐฑ๋งŒ ๊ฐœ ์ด์ƒ์˜ ์—์…‹์„ ์ฒ˜๋ฆฌํ•˜์—ฌ ํ‘œ์ค€ํ™”๋œ ๊ธฐํ•˜ํ•™์  ๋ฐ ์งˆ๊ฐ(ํ…์Šค์ฒ˜) ์†์„ฑ์„ ๊ฐ€์ง„ 2๋ฐฑ๋งŒ ๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ์…‹์„ ๋งŒ๋“œ๋Š” ์—„๊ฒฉํ•œ ๋ฐ์ดํ„ฐ ์ •์ œ ํŒŒ์ดํ”„๋ผ์ธ; (2) ํ•˜์ด๋ธŒ๋ฆฌ๋“œ VAE-DiT(Variational Autoencoder - Diffusion Transformer) ํ˜•์ƒ ์ƒ์„ฑ๊ธฐ์™€ ํ™•์‚ฐ ๊ธฐ๋ฐ˜ ํ…์Šค์ฒ˜ ํ•ฉ์„ฑ ๋ชจ๋“ˆ์„ ๊ฒฐํ•ฉํ•œ 2๋‹จ๊ณ„ 3D ๋„ค์ดํ‹ฐ๋ธŒ ์•„ํ‚คํ…์ฒ˜; (3) ๋ชจ๋ธ, ํ›ˆ๋ จ ์ฝ”๋“œ, ์ ์‘ ๋ชจ๋“ˆ์˜ ์™„์ „ํ•œ ์˜คํ”ˆ ์†Œ์Šค ๊ณต๊ฐœ๋‹ค. ํ˜•์ƒ ์ƒ์„ฑ์„ ์œ„ํ•ด ํ•˜์ด๋ธŒ๋ฆฌ๋“œ VAE-DiT ๊ตฌ์„ฑ ์š”์†Œ๋Š” ์„ธ๋ฐ€ํ•œ ๋ถ€๋ถ„ ๋ณด์กด์„ ์œ„ํ•ด ๋‚ ์นด๋กœ์šด ๊ฐ€์žฅ์ž๋ฆฌ ์ƒ˜ํ”Œ๋ง๊ณผ ํ•จ๊ป˜ ํผ์‹œ๋ฒ„(perceiver) ๊ธฐ๋ฐ˜ ์ž ์žฌ ๊ณต๊ฐ„ ์ธ์ฝ”๋”ฉ์„ ์‚ฌ์šฉํ•˜์—ฌ TSDF(Truncated Signed Distance Function) ํ‘œํ˜„์„ ์ƒ์„ฑํ•œ๋‹ค. ์ดํ›„ ํ™•์‚ฐ ๊ธฐ๋ฐ˜ ํ…์Šค์ฒ˜ ํ•ฉ์„ฑ ๋ชจ๋“ˆ์€ ๊ธฐํ•˜ํ•™์  ์กฐ๊ฑดํ™”์™€ ์ž ์žฌ ๊ณต๊ฐ„ ๋™๊ธฐํ™”๋ฅผ ํ†ตํ•ด ์—ฌ๋Ÿฌ ์‹œ์ ์—์„œ ์ผ๊ด€๋œ ํ…์Šค์ฒ˜๋ฅผ ๋ณด์žฅํ•œ๋‹ค. ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ๋Š” ๊ธฐ์กด ์˜คํ”ˆ ์†Œ์Šค ๋ฐฉ๋ฒ•๋“ค์„ ๋Šฅ๊ฐ€ํ•˜๋ฉฐ ๋…์ ์ ์ธ ์†”๋ฃจ์…˜๋“ค๊ณผ๋„ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ํ’ˆ์งˆ์„ ๋‹ฌ์„ฑํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค. ํŠนํžˆ ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” LoRA์™€ ๊ฐ™์€ 2D ์ œ์–ด ๊ธฐ์ˆ ์„ 3D ํ•ฉ์„ฑ์— ์ง์ ‘ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•˜์—ฌ 2D์™€ 3D ์ƒ์„ฑ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์—ฐ๊ฒฐํ•˜๋Š” ๋…ํŠนํ•œ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•œ๋‹ค. ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ, ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ •ํ™•์„ฑ, ์žฌํ˜„์„ฑ์„ ๋™์‹œ์— ํ–ฅ์ƒ์‹œํ‚ด์œผ๋กœ์จ Step1X-3D๋Š” ์ œ์–ด ๊ฐ€๋Šฅํ•œ 3D ์—์…‹ ์ƒ์„ฑ์„ ์œ„ํ•œ ๊ฐœ๋ฐฉํ˜• ์—ฐ๊ตฌ์˜ ์ƒˆ๋กœ์šด ํ‘œ์ค€์„ ์ •๋ฆฝํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค.

๊ฒฝ๋Ÿ‰ํ™” ๋ชจ๋ธ ์—ฐ๊ตฌ

Bielik v3 Small: Technical Report

Paper

์ด ๋…ผ๋ฌธ์€ ํด๋ž€๋“œ์–ด ์ฒ˜๋ฆฌ์— ์ตœ์ ํ™”๋œ, ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์„ฑ์ด ๋†’์€ ์ƒ์„ฑํ˜• ํ…์ŠคํŠธ ๋ชจ๋ธ ์‹œ๋ฆฌ์ฆˆ์ธ Bielik v3 (1.5B ๋ฐ 4.5B ํŒŒ๋ผ๋ฏธํ„ฐ)๋ฅผ ์†Œ๊ฐœํ•œ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ๋” ์ž‘๊ณ  ์ž˜ ์ตœ์ ํ™”๋œ ์•„ํ‚คํ…์ฒ˜๋กœ๋„ ํ›จ์”ฌ ์ ์€ ๊ณ„์‚ฐ ์ž์›์„ ์‚ฌ์šฉํ•˜๋ฉด์„œ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ๊ณผ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค. ์ฃผ์š” ํ˜์‹  ์‚ฌํ•ญ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค: ํ† ํฐ ํšจ์œจ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋งž์ถคํ˜• ํด๋ž€๋“œ์–ด ํ† ํฌ๋‚˜์ด์ €(APT4), ๋‹ค์–‘ํ•œ ๋ช…๋ น์–ด ์œ ํ˜•์— ๊ฑธ์ณ ํ•™์Šต ๊ท ํ˜•์„ ๋งž์ถ”๋Š” ๊ฐ€์ค‘ ๋ช…๋ น์–ด ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ ์†์‹ค, ๊ทธ๋ฆฌ๊ณ  ํ›ˆ๋ จ ์ง„ํ–‰ ์ƒํ™ฉ์— ๋”ฐ๋ผ ํ•™์Šต๋ฅ ์„ ๋™์ ์œผ๋กœ ์กฐ์ ˆํ•˜๋Š” ์ ์‘ํ˜• ํ•™์Šต๋ฅ ์ด๋‹ค. 3์–ต 3๋ฐฑ๋งŒ ๊ฐœ์˜ ๋ฌธ์„œ์— ๊ฑธ์นœ 2920์–ต ๊ฐœ์˜ ํ† ํฐ์œผ๋กœ ๊ตฌ์„ฑ๋œ ์„ธ์‹ฌํ•˜๊ฒŒ ์„ ๋ณ„๋œ ๋ง๋ญ‰์น˜๋กœ ํ›ˆ๋ จ๋œ ์ด ๋ชจ๋ธ๋“ค์€ ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค. 45์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ์€ 2~3๋ฐฐ ํฐ ๋ชจ๋ธ๊ณผ ๊ฒฝ์Ÿํ•  ๋งŒํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ฃผ๋ฉฐ, 15์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ์€ ๋งค์šฐ ์ž‘์€ ํฌ๊ธฐ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐœ์ „์€ ์ƒ๋Œ€์ ์œผ๋กœ ์ ๊ฒŒ ์—ฐ๊ตฌ๋œ ์–ธ์–ด์—์„œ ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์ ์ธ ์–ธ์–ด ๋ชจ๋ธ๋ง์˜ ์ƒˆ๋กœ์šด ๊ธฐ์ค€์„ ์ œ์‹œํ•˜๋ฉฐ, ์ž์›์ด ์ œํ•œ๋œ ํ™˜๊ฒฝ์—์„œ๋„ ๊ณ ํ’ˆ์งˆ ํด๋ž€๋“œ์–ด AI ๊ธฐ์ˆ ์— ๋” ์‰ฝ๊ฒŒ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค.

profile
XR๊ณผ AI์— ๊ด€์‹ฌ์ด ๋งŽ์€ Sky ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€