CPU, GPU ๋ง์ด ๋ค์ด๋ดค์ง๋ง... NPU? ๊ต์ฅํ ๋ฏ์ค๋ค. ์ต๊ทผ์ ์ธ๊ณต์ง๋ฅ์ ๊ณต๋ถํ๋ ์ธ๋ถ ๋๊ธฐ๊ฐ NPU์ชฝ์ ๊ณต๋ถํ๋ค๊ณ ๋ค์๋ค. NPU๊ฐ ๋ฌด์์ธ์ง ๊ถ๊ธํ์ฌ, ๋ธ๋ก๊ทธ๊ธ ์ฃผ์ ๋ก ์ ์ ํด๋ณด์๋ค.

CPU, GPU์ ๋ค๋ฅธ์ ์ ๋ฌด์์ผ๊น? CPU, GPU๋ ์ผ๋ฐ์ ์ธ ์ปดํจํ ์ ์ํด ๋ง๋ค์ด์ก๋ค.
CPU๋ ์์์ ์ฝ์ด๋ฅผ ๊ฐ์ ธ, ๋์ผํ ์ฐ์ฐ์ ๋๋์ผ๋ก ๋ฐ๋ณตํ๋ ์์
์์ ํจ์จ์ด ๋จ์ด์ง๋ค.
๋ฐ๋ผ์ GPU๋ผ๋ ๊ฒ์ด ๋์๋๋ฐ, ์ด ์น๊ตฌ๋ CPU๊ฐ ๊ฐ์ง์ง ๋ชปํ ์์ฒ๊ฐ์ ์ฝ์ด๋ฅผ ์ด์ฉํด ๋๋์ ์ฐ์ฐ์ ๋์์ ์ฒ๋ฆฌํ๋ ๋ณ๋ ฌ ์ฒ๋ฆฌ ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์๋ค.
์ฐ๋ฆฌ๋ ์ธ๊ณต์ง๋ฅ ํ๋ก์ ํธ๋ฅผ ํ๋ฉด์ GPU๊ฐ ๋ถ์กฑํ ์ํฉ์ ๋ง์ด ๊ฒช์ด๋ณด์์ ๊ฒ ๊ฐ๋ค. ์ฆ, ๋ฅ๋ฌ๋ ๋ถ๊ณผ ํจ๊ป AI ์ฐ์ฐ์ด ํ์์ ์ด๊ฒ ๋๋ฉด์, GPU ์ฑ๋ฅ์ด ์ค์ํด์ก๋๋ฐ, GPU๋ ์ ๋ ฅ ์๋ชจ๊ฐ ํฌ๊ณ , AI ์ธ์ ๋ชฉ์ ๊น์ง ๊ณ ๋ คํ ๋ฒ์ฉ ๋ณ๋ ฌ ํ๋ก์ธ์์ฌ์ ํ๊ณ๋ฅผ ๊ฐ์ง๊ณ ์๋ค.
๊ทธ๋์ ๋์จ ๊ฒ์ด NPU์ด๋ค. CPU, GPU์ ๋ฌ๋ฆฌ, ์ฒ์๋ถํฐ ๋ฅ๋ฌ๋ ์ ๊ฒฝ๋ง ๊ตฌ์กฐ๋ฅผ ์ ์ ๋ก ํ์ฌ ๋ง๋ค์ด์ง ํน์ ํ๋์จ์ด์ด๋ค. ์ด๋ก์จ, ๋ ํจ์จ์ ์ธ AI ์ฒ๋ฆฌ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ค.

์์ฆ NPU๊ฐ ์ฃผ๋ชฉ๋ฐ๋ ์ด์ ๋ ๊ฐ์ AI ์ฐ์ฐ์ ๋ ์ ์ ์ ๋ ฅ๊ณผ ๋ ์งง์ ์๊ฐ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. ๊ทธ๋ ๋ค๋ฉด ์ด๋ ํ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ณ ์๊ธธ๋? ์ด๋ ๊ฒ AI ์ฐ์ฐ์ ํนํ๋ ์ ์์์๊น?
๋จผ์ , ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํต์ฌ ์ฐ์ฐ์ ์์์ผํ๋ค. ๋ฅ๋ฌ๋์ ๊ณต๋ถํด๋ณด์๋ค๋ฉด, ํ๋ ฌ ๊ณฑ์ , Multiply-accumulate, convolution ์ฐ์ฐ ๊ฐ์ ์ฉ์ด๋ฅผ ํ ๋ฒ์ฏค์ ๋ค์ด๋ดค์ ๊ฒ์ด๋ค. NPU๋ ์ด๋ฌํ ์ฐ์ฐ์ ๋ฐ๋ณต์ , ๋๋์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋๋ก MAC ์ฐ์ฐ ์ ๋์ ํ๋์จ์ด์ ๋ด์ฅ์ํจ๋ค. ์ฌ๊ธฐ์ MAC ์ฐ์ฐ ์ ๋์ด๋ ๊ณฑ์ ๊ณผ ๋์ ๋ง์ ์ ํ ๋ฒ์ ์ํํ๋ ์ฐ์ฐ ์ฅ์น๋ก, ์ ๊ฒฝ๋ง ๊ณ์ฐ์ ํต์ฌ์ ์ด๋ฃจ๋ ์ฐ์ฐ์ ํ๋์จ์ด ์์ค์์ ๊ฐ์ํ๋ค.


์๊ทธ๋ฆผ๋ค์ ๋ค ์คํฐ๋ ์๊ฐ์ ํ๋ ๋ด์ฉ์ธ๋ฐ, ์ด ๊ณ์ฐ๋ค์ ๊ณตํต์ ์ ๊ณฑ๊ณผ ํฉ์ ์ฐ์์ด๋ผ๋ ๊ฒ์ด๋ค. ์ด๋ฌํ MAC ์ฐ์ฐ์ ํนํ๋ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ฒ์ด NPU๋ผ๊ณ ๋ณด๋ฉด ๋๋ค.
NPU ๋ด๋ถ์์ ์ฐ์ฐ์ ์๋๋ฅผ ๋์ด๋ ๊ฒ๋ ๋งค์ฐ ์ค์ํ๋ค. ์ด๋ฅผ ์ํด ๋์ ์ ๋ฐ๋์ ๋ถ๋์์์ ์ฐ์ฐ์ด ์๋, INT8, INT4 ๊ฐ์ ์ ์ ๋ฐ ์ฐ์ฐ์ ์ ํํ๋ค. ์ฆ, ์ฐ๋ฆฌ๊ฐ Ondevice AI ๋ชจ๋ธ์ ํ์์ ์ธ Quantization ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ค๊ณ ๋ณผ ์ ์์ ๊ฒ ๊ฐ๋ค. ์ด๋ ๊ฒ ์์ํ๋ฅผ ํจ์ผ๋ก์จ, ๊ฐ์ ์ ๋ ฅ์ผ๋ก๋ ๋ ๋ง์ ์ฐ์ฐ์ ์ํํ ์ ์๊ณ , ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ด๋ ๋ฐ์ดํฐ ์ด๋ ๋น์ฉ์ ๊ฐ์ํ ์ ์๋ค.
NPU๋ AI ์ถ๋ก ์ ํนํ๋์ด ์๋ค. ์ด๋ฏธ ํ์ต๋ ๋ชจ๋ธ์ ์ด์ฉํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ๋น ๋ฅด๊ฒ ์์ธกํ๋ ๊ณผ์ ์ ์ต์ ํ๋์ด ์๋ค. ํด๋ผ์ฐ๋๋ฅผ ๊ฑฐ์น์ง ์๊ณ , ์ค์๊ฐ ์ฒ๋ฆฌ๋ฅผ ๋๋ฐ์ด์ค ๋ด์์ ํ ์ ์์ผ๋ฉฐ, ์์ฆ ๋ถ์ํ๋ Ondevice AI์๋ ํ์์ ์ธ ํ๋์จ์ด ์ฅ์น๋ผ๊ณ ๋ณผ ์ ์๋ค. ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋, ๋ฐ์ดํฐ ์ผํฐ ๋น์ฉ, ํด๋ผ์ฐ๋ ์์กด๋๋ฅผ ์ค์ด๋ ๋ฐฉํฅ์ผ๋ก ์์ฆ AI ๊ฐ ๋ฐ์ ํด๋๊ฐ๊ณ ์๋๋ฐ, ์ด๋ฌํ ์์ฆ AI ํธ๋ ๋์ ํ์์ ์ผ๋ก ์์์ผํ๋ ๊ฐ๋ ์ด๋ผ๊ณ ์๊ฐํ๋ค.
์ฐ๋ฆฌ๋๋ผ๋ NPU๋ฅผ ๋ง๋ค๊ณ ์๋ ๋ํ์ ์ธ ๊ธฐ์ ๋ค์ด ์๋ค.
์ฒซ๋ฒ์งธ๋ก๋ Rebellions๋ผ๋ ๊ธฐ์ ์ด๋ค.
Rebellion์ ๋ํ์ ์ธ ์นฉ์ ATOM์ด๋ผ๋ NPU์ธ๋ฐ, 16GB GDDR6 ๋ฉ๋ชจ๋ฆฌ์ 256GB/s์ ๋ฉ๋ชจ๋ฆฌ ๋์ญํญ์ ์ ๊ณตํด ์ํ ์ธ์ด ๋ชจ๋ธ(SLM) ์ถ๋ก ์ ์ต์ ํ๋ ์ฑ๋ฅ์ ๊ตฌํํ๋๋ฐ ํนํ๋์ด์๋ค.
๋๋ฒ์งธ๋ก๋ FuriosaAI๋ผ๋ ๊ธฐ์
์ด๋ค.

FuriosaAI๋ ํ๊ตญ์์ ์์๋ AI ๋ฐ๋์ฒด ์ ์ฒด๋ก, ์ ์ ๋ ฅยท๊ณ ์ฑ๋ฅ NPU ๊ฐ๋ฐ์ ๋ชฉํ๋ก ํ๊ณ ์๋ค. 1์ธ๋ NPU Warboy๋ฅผ ์์์ผ๋ก 2์ธ๋ RNGD ์ ํ์ ์์ฅ์ ๋ด๋์๊ณ , 2026๋ ์ดํ ์์ฉํ์ ๋๋ ์์ฐ ์ถ์ง์ด ์ด์ด์ง๊ณ ์๋ค.

์ฐ๋ฆฌ๊ฐ GPU ๊ธฐ์ ์ด๋ผ๊ณ ํ๋ฉด ์๋น๋์๊ฐ ๋จผ์ ๋ ์ค๋ฅธ๋ค. ์๋น๋์๋ ๋ ๋ฆฝ์ ์ธ NPU๋ฅผ ๋ง๋๋ ๋ฐฉํฅ์ด ์๋, GPU+tensor core ๋ฐฉ์์ผ๋ก AI ์ฑ๋ฅ์ ๊ฐํํ๊ณ ์๋ค๊ณ ํ๋ค. ์ฆ, ๋ณ๋์ NPU ์นฉ์ ๋ง๋๋ ๊ฒ์ด ์๋, ๊ธฐ์กด์ GPU์ AI ์ฐ์ฐ ๊ฐ์๊ธฐ๋ฅผ ์น๋ ๋ฐฉ์์ ์ ํํ ๊ฒ์ด๋ค.
๊ทธ๋ ๋ค๋ฉด ์์ฐ์ค๋ฝ๊ฒ ์๋ฌธ์ด ์๊ธธ ๊ฒ์ด๋ค.
NPU? ์๋๋ฉด GPU+tensor core?
๋๊ฐ์ง ๋ฐฉ์ ๋ชจ๋ ๊ฐ์์ ์ฅ๋จ์ ์ด ์๋ค.
์ ์ฉ NPU๋ ๋ชจ๋ฐ์ผ, ondevice ai, ์๊ท๋ชจ ๋ฐ์ดํฐ ์ผํฐ๋ฅผ ์ฌ์ฉํ๋ค๋ ์ ์์ ๋งค์ฐ ์ข๋ค. ์ฆ, ์ ๋ ฅ ๋๋น ์ต๊ณ ์ ์ฑ๋ฅ์ ๋ผ ์ ์๊ณ , ๋น์ฉ ํจ์จ์ด ๋งค์ฐ ์ข๋ค๊ณ ๋ณผ ์ ์๋ค. ํ์ง๋ง ์ด์ ๋ฐ๋ฅด ๋จ์ ์ด ์๋ค. AI์ ํนํ๋์ด ์๋ค๋ณด๋, ๋ฒ์ฉ์ฑ์ด ๋ฎ๋ค๋ ๋จ์ ์ด ์๋ค. ์ฆ NPU๋ AI๋ง์ ์ํ ์ต๊ณ ์ ํ๊ฒฝ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค.
GPU+Tensor core๋ ํ์ต๊ณผ ์ถ๋ก ๋ชจ๋ ๊ฐ๋ฅํ๊ณ , ๋ฒ์ฉ์ฑ์ด ๋งค์ฐ ๋๋ค๋ ์ฅ์ ์ด ์๋ค. ๊ทธ๋ฌ๋ ์ ๋ ฅ ์๋ชจ๊ฐ ํฌ๊ณ ๋น์ฉ์ด ๋๋ค๋ ๋จ์ ์ด ์๋ค.
์ฌ์ค ๋ชจ๋ธ๋ค์ด ๋์ฑ ๋ ๋ง์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ ธ, ์ ๋ฐ๋๋ฅผ ์ ์งํ๋ ค๋ ๋ฐฉ์์ผ๋ก ๋ฐ์ ํด๊ฐ๊ณ ์๋๋ฐ, ์ฌ์ค ์ด ๋ถ๋ถ๋ ์ด๋์ ๋์ ํ๋ผ๋ฏธํฐ ์๋ฅผ ๋๋ฌํ๋ฉด, ์ด๋ฅผ ์ ์งํ๋ ค๋ ํด๋ผ์ฐ๋ ์๋น์ค๋ ๋ฐ์ดํฐ ์ผํฐ๊ฐ ๋ถ์กฑํด์ง๊ธฐ ๋ง๋ จ์ผ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ๋ค. ์ด์ ๋ํ ๋ฐฉ์์ผ๋ก NPU์ ๊ฐ๋ฐ์ ํ์์ ์ด๋ผ๊ณ ์๊ฐ์ด ๋๋ค.