
๐: https://arxiv.org/abs/2311.17245
methods ์์ฃผ๋ก ๋ฆฌ๋ทฐ
LightGaussian์ 3D Gaussian Splatting์ ์ ์ฅ ๊ณต๊ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๊ฐ๋ฐ๋ ์๋ก์ด ๊ธฐ์ ์ด๋ค.
LightGaussian์ ํ๊ท 15๋ฐฐ ์ด์์ ์์ถ๋ฅ ์ ๋ฌ์ฑํ๊ณ , ์๊ฐ์ ํจ๊ณผ๋ฅผ ์ ์งํ๋ฉด์๋ ๋ ๋ฎ์ ์ ์ฅ ๊ณต๊ฐ ์ ์ฌ์ฉํ๋ค.
overview of LightGaussian

3DGS ๋ชจ๋ธ์ multi-view ์ด๋ฏธ์ง๋ก ํ๋ จ๋๊ณ , SfM point clouds์์ ์ด๊ธฐํ๋๋ค. ํฌ์ ํฌ์ธํธ๋ฅผ ์๋ฐฑ๋ง ๊ฐ์ ๊ฐ์ฐ์์์ผ๋ก ํ์ฅํด์ ์ฅ๋ฉด์ด ์ ํํ๋๋ค.
Gaussian Prune๊ณผ Recovery ์ฌ์ฉํด์ ๊ฐ์ฐ์์ ์๋ฅผ ์ค์ด๊ณ , SH Distillation์ ์ฌ์ฉํ์ฌ ์ค๋ณต SH๋ฅผ ์ ๊ฑฐํ๊ณ , ์ค์ํ ์กฐ๋ช ์ ๋ณด๋ ๋ณด์กดํ๋ค. Vector Quantization์ ์ฝ๋๋ถ ์ด๊ธฐํ ๋ฐ ํ ๋น์ ํฌํจํ์ฌ ๋ชจ๋ธ ๋์ญํญ์ ์ค์ด๋ ๋ฐ ์ฌ์ฉ๋๋ค.
LightGaussian์ ๋จผ์ ํ๋ จ ๋ฐ์ดํฐ์ ๋ํด ๊ฐ ๊ฐ์ฐ์์์ ์ ์ญ ์ค์๋๋ฅผ ๊ณ์ฐํ๊ณ , ์ค์๋๊ฐ ๋ฎ์ ๊ฐ์ฐ์์์ ์ ๊ฑฐํ๋ค. ํฉ์ฑ๋ ๊ฐ์ ๋ทฐ๋ฅผ ์ฌ์ฉํ ์ฆ๋ฅ๊ฐ ๋์ ๋์ด SH๋ฅผ ์ปดํฉํธํ ํ์์ผ๋ก ์ ํํ๋ค. Vector Quantization์ ๋ ๋ฎ์ ๋นํธ ํญ์์ ๊ฐ์ฐ์์์ ์ ์ฅํ๋ ๋ฐ ์ฌ์ฉ๋๋ค.
3DGS๋ ๊ฐ์ฐ์์์ ์ฌ์ฉํ์ฌ ์ฅ๋ฉด์ ๋ชจ๋ธ๋งํ๋ explicit point ๊ธฐ๋ฐ 3D ์ฅ๋ฉด ํํ์ด๋ค. SfM์ผ๋ก ์์ฑ๋ sparse point cloud์์ ์ด๊ธฐํ๋๋ฉฐ, ๊ฐ์ฐ์์ ๋ฐ๋ ์ฆ๊ฐ๋ฅผ ์ ์ฉํด์ ์์ ๊ท๋ชจ์ geometry๋ฅผ ๋ถ์ถฉ๋ถํ๊ฒ ๋ค๋ฃจ๋ ๊ฐ์ฐ์์ ์๋ฅผ ์ฆ๊ฐ์ํจ๋ค.
๊ฐ ๊ฐ์ฐ์์์ ๊ณต๋ถ์ฐ ํ๋ ฌ ฮฃ์ ์ค์ฌ์ X(๊ฐ์ฐ์์์ ํ๊ท ๊ฐ)์ ๊ฐ๋๋ค. ฮฃ๋ ๋ฏธ๋ถ ์ต์ ํ๋ฅผ ์ํ ์ค์ผ์ผ๋ง ํ๋ ฌ S์ ํ์ ํ๋ ฌ R๋ก ๋ถํด๋ ์ ์๋ค.
๋ณต์กํ ๋ฐฉํฅ์ฑ์ ๊ตฌ๋ฉด์กฐํ(SH)๋ก ๋ชจ๋ธ๋ง๋๋ค. ์ฐจ์ D๋ SH์ ๋ณต์ก์ฑ์ ๊ฒฐ์ ํ๋๋ฐ, ์ฐจ์๊ฐ ๋์์๋ก ์ธ๋ฐํ๊ฒ ๋ชจ๋ธ๋งํ ์ ์์ง๋ง ๊ณ์ฐ๊ณผ ์ ์ฅ ๋ถํ๊ฐ ์ฆ๊ฐํ๋ค.
Splatting์ผ๋ก 3D ๊ฐ์ฐ์์์์ 2D ์ด๋ฏธ์ง๋ฅผ renderingํ๋ค.

(opacity๋ ํฌ๋ช
๋, PSNR์ ํผํฌ ์ ํธ ๋ ์ก์๋น)
Zero-shot ๋ถํฌ๋ช
๋ ๊ธฐ๋ฐ Pruning
Gaussian densification (๊ฐ์ฐ์์ ๋ฐ๋ ์ฆ๊ฐ):
Problem:
Solution: pruning
๋ถํ์ํ ๊ฐ์ฐ์์์ ์ ๊ฑฐํ๋ฉด์๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํด์ผ ํ๋ค. ์ค๋ณต ๊ฐ์ฐ์์์ ์๋ณํ๋ ๊ฒ์ด ์ค์ํ๋ค. ๋จ์ํ ๋ถํฌ๋ช ๋์ ๊ธฐ๋ฐํ์ฌ pruning ํ๋ฉด ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์๋ค.
Global Significance Calculation
๊ฐ์ฐ์์์ ์ค์์ฑ์ ํ๊ฐํ ๋ ๋ถํฌ๋ช
๋์ ์์กดํ๋ ๋์ 3D ๊ฐ์ฐ์์์ด view frustum ๋ด์์ ํ๊ฐ๋๊ณ , rendering์ ์ํด ์นด๋ฉ๋ผ view point๋ก ํฌ์๋๋ค.
Global significant score (GS)

๊ฐ์ฐ์์ ๋ถํผ๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐฐ๊ฒฝ ๊ฐ์ฐ์์์ ์ค์์ฑ์ ๊ณผ์ฅํด์, ๋ณต์กํ geometry๋ฅผ ๋ชจ๋ธ๋งํ ๋ ์ค์ํ ๊ฐ์ฐ์์์ ๋ง์ด ์ ๊ฑฐํ ์ ์๋ค. ๋ฐ๋ผ์ ๋ adaptive ๋ฐฉ๋ฒ์ผ๋ก ๋ถํผ๋ฅผ ์ธก์ ํ๋ค.
adaptive way (ฮฒ=3)
๊ฐ์ฐ์์ ๋ถํผ๋ ์์ 90%์ ๊ฐ์ฅ ํฐ ๊ฐ์ฐ์์์ ์ํด ์ ๊ทํ๋๊ณ , ๋ฒ์๋ 0์์ 1 ์ฌ์ด๋ก ์ ์ง ๋ผ์ 3DGS์ ๊ณผ๋ํ ์ค์๋ ํ ๋น์ ๋ฐฉ์งํ๋ค.
Gaussian Co-adaptation
: pruning ํ ๋จ์ ๊ฐ์ฐ์์๋ค์ ์ต์ ํํ์ฌ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํ๋ ๋ฐฉ๋ฒ
๊ณ์ฐ๋ GS(global ์ค์๋ ์ ์)๋ฅผ ๋ฐํ์ผ๋ก ๋ชจ๋ ๊ฐ์ฐ์์์ ์์๋ฅผ ๋งค๊ธฐ๋๋ฐ. ์์๋ ์ ์๊ฐ ๋ฎ์ ๊ฐ์ฐ์์์ pruningํ ์ ์๋ ๊ธฐ์ค์ด๋ค. (= ์ ์๊ฐ ๋ฎ์ ๊ฐ์ฐ์์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ๋ ๊ธฐ์ฌํ๊ธฐ ๋๋ฌธ์ pruning ๋์์ด๋ค)
pruning ํ ๋จ์ ๊ฐ์ฐ์์๋ค์ ์ถ๊ฐ์ ์ธ densification ์์ด ์ต์ ํ๋๋ค. co-adaptation์ ๊ฐ ๊ฐ์ฐ์์์ด ์ต์ ์ ์ํ๋ก ์กฐ์ ๋์ด ์ ์ฒด์ ์ธ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํ๋ ๋ฐ ๋์์ด ๋๋ค.
Photometric loss๋ ์ด๋ฏธ์ง์ ํฝ์
๊ฐ ์ฐจ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ค์ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ์ด๋ค. ์๋์ ํ๋ จ view๋ฅผ ์ฌ์ฉํ์ฌ 5000๋ฒ ๋ฐ๋ณตํด์ ์์ค์ ์ต์ํํ๋๋ก ํ๋ค.
์์ถ๋์ง ์์ Gaussian Splat ๋ฐ์ดํฐ๋ ์๋นํ ์์ ๊ตฌ๋ฉด ์กฐํ(SH) ๊ณ์๋ฅผ ํฌํจํ๊ณ ์๋ค. SH ์๋ฅผ ์ค์ด๋ฉด ๊ณต๊ฐ์ ์ ์ฝํ ์ ์์ง๋ง ํ๋ฉด ๊ดํ์ด ํฌ๊ฒ ๊ฐ์ํ๊ณ , ๋ทฐ ํฌ์ธํธ๊ฐ ๋ณ๊ฒฝ๋ ๋ ๋ฐ์ฌ ๋ณํ์ ๋ถ์ฐ(variance in specular reflections)์ ์ํฅ์ ๋ฏธ์น๋ค.
๋ชจ๋ธ์ ํฌ๊ธฐ์ ์ฅ๋ฉด ๋ชจ๋ธ๋ง ํ์ง ์ฌ์ด์ ๊ท ํ์ ๋ง์ถ๊ธฐ ์ํด ๊ณ ์ฐจ์ SH์์ ์ ์ฐจ์ SH๋ก ์ง์์ ์ ์ดํ๋ distillation process์ ์ ์ํ์๋ค. (์ฆ๋ฅ ๊ณผ์ : teacher model โ student model ์ง์์ ์ ์ด)
์ฆ๋ฅ ์์ค ํจ์ (H: ์ด๋ฏธ์ง ๋์ด, W: ์ด๋ฏธ์ง ๋๋น, C: ํฝ์
๊ฐ๋)
๋ ๋ชจ๋ธ ๊ฐ์ ์์ธก๋ ํฝ์
๊ฐ๋ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ ๋ฐฉ์์ผ๋ก ์ ์
Synthesize Pseudo Views
๋ทฐํฌ์ธํธ๊ฐ ๋ณ๊ฒฝ๋๋ฉด ๋ฌผ์ฒด ํ๋ฉด์์ ๋ฐ์ฌ๋๋ ๊ด์ ์ด ๋ฌ๋ผ์ง๋ค. ๋ทฐํฌ์ธํธ๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ์ํ๋งํ์ฌ ํ๋ จ ๋ฐ์ดํฐ์ ์๋ก์ด ์์ ์ ๋์ ํ๋ฉด ๋ฐ์ฌ ํน์ฑ์ ๋ ์ ํฌ์ฐฉํ ์ ์๋ค. ๊ฐ์ฐ์์ ๋ถํฌ๋ฅผ ์ฌ์ฉํ์ฌ ์๋ก์ด ์นด๋ฉ๋ผ ์์น๋ฅผ ์ํ๋งํ๊ณ , ์ผ๊ด๋ ์นด๋ฉ๋ผ ๋ทฐ ๋ฐฉํฅ์ ์ ์งํ๋ค.
์๋ก ์์ฑ ๋ ์์ฌ ์นด๋ฉ๋ผ ์์น = ํ๋ จ ์นด๋ฉ๋ผ ์์น + N
N์ ํ๊ท ์ด 0์ด๊ณ ๋ถ์ฐ์ด ฯ^2์ธ ๊ฐ์ฐ์์ ๋ถํฌ๋ฅผ ๋ํ๋ด๊ณ , ์ด๋ ์๋ก์ด ์์น๋ฅผ ์์ฑํ๊ธฐ ์ํด ์๋ ์์น์ ๋ํด์ง๋ค.
๋ฒกํฐ ์์ํ๋ voxel์ ์์ถ ์ฝ๋๋ถ์ผ๋ก ํด๋ฌ์คํฐ๋งํ๋ค. ๋์ ์์ถ๋ฅ ์ ๋ฌ์ฑํ ์ ์์ง๋ง, ๊ฐ์ฐ์์ ์์ฑ์ ์์ํํ๋ ๊ฒ์ ์ ๊ธฐ๋ฐ ํํ์ non-Euclidean ์ฑ์ง ๋๋ฌธ์ ์ด๋ ต๋ค. ํนํ ์์น, ํ์ , ์ค์ผ์ผ๊ณผ ๊ฐ์ ์์ฑ์ ์์ํ๋ฅผ ์ ์ฉํ๋ฉด ์ ๋ฐ๋์ ์ ํ๋๊ฐ ์ ํ๋ ์ ์๋ค.
SH ๊ณ์์ ๋ฒกํฐ ์์ํ๊ฐ ์ ์ฉ๋๋๋ฐ, ์ฌ์ ๊ณ์ฐ๋ ์ค์๋ ์ ์๋ฅผ ํ์ฉํ์ฌ rendering ํ์ง ์์ค๊ณผ ์์ถ๋ฅ ๊ฐ์ ๊ท ํ์ ๋ง์ถ๋ ๋ฐ ์ค์ ์ ๋๋ค. ๋ฒกํฐ ์์ํ๋ฅผ ์ ์ฉํ ๋, SH์์ ๊ฐ์ฅ ์ค์ํ์ง ์์ ์์๋ค์ ์ ํ์ ์ผ๋ก ์์ํํ๋ค. K ํ๊ท ์ ํตํด C(์ฝ๋๋ถ)๋ฅผ ์ด๊ธฐํํ๊ณ , ๋ฐ๋ณต์ ์ผ๋ก G(๊ฐ์ฐ์์ ์งํฉ)์ ๋ฐฐ์น๋ฅผ ์ํ๋งํ์ฌ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ๋ก ๊ฐ์ฅ ๊ฐ๊น์ด ์ฝ๋์ ์ฐ๊ฒฐํ๋ค. ์ด๋ ํ๊ท ๊ท์น์ ํตํด ๊ฐ ck๋ฅผ ์ ๋ฐ์ดํธํ๋ค.
ฮปd = 0.8์ ๊ฐ์ ๊ฐ์ ๋ํ๋ธ๋ค.
5000๋ฒ ๋์ ๋ฐ๋ณตํ๋ฉฐ ์ฝ๋ ๋ถ๋ถ์ fine tuning ํ๋ฉฐ, ๊ฐ์ฐ์์-์ฝ๋๋ถ ๋งคํ์ ๊ณ ์ ํ๋ค. ํ๋ จ ๋ทฐ์์ ์ถ๊ฐ์ ์ธ ํด๋ก ์ด๋ ๋ถํ ์์
์์ด photometric loss๋ฅผ ์ต์ํํ๋ค.