๐์ฐธ๊ณ ์์
์ด ์๊ณ ๋ฆฌ์ฆ์ ํต์ฌ์ t-SNE์ ๋ค์ ์ ์ฌํ๋ค.

๋ชจ๋ ๊ณ ์ฐจ์ ์ํ์ ๊ฐ ์ด์๊น์ง์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, ๊ณ ์ฐจ์ ๊ณต๊ฐ์์ ๊ฑฐ๋ฆฌ๋ฅผ ์ ์ฐจ์ ๊ณต๊ฐ์์๋ ์ต๋ํ ์ผ์นํ๊ฒ ํํํ๋ ค๊ณ ํ๋ค.

ํ์ง๋ง t-SNE๊ฐ ๊ฐ์ฐ์์ ๋ถํฌ์ ํ๋ฅ ๋ถํฌ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ,UMAP์ ๋์ ๊ทธ๋ํ๋ฅผ ์ฌ์ฉํ์ฌ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์ ์ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ํํํ๋ค.
์ด์ ์๋๋ฐฉ์์ ๋ณด๋ฉด ๋จผ์ , ๊ฐ ์ํ์ ๊ฐ์ฅ ๊ฐ๊น์ด k๊ฐ์ ์ด์์ ์ฐพ์์ผ ํ๋ค.

์ด์ ํ์์ ์ฌ๋ฌ ์๊ณ ๋ฆฌ์ฆ์ด ์์ผ๋ฉฐ, ์ง์ ๊ฐ ๊ฑฐ๋ฆฌ ๋น๊ต๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฃจ์ด์ง๋ฉฐ, ์ค์ ๋ k ๊ฐ์ ๋ฐ๋ผ ์ด์์ ๊ฐ์๋ฅผ ์กฐ์ ํ๋ค.

์ด ๊ณผ์ ์์ ๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ์ ์ด์ ๊ฐ ๊ฐ์ฅ์๋ฆฌ๊ฐ ๊ตฌ์ฑ๋๋ฉฐ, ์ด๋ฅผ ํตํด ์ด๊ธฐ ์ด์ง ๊ทธ๋ํ๊ฐ ์์ฑ๋๋ค.

์ด์ ๊ฐ์ค์น ๊ทธ๋ํ๋ฅผ ์์ฑํ๋๋ฐ, ๊ฐ ํฌ์ธํธ์ ์ด์ ๊ฐ์ ๊ฑฐ๋ฆฌ์ ๋ํด ์ง์์ ๊ฐ์ (exponential decay)๋ฅผ ์ ์ฉํด ๊ฐ์ค์น๋ฅผ ๊ณ์ฐํ๋ค.

๊ฐ์ฅ ๊ฐ๊น์ด ์ด์์๋ ์ต๋ ๊ฐ์ค์น(1)๋ฅผ ํ ๋นํ๋ฉฐ, ๊ฑฐ๋ฆฌ์ ๋ฐ๋น๋กํด ๊ฐ์ค์น๊ฐ ๊ฐ์ํ๋ค. ์ด๋ t-SNE์ ์ ์ฌํ ๊ณต์์ด์ง๋ง, UMAP์ ๊ฐ์ ์ ๊ทํํ์ง ์์ ๊ณ์ฐ ์๋๊ฐ ๋ ๋น ๋ฅด๋ค.
์ด์ ์ด ์ํ์ ๋ํ ๊ฐ์ค์น๊ฐ ์์ผ๋ฏ๋ก ๋ค๋ฅธ ์ํ ๊ฐ๊ฐ์ ๋ํด ๋์ผํ ํ๋ก์ธ์ค๋ฅผ ๋ฐ๋ณตํ๋ค.

์ฌ๊ธฐ์ 3๊ฐ์ ๊ทธ๋ํ๋ง ํ์๋ผ ์์ง๋ง, ๊ฒฐ๊ณผ์ ์ผ๋ก ์ํ๋น ํ๋์ ๊ฐ์ค์น ๊ทธ๋ํ๊ฐ ์์ฑ๋๋ฏ๋ก ๊ฐ ์ํ๋ณ๋ก ์์ฑ๋ ๊ฐ์ค์น ๊ทธ๋ํ๋ฅผ ํ๋์ ๋์นญํ๋ ๋จ์ผ ๊ฐ์ค์น ๊ทธ๋ํ๋ก ๊ฒฐํฉํ๋ค.



๋์นญํ๋ ๋ ๋ฐ์ดํฐ ํฌ์ธํธ ๊ฐ ํ๋์ ๊ฐ์ ๋ง ๋จ๋๋ก ์ค์ ํ๋ฉฐ, ๊ฐ์ค์น๋ฅผ 0๊ณผ 1 ์ฌ์ด๋ก ์ ์งํ๋ค.
์ด์ ์ต์ข
๊ทธ๋ํ ๊ตฌ์ฑ์ด ์๋ฃ๋์ผ๋ฏ๋ก, ์ด๊ธฐ ์ ์ฐจ์ ํํ์ ๋ํด ๋์ผํ ํ๋ก์ธ์ค๋ฅผ ๋ฐ๋ณตํ์ฌ ์ ์ฐจ์ ๊ณต๊ฐ์์ ๋๋ค๋ฅธ ๊ฐ์ค์น ์ด์ง ๊ทธ๋ํ๋ฅผ ์ ๊ณตํ๋ค.

๋ค์ ๋จ๊ณ๋ก, ๋ ๊ทธ๋ํ ๊ฐ์ ์ ์ฌ์ฑ์ ํ๊ฐํ๊ธฐ ์ํด ์ธ์ ํ๋ ฌ(adjacency matrix)์ ์ฌ์ฉํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ต์ฐจ ์ํธ๋กํผ(cross-entropy) ์์ค ํจ์๋ฅผ ์ต์ํํ๋ค.

์ต์ ํ๋ ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(SGD)์ ํตํด ์ด๋ฃจ์ด์ง๋ฉฐ, ์ด ๊ณผ์ ์์ ์ ์ฐจ์ ํํ์ด ๋ฐ๋ณต์ ์ผ๋ก ์กฐ์ ๋๋ค.

์ด์ MNIST ๋ฐ์ดํฐ์
์ UMAP์ ์ฌ์ฉํ ์๊ฐํ๋ฅผ ์ดํด๋ณด๋ฉด ํด๋์ค๊ฐ ์ ํด๋ฌ์คํฐ๋์ด ์๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.

UMAP์ ํนํ ์๊ฐํ ํ์ง๊ณผ ์๋ ์ธก๋ฉด์์ ๊ฐ๋ ฅํ๋ค. t-SNE๋ MNIST๋ฅผ ์ฐจ์์ถ์ํ์ฌ ์๊ฐํํ๋ ๋ฐ 40์ด๊ฐ ๊ฑธ๋ ธ์ง๋ง UMAP์ ๋จ 5์ด๊ฐ ๊ฑธ๋ ธ๋ค.
UMAP์ ๋ฐ์ดํฐ ํฌ๊ธฐ์ ๋ฐ๋ผ ๋ฐํ์ ์ฆ๊ฐ์จ์ด t-SNE๋ณด๋ค ํจ์ฌ ๋๋ฆฌ๋ฉฐ, ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์์๋ ํจ์จ์ ์ผ๋ก ์๋ํ๋ ๊ฒ์ ์ ์ ์๋ค.

UMAP์ ๋ ๋ค๋ฅธ ์ฅ์ ์ ์ด๊ธฐ ๊ทธ๋ํ ๊ตฌ์ฑ์์ ์ฃผ์ ํ์ดํผํ๋ผ๋ฏธํฐ์ธ number of nearest neighbors์ด๋ค.
์ด์ ์๊ฐ ์ฆ๊ฐํจ์ ๋ฐ๋ผ ์ด ๋งค๋จธ๋ ๋ชจ์์ projection์ด ์ด๋ป๊ฒ ๋ฐ๋๋์ง ์ดํด๋ณด๋ฉด, ์ฒ์์๋ ํ๋์ ํฐ fuzzy ์
๋ง ์์ง๋ง ํ๋ผ๋ฏธํฐ ๊ฐ์ด ์ปค์ง์๋ก ์ ์ ๋ ๋ง์ ์ธ๋ถ์ ๋ณด๋ฅผ ์ป์ ์ ์๋ค.

์ฃผ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๋ณ๊ฒฝํ์ ๋, UMAP์ t-SNE๋ณด๋ค ๊ฒฐ๊ณผ์ ๋ณํ๋ฅผ ๋ ์์ธกํ๊ธฐ ์ฝ๋ค. ๋ฐ๋ฉด, t-SNE์์ perplexity ๊ฐ์ ์กฐ์ ํ์ ๊ฒฝ์ฐ, ๊ฒฐ๊ณผ๊ฐ ์ค์ ๋ก ๊ฐ์ ๋์๋์ง ํ๋จํ๊ธฐ๊ฐ ์ด๋ ต๋ค. ๋ํ, UMAP์ ๋ฐ์ดํฐ์ ์ ์ญ์ ์ธ ๊ตฌ์กฐ๋ฅผ ๋ณด์กดํ๋ ๋ฐ ๋งค์ฐ ํจ๊ณผ์ ์ด๋ค.