๋ณธ ๋ ผ๋ฌธ์ Collaborative filtering(CF)์ ์ํ AutoRec ์ ์๊ฐํ๋ค. AutoRec์ compactํ๋ฉฐ ํจ์จ์ ์ผ๋ก ๊ธฐ์กด์ state-of-the-art CF๊ธฐ์ ๋ค(biased matrix factorization, RBM-CF, LLORMA)์ ๋ฅ๊ฐํ ์ ์๋ ๋ชจ๋ธ์ด๋ค.
ํ์
ํํฐ๋ง ๋ชจ๋ธ์ ๊ฐ์ธ์ ๋ฐ๋ฅธ ์ถ์ฒ์ ์ ๊ณตํ๊ธฐ ์ํด ์ํ์ ๋ฐ๋ฅธ ์ฌ์ฉ์์ ์ ํธ๋ ์ ๋๋ฅผ ์ด์ฉํ๋ค. ๋ณธ ๋
ผ๋ฌธ์์๋ AutoRec์ ์ ์ํ๋๋ฐ, ์ด๋ autoencoder
์ ๊ธฐ๋ฐ์ ๋ ์๋ก์ด CF ๋ชจ๋ธ์ด๋ค. ์ด๋ ๊ธฐ์กด์ ์กด์ฌํ๋ CF์ ๋ํ ์ ๊ฒฝ๋ง ๋ณด๋ค ํํ๋ ฅ๊ณผ ๊ณ์ฐ์ฑ์ ์์ด ์ฅ์ ์ ๋ณด์ธ๋ค. ๋ํ ๊ธฐ์กด์ state-of-the-art CF๊ธฐ์ ๋ค ๋ฅ๊ฐํจ์ ์
์ฆํ๋ค.
Autoencoder๋?
์ ๋ ฅ์ด ๋ค์ด์์ ๋, ํด๋น ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ต๋ํ compression ์ํจ ํ, ๋ค์ ๋ณธ๋์ ์ ๋ ฅ ํํ๋ก ๋ณต์ ์ํค๋ ์ ๊ฒฝ๋ง ์ด๋ค. ์ด๋ ๋ฐ์ดํฐ๋ฅผ ์์ถํ๋ ๋ถ๋ถ์ **Encoder**๋ผ๊ณ ํ๊ณ , ๋ณต์ํ๋ ๋ถ๋ถ์ **Decoder**๋ผ๊ณ ํ๋ค. - ์์ถ ๊ณผ์ ์์ ์ถ์ถํ ์๋ฏธ ์๋ ๋ฐ์ดํฐ๋ฅผ latent vector๋ผ๊ณ ๋ถ๋ฅธ๋ค.
Ex) Auto Encoder๋ Input X๊ฐ์ ์ถ์์ํจ ๋ค, ๋ค์ ์ฌํํด๋ด๋ ๊ธฐ๋ฅ์ ๊ฐ์ง๊ณ ์๋ค. ์์ ๊ฐ์ด 7์ด๋ผ๋ ์ซ์๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฃ์ด์ ๋ค์ 7์ด๋ผ๋ ์ซ์๋ฅผ ์ฌํ ์ํฌ ์ ์๋ค.
( ๐ ์ถ์ฒ : https://pebpung.github.io/autoencoder/2021/09/11/Auto-Encoder-1.html )
rating ๊ธฐ๋ฐ์ ํ์ ํํฐ๋ง์์๋ m users, n items๋ฅผ ๊ฐ์ง๋ฉฐ, user-item rating ํ๋ ฌ ์ ์ฌ์ฉํ๋ค.
User
๊ฐ๊ฐ์ vector๋ ๋ค์๊ณผ ๊ฐ์ด ํ๊ธฐ ํ๋ค.
Item
๊ฐ๊ฐ์ vector๋ ๋ค์๊ณผ ๊ฐ์ด ํ๊ธฐ ํ๋ค.
๋ณธ ๋ ผ๋ฌธ์ ๋ชฉ์ ์ input๊ฐ์ผ๋ก ๋ฃ์ ๋ฅผ ์ ์ฐจ์(low demensional laten (hidden))์ผ๋ก ํฌ์์์ผฐ๋ค๊ฐ ๋ก ๋ค์ reconstructํ๋ item-based(user-based) autoencoder ๋์์ธ ํ๋ ๊ฒ์ด๋ค.(output space๋ missing ratings์ ์์ธกํ๋ค.)
โถ๏ธ ๊ธฐ๋ณธ์ ์ธ Loss function
S : set of vaectors in
- : reconstruction of input
- : active function
์ค์ํ ์ ์ ๊ด์ธก๋ ๋ฐ์ดํฐ์ ํ๋ผ๋ฏธํฐ๋ง ํ์ตํ๋ค๋ ์ , ์ ๊ทธ๋ฆผ์์ ํ์ ๋
ธ๋๊ฐ ๊ด์ธก๋ ๋ฐ์ดํฐ๋ฅผ ๋ปํ๊ณ ์ค์ ์ด ์ญ์ ํ๋ฅผ ํตํด ์
๋ฐ์ดํธ๋ฅผ ์งํํ๋ค.
๋ํ ์ ๊ทํ term์ ์ถ๊ฐํจ์ผ๋ก์จ ๊ด์ฐฐ๋ ratings์ ๋ํ ์ค๋ฒํผํ
์ ๋ฐฉ์งํ ์ ์๋ค.
โถ๏ธ ์ต์ข
Loss function
๐๐ป term์ ์ค์ง ๊ด์ฐฐ๋ ratings๋ง์ ๊ณ ๋ คํ๊ฒ ๋ค๋ ์๋ฏธ์ด๋ค.
โถ๏ธ parameters
ํ์ต์ด ์งํ๋๋ ํ๋ผ๋ฏธํฐ์๋ ์ด๋ค.
โถ๏ธ ์ต์ข
์์ธก๋ rating
1)
RBM-CF๋ ์ ํ๋ ๋ณผ์ธ ๋จธ์ ์ ๊ธฐ๋ฐ์ผ๋กํ ํ๋ฅ ์ ์ธ ๋ชจ๋ธ
์ด๋ค.
AutoRec๋ autoencoder์ ๊ธฐ๋ฐ์ผ๋ก ํ discriminative model
์ด๋ค.
2)
RBM-CF๋ log likelihood๋ฅผ ์ต๋ํ
ํ๋ ์ต์ ์ ํ๋ผ๋ฏธํฐ๊ฐ์ ์ถ์ ํ๋ค.
AutoRec๋ RMSE๋ฅผ ์ต์ํ
ํ๋ค.
3)
RBM-CF๋ ์์ ์ ์ธ ์๋ ด์ ํ์๋กํ๋ค.
AutoRec๋ ๋ ๋น ๋ฅธ gradient-based ์ญ์ ํ ์ํ์ ํ์๋ก ํ๋ค.
4)
RBM-CF๋ ์ค์ง discrete rating์๋ง ์ ์ฉํ ์ ์๋ค.
AutoRec๋ r์ ๊ตฌ์ ๋ฐ์ง ์๊ธฐ ๋๋ฌธ์ ๋ ์ ์ ํ๋ผ๋ฏธํฐ์๋ฅผ ํ์๋ก ํ๋ค.
๐๐ป ๋ ์ ์ ํ๋ผ๋ฏธํฐ์๋ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ ๊ฒ ์ฌ์ฉํ๊ณ ์ค๋ฒํผํ
์ ๋ฐฉ์งํ ์ ์๋ค.
MF์ ๊ฒฝ์ฐ user์ item์ ๋์์
latent space๋ก ๋งคํํ์ง๋ง, item-based AutoRec model์ ๊ฒฝ์ฐ ์ค์ง items๋ง
์ latent space๋ก ๋งคํํ๋ค.
๋ํ MF์ ๊ฒฝ์ฐ linear latent
ํํ๋ก๋ง ํ์ตํ์ง๋ง, item-based AutoRec model์ ๊ฒฝ์ฐ ํ์ฑํ ํจ์๋ฅผ ์ด์ฉํ์ฌ non-linear latent
ํํ๋ก ํ์ต ํ ์ ์๋ค.
RBM๊ณผ AutoRec์์ ๋ชจ๋ item-based ๋ฐฉ๋ฒ์ด ๋ ์ข๊ฒ ๋์ด์ ๋ณผ ์ ์์๋ค.
ํ์ฑํ ํจ์ ๋ฅผ ์ฌ์ฉํ AutoRec์ ์ฑ๋ฅ์ด ๋ ์ข๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
hidden unit์ ์๊ฐ ์ฆ๊ฐํจ์ ๋ฐ๋ผ ์ฑ๋ฅ์ด ์ข์์ง๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
๐๐ป ์ฐธ๊ณ ํด๋ณด๊ธฐ!
https://github.com/supkoon/AutoRec-tf