
๐ข ์ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ์ ๋๋ค. ๋ด์ฉ์ ์ ์งํ๋, ์ถ๊ฐ์ ์ผ๋ก ํ์ํ ๋ด์ฉ์ ์ถ๊ฐํ๊ณ ์๊ฐํ ์๋ฃ๋ฅผ ๋ง๋ค์ด ์ฌ๊ตฌ์ฑํ๋ฉฐ ์ ๋ฆฌํ์์ต๋๋ค. ๊ฐ์ธ์ ์ผ๋ก ์ฝ์ผ๋ฉฐ ์ดํด๊ฐ ์ด๋ ค์ ๋ ๋ถ๋ถ์ ๋ชจ๋ ์ ๋ฆฌํด ๋ ๊ธ์ด๊ธฐ์ ๋ชฉ์ ์ ๋ฐ๋ผ ๊ตต์งํ ํ๋ฆ๋ง ์ดํดํ๊ณ ๊ฐ์ ๋ ์ถฉ๋ถํฉ๋๋ค. ๋ ผ์ ๋ฐ ํผ๋๋ฐฑ์ ์ธ์ ๋ ํ์์ ๋๋ค๐
์ง์ ์ถ์ (knowledge tracing)์ ํ์์ด ํ์ต ํ๋์ ์ํํ ๋ ๊ฐ ์ง์ ๊ฐ๋
(KC)์ ๋ํ ํ์์ ์๋ จ๋๋ฅผ ๋ชจ๋ธ๋งํ๋ ๊ณผ์ ์
๋๋ค. ์ด๋ฅผ ํตํด ํ์์ ํ์ต ํ๋ ์ฑ๊ณผ๋ฅผ ์ถ์ ํ๊ณ , ๊ฐ์ธ ๋ง์ถคํ ํ์ต์ ์ ๊ณตํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํฉ๋๋ค.
์ต๊ทผ์๋ DKT์ DKVMN ๊ฐ์ ์ํ ์ ๊ฒฝ๋ง(RNN) ๊ธฐ๋ฐ ๋ชจ๋ธ๋ค์ด ๋ณต์กํ ํ์ต ํจํด์ ํฌ์ฐฉํ๋ ๋ฅ๋ ฅ ๋๋ถ์ ์ ํต์ ์ธ ๋ฐฉ๋ฒ๋ณด๋ค ๋ฐ์ด๋ ์ฑ๊ณผ๋ฅผ ๋ณด์์ต๋๋ค. ํ์ง๋ง DKT(Deep Knowledge Tracing)๋ ํ๋ผ๋ฏธํฐ ํด์ ๊ฐ๋ฅ์ฑ ๋ฌธ์ ๊ฐ ์์์ต๋๋ค. ๋ํ, DKVMN(Dynamic Key-Value Memory Networks for Knowledge Tracing)์ KC ํํ ํ๋ ฌ(ํค)๊ณผ ์ง์ ์ํ ํํ ํ๋ ฌ(๊ฐ)์ ์ ์งํ์ฌ DKT๋ณด๋ค ํด์ ๊ฐ๋ฅ์ฑ์ด ๋์์ก์ผ๋, DKT ๋ชจ๋ธ๊ณผ ๊ฐ์ RNN ๊ธฐ๋ฐ์ด๊ธฐ ๋๋ฌธ์ ํ์๋ค์ด ๋น๊ต์ ์ ์ ์์ KC์ ์ํธ์์ฉํ๋ ํ์ค ๋ฐ์ดํฐ์์ ๋ฐ์ํ๋ ๋ฐ์ดํฐ ํฌ์์ฑ ๋ฌธ์ ๋ฅผ ์ ์ฒ๋ฆฌํ์ง ๋ชปํ๋ ํ๊ณ๊ฐ ์์ต๋๋ค.
์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ํ์์ ๋ฌธ์ ํ์ด ์ด๋ ฅ ์ค ํ์ฌ ํธ๋ ๋ฌธ์ ์ KC์ ๊ด๋ จ ์๋ KC๋ค์ ์๋ณํ๊ณ , ๋น๊ต์ ์ ์ ์์ KC์ ๊ธฐ๋ฐํด ํ์์ ์๋ จ๋๋ฅผ ์์ธกํ๋ ์๊ธฐ ์ง์ค ์ง์ ์ถ์ (Self Attentive Knowledge Tracing, SAKT) ๋ฐฉ๋ฒ์ด ์ ์๋์์ต๋๋ค. SAKT๋ ๋ชจ๋ ๋ฌธ์ ํ์ด ์ด๋ ฅ์ ์ฌ์ฉํ๋ ๋์ , ํด๋น KC์ ๊ด๋ จ๋ ์ฃผ์ ์ด๋ ฅ์ ์ ํํ์ฌ ๋ฐ์ดํฐ ํฌ์์ฑ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํฉ๋๋ค.
SAKT๋ RNN ๋์ self-attention ๋ฉ์ปค๋์ฆ์ ํ์ฉํ๋ ํธ๋์คํฌ๋จธ๋ก ๊ฐ KC ๊ฐ์ ๊ด๋ จ์ฑ์ ํ์
ํ์ฌ ์์ธก ์ ํ๋๋ฅผ ๋์
๋๋ค. ๋ค์ํ ์ค์ ๋ฐ์ดํฐ์
์์ ์คํํ ๊ฒฐ๊ณผ, SAKT๋ ๊ธฐ์กด์ DKT ๋ฐ DKVMN ๋ชจ๋ธ๋ณด๋ค ๋ ๋์ ์ฑ๊ณผ๋ฅผ ๋ณด์์ผ๋ฉฐ, ํ๊ท AUC์์ 4.43%์ ํฅ์์ ๋ฌ์ฑํ๋ค๊ณ ํฉ๋๋ค.
๐ข ๋ณธ ํฌ์คํ ์์ ์ฌ์ฉํ ์ฉ์ด๋ฅผ ์ฝ์ํ๊ณ ๋์ด๊ฐ๊ฒ ์ต๋๋ค.
์ํธ์์ฉ(interaction) = ๋ฌธ์ ํ์ด ์ด๋ ฅ(๋ฌธ์ ๋ฒํธ์ ์ ์ค๋ต ์ฌ๋ถ)
exercise = ๋ฌธ์
๐ข ์ด์ ๋ ผ๋ฌธ์์ ์ ์ํ ๋ฐฉ๋ฒ์ ๊ธด ํธํก์ผ๋ก ์์ธํ ์ดํด๋ณผ ์์ ์ ๋๋ค. ์ ์ํ ๋ฐฉ๋ฒ์ ์์ธํ ๋ค์ฌ๋ค ๋ณด๊ธฐ ์ ์ ์ต๋ํ ์ดํดํ๋ ๋ฐ ๊ฒช๋ ์ด๋ ค์์ ์ค์ด๊ธฐ ์ํ ๋ ๊ฐ์ง ์ฌ์ ์์ ์ ๊ฑฐ์น๊ณ ๊ฐ๊ฒ ์ต๋๋ค. ์ธ๋ถ ๋ด์ฉ์ ๋ค์ฌ๋ค ๋ณผ ๋ ์๋ ๋ ๋ด์ฉ์ ํจ๊ป ๋์๋๊ณ ๊ฐ์ด ๋ณด์๊ธธ ๊ถ์ฅํฉ๋๋ค.
๋จผ์ ๊ธฐํธ ์ ์๋ฅผ ํ๊ฒ ์ต๋๋ค. ๋ฏธ๋ฆฌ ์ธ์งํ์ง ์๊ณ ๋ค์ด๊ฐ๋ฉด ๋ณต์กํ ๋ชจ๋ธ ๊ตฌ์กฐ์ ํท๊ฐ๋ฆฌ๋ ๊ธฐํธ๊น์ง ์ด๋ ต์ต๋๋ค.
| ๊ธฐํธ | ์ค๋ช |
|---|---|
| ํ์์ ์ด ์ | |
| ๋ฌธ์ ์ ์ด ์ | |
| ํ์์ ์ํธ์์ฉ ์ํ์ค: () | |
| ํ์์ i๋ฒ์งธ ๋ฌธ์ -๋ต ์ | |
| ์ํ์ค์ ์ต๋ ๊ธธ์ด | |
| ์ ์ฌ ๋ฒกํฐ ์ฐจ์ ์ | |
| ํ์์ด ํด๊ฒฐํ ๋ฌธ์ ์ ์ํ์ค | |
| ์ํธ์์ฉ ์๋ฒ ๋ฉ ๋งคํธ๋ฆญ์ค | |
| ์์น ์๋ฒ ๋ฉ ๋งคํธ๋ฆญ์ค | |
| ๋ฌธ์ ์กฐํ ๋งคํธ๋ฆญ์ค | |
| ๊ณผ๊ฑฐ ์ํธ์์ฉ ์๋ฒ ๋ฉ | |
| ๋ฌธ์ ์๋ฒ ๋ฉ |
๋ค์์ผ๋ก ๋ณต์กํ ๊ตฌ์กฐ๋ฅผ ๋ฏธ๋ฆฌ ์ ์ฒด ๊ตฌ์กฐ๋๋ฅผ ํ ๋ฒ ๋ณด๊ณ ๋์ด๊ฐ๊ฒ ์ต๋๋ค. ์๋ ์ธ๋ถ ๋ด์ฉ์ ํ์ธํ๋ค๊ฐ ํท๊ฐ๋ฆด ๋๋ ํ ๋ฒ์ฉ ํ์ธํ๋ฉด ํ๋ฆ์ ํ์ธํ๊ธฐ์ ์ข์ต๋๋ค.
SAKT
โโโ Input Layer
โ โโโ Response Sequence y
โ โโโ Transformed Sequence s
โโโ Embedding Layers
โ โโโ Interaction Embedding Layer (M)
โ โโโ Positional Embedding Layer (P)
โ โโโ Exercise Embedding Layer (E)
โโโ Self-Attention Layer
โ โโโ Scaled Dot-Product Attention
โ โโโ Multiple Heads
โ โโโ Residual Connections
โ โโโ Layer Normalization
โโโ Feed Forward Layer
โ โโโ Feed Forward Network
โ โโโ Residual Connections
โ โโโ Layer Normalization
โโโ Output Layer
โโโ Final Output (p_t)
โโโ Loss Calculation (L)
๐ข ์ด์ ๋ ผ๋ฌธ์์ ๊ธฐ์ ํ ์์๋ฅผ ๋ฐ๋ผ๊ฐ๋ฉฐ ์ ์ํ ๋ฐฉ๋ฒ์ ํบ์๋ณด๊ฒ ์ต๋๋ค.
์์ฐจ์ ๋ชจ๋ธ๋ง(sequential modeling)์ ์ด์ ์ ์ผ์ด๋ ์ฌ๊ฑด๋ค์ด ๋ค์์ ์ผ์ด๋ ์ฌ๊ฑด์ ์ํฅ์ ๋ฏธ์น๋ค๋ ๊ฐ์ ์ ๋ฐํ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉ์์
๋๋ค. ์ง์ ์ถ์ ์ ๊ฒฝ์ฐ์๋ ํ์์ด ํผ ๋ฌธ์ ์ ๊ทธ์ ๋ํ ๋ฐ์(์ ๋ต ์ฌ๋ถ)์ด ๋ค์ ๋ฌธ์ ๋ฅผ ๋งํ ๊ฐ๋ฅ์ฑ์ ์์ธกํ๋ ๋ฐ ์ํฅ์ ์ค๋ค๋ ๊ฐ์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๊ฒ์ธ๋ฐ์. ์๋ฅผ ๋ค์ด๋ณด๊ฒ ์ต๋๋ค.
ํ์์ด ๋ค์ ๋ฌธ์ ์ ํ ์ ์์์ง ์์ธกํ๋ ค๋ฉด ํ์์ด ์ง๊ธ๊น์ง ํ์๋ ๋ฌธ์ ๋ค (t๋ฒ ๋ฌธ์ ๊น์ง ํ์๋ ๋ฌธ์ ์ ์ ์ค๋ต ์ฌ๋ถ)๋ก ๋ค์ ๋ฌธ์ ์์ ์ ์ค๋ต ์ฌ๋ถ๋ฅผ ์์ธกํ๋ ๊ฒ์ ๋๋ค.
๋ชจ๋ธ์ ์ ๋ ฅ์ ์ด์ ์ํธ์์ฉ๋ค ์ด ๋๊ณ , ๋ค์ ๋ฌธ์ ๋ค์ ๊ฐ ๋ฉ๋๋ค. ์ฌ๊ธฐ์ ๋ชจ๋ธ์ ๊ฐ ๋ฌธ์ ์ ๋ํ ์ ๋ต ์ฌ๋ถ๋ฅผ ์์ธกํฉ๋๋ค.
์ํธ์์ฉ ๋ ๋ผ๋ ํํ ํ์์ด๊ณ ๋ ๋ฌธ์ ๋ฒํธ, ๋ ์ ๋ต ์ฌ๋ถ์ ๋๋ค. ์ด ์ํธ์์ฉ์ ๋ชจ๋ธ์ ๋ฃ๊ธฐ ์ํด, ๋ก ๋ณํํฉ๋๋ค. ์ฌ๊ธฐ์ ๋ ์ด ๋ฌธ์ ์์ด๊ณ , ๊ฐ ์ ๋ต์ด๋ฉด ํด๋น ๋ฌธ์ ๋ฒํธ์ ๋ฅผ ๋ํด์ฃผ๊ณ , ์ค๋ต์ด๋ฉด ๊ทธ๋๋ก ๋๋ ๊ฒ์ด์ฃ .
์๋ฅผ ๋ค์ด๋ณด๊ฒ ์ต๋๋ค.
๋ฌธ์ ๋ฒํธ et = 5, ์ด ๋ฌธ์ ์ E = 100์ด๋ผ๊ณ ๊ฐ์ # ์ ๋ต์ธ ๊ฒฝ์ฐ yt = et + rt ร E = 5 + 1 ร 100 = 5 + 100 = 105 # ์ค๋ต์ธ ๊ฒฝ์ฐ yt = et + rt ร E = 5 + 0 ร 100 = 5 + 0 = 5
์ด ๋ฐฉ์์ผ๋ก ํ์์ ๊ฐ ์ํธ์์ฉ์ ํ๋์ ์ซ์๋ก ๋ณํํด์ ๋ชจ๋ธ์ด ์ดํดํ ์ ์๋๋ก ๋ง๋ญ๋๋ค.
์ด์ ์๋ฒ ๋ฉ ๋ ์ด์ด๋ฅผ ๊ฑฐ์ณ ์ดํ ์ ๊ณ์ฐ์ ์ํ ์ค๋น๋ฅผ ํด์ฃผ๊ฒ ์ต๋๋ค. ์๋ฒ ๋ฉ ๋ ์ด์ด์ ๋ฃ์ ์ ๋ ฅ๊ฐ์ ์ค๋นํ๋ ๊ณผ์ , ์๋ฒ ๋ฉ ๋ ์ด์ด๋ฅผ ๊ฑฐ์น๋ฉฐ ์ผ์ด๋๋ ์ผ, ์ถ๋ ฅ๊ฐ์ ์์๋๋ก ๋ณด๊ฒ ์ต๋๋ค.
์์์ ๋ชจ๋ธ ์
๋ ฅ ํ์์ ๋ผ๋ ์ํธ์์ฉ ์ํ์ค๋ก ๋ณํํด ์ฃผ์์ต๋๋ค. ๊ฐ ๋ ํ์์ด ์ด๋ค ๋ฌธ์ ๋ฅผ ํ๊ณ ๋งํ๋์ง ํ๋ ธ๋์ง์ ๋ํ ์ ๋ณด๋ฅผ ๋ด๊ณ ์์ต๋๋ค. ์ด์ ์ด ์ํ์ค๋ฅผ ์ด๋ผ๋ ๊ณ ์ ๋ ๊ธธ์ด์ ์ํ์ค๋ก ๋ณํํด์ผ ํฉ๋๋ค. ์ฌ๊ธฐ์ ์ ๋ชจ๋ธ์ด ์ฒ๋ฆฌํ ์ ์๋ ์ต๋ ์ํ์ค ๊ธธ์ด์
๋๋ค.
๋ชจ๋ธ์ด ๊ณ ์ ๋ ๊ธธ์ด์ ์ํ์ค๋ง ์ฒ๋ฆฌํ ์ ์๊ธฐ ๋๋ฌธ์ ์ถ๊ฐ ์์ ์ด ํ์ํฉ๋๋ค.
์ํ์ค ๊ธธ์ด t < ๋ชจ๋ธ์ด ์ฒ๋ฆฌ ๊ฐ๋ฅํ ์ต๋ ์ํ์ค ๊ธธ์ด n์ธ ๊ฒฝ์ฐ, ์ํ์ค ์์ชฝ์ ๋น ๋ฌธ์ -์ ๋ต ์(ํจ๋ฉ)์ ์ถ๊ฐํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ํ์ค ๊ธธ์ด๊ฐ 5์ด๊ณ ๋ชจ๋ธ์ด ์ฒ๋ฆฌํ ์ ์๋ ์ต๋ ๊ธธ์ด n = 10์ด๋ฉด, ์์ 5๊ฐ์ ํจ๋ฉ์ ๋ฃ์ด ์ด ๊ธธ์ด๊ฐ 10์ด ๋๋๋ก ๋ง์ถ์ด ์ค๋๋ค.
์ํ์ค ๊ธธ์ด t > ๋ชจ๋ธ์ด ์ฒ๋ฆฌ ๊ฐ๋ฅํ ์ต๋ ์ํ์ค ๊ธธ์ด n์ ๊ฒฝ์ฐ, ์ฌ๋ฌ ๊ฐ์ ์๋ธ์ํ์ค๋ก ๋๋๋๋ค. ์๋ฅผ ๋ค์ด, ์ํ์ค ๊ธธ์ด๊ฐ 25์ด๊ณ n = 10์ด๋ฉด, ์ํ์ค๋ฅผ 10๊ฐ์ฉ ๋์ด์ 3๊ฐ(10, 10, 5)์ ์๋ธ์ํ์ค๋ก ๋๋๋๋ค. ์ด๋ ๋ง์ง๋ง 5๊ฐ์ ์๋ธ์ํ์ค๋ ์ญ์ ํจ๋ฉ์ ์ถ๊ฐํด์ ๊ธธ์ด๋ฅผ ๋ง์ถฅ๋๋ค. ๋๋ ์ง ๋ชจ๋ ์๋ธ์ํ์ค๋ ๋ชจ๋ธ์ ์
๋ ฅ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค.
๐ข ์๋ฒ ๋ฉ์ ์ ๋ ฅ๊ฐ ์ค๋น๋ฅผ ๋ง์ณค์ต๋๋ค.
์ค๋น๋ ์ ๋ ฅ๊ฐ์ ์๋ฒ ๋ฉ ๋งคํธ๋ฆญ์ค์ ๋ค์ด๊ฐ๋๋ค. ์๋ฒ ๋ฉ์ ์๋ก ๋ค๋ฅธ ๊ฐ์ด ์๋ก ๋ค๋ฅธ ๋งคํธ๋ฆญ์ค์ธ Interaction Embedding M๊ณผ Exercise Embedding(Question Embedding) E๋ฅผ ๊ฑฐ์น๊ฒ ๋ฉ๋๋ค.
์์์ ์ค๋นํ ์ ๋ ฅ๊ฐ ๋ interaction embedding matrix ์ ์ ๋ ฅ๋ฉ๋๋ค. Interaction embedding matrix ์ ์ง๋๋ฉด ๊ฐ (ํจ๋ฉ ์ ์ฉ ๊ฐ์ )์ ์๋ฒ ๋ฉ ๋ฒกํฐ ์ ์ถ๋ ฅ์ผ๋ก ์ป์ต๋๋ค.
์ด๋, ์ ํฌ๊ธฐ ์ ํ๋ ฌ์ธ๋ฐ, ์ฌ๊ธฐ์ ๋ ๋ฌธ์ ์ ๊ฐ์, ๋ ์๋ฒ ๋ฉ ๋ฒกํฐ์ ์ฐจ์ ์์ ๋๋ค. ๋ ๊ฐ ๋ฌธ์ ์ ๋ํด ๋ ๊ฐ์ง ๊ฒฝ์ฐ(์ ๋ต ์ฌ๋ถ: ๋ง์ถค ๋๋ ํ๋ฆผ)๋ฅผ ํํํฉ๋๋ค.
์๋ฒ ๋ฉ ๋งคํธ๋ฆญ์ค ์ ์ง๋๋ฉด์ ์ซ์๋ก ํํ๋ ์ํธ์์ฉ ์ ๋ณด๊ฐ ๋ฒกํฐ๋ก ๋ณํ๋๋ ๊ฒ์ด์ฃ . ์ด ๋ฒกํฐ๋ ๊ฐ ๋ฌธ์ ์ ํ์์ ์ ์ค๋ต ์ฌ๋ถ๋ฅผ ์์ถํด์ ์๋ฏธ ์๋ ์ ๋ณด๋ฅผ ๋ด๊ณ ์์ต๋๋ค.
๋ค๋ฅธ ์๋ฒ ๋ฉ ๋งคํธ๋ฆญ์ค Exercise Embedding Matrix ๋ ๋ฌธ์ ์์ฒด๋ฅผ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค. ๋ ํฌ๊ธฐ ์ ํ๋ ฌ๋ก, interaction embedding matrix M์์์ ๋์ผํ๊ฒ E๋ ๋ฌธ์ ๊ฐ์, d๋ ์๋ฒ ๋ฉ ์ฐจ์ ์์ ๋๋ค. ๊ฐ ๋ฌธ์ ๋ ์ด ํ๋ ฌ์ ํ ํ์ ๋์๋๊ณ , ๊ทธ ํ์ ํตํด ๋ฌธ์ ์ ๋ํ ๋ฒกํฐ ํํ์ ์ป์ ์ ์์ต๋๋ค.
์ด ๋ฒกํฐ๋ ํ์์ด ํ์ฌ ํ๊ณ ์๋ ๋ฌธ์ ์ ๋ํ ์๋ฏธ ์๋ ์ ๋ณด๋ฅผ ๋ด๊ณ ์์ต๋๋ค.
์ ํ ์ดํ ์ ์ ํ์ฉํ๋ ์ฅ์ ์ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์์ต๋๋ค.
- ๊ณผ๊ฑฐ ๋ฌธ์ ํ์ด ์ด๋ ฅ๊ณผ ๋จผ ์์ ์ ๋ฌธ์ ์ ํ์ฌ ๋ฌธ์ ๊ฐ ๊ด๊ณ๋ฅผ ํ์ ํ๋ ๋ฐ ์ ๋ฆฌํจ
- ์ ๋ ฅ ์ํ์ค๋ฅผ ๋ณ๋ ฌ ์ฒ๋ฆฌํด์ ํ์ต ์๋๊ฐ ๋น ๋ฆ
ํ์ง๋ง ์ ํ ์ดํ ์ ์ ๋ฌธ์ ๊ฐ ํ ๊ฐ์ง ์๋๋ฐ์. RNN, LSTM๊ณผ ๊ฐ์ ๋ชจ๋ธ์ ์๊ฐ์ ์์๋ฅผ ๋ช ์์ ์ผ๋ก ์ฒ๋ฆฌํ๋ฉด์ ์ํ๋ฅผ ์ง์์ ์ผ๋ก ์ ๋ฐ์ดํธํ๊ธฐ ๋๋ฌธ์ ์์ ์ ๋ณด๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ์ธ์ํฉ๋๋ค. ๋ฐ๋ฉด, ์ ํ ์ดํ ์ ์ Transformer์ attention mechanism์ ํ์ฉํ๋ฏ๋ก ์ํ์ค๊ฐ ํ ๋ฒ์ ๋ณ๋ ฌ๋ก ์ ๋ ฅ๋์ด ๋จ์ด ์์์ ๋ํ ์ ๋ณด๋ฅผ ๋ด๊ณ ์์ง ์์ต๋๋ค. ๋ฐ๋ผ์ ๋จ์ด ์์น ์ ๋ณด๋ฅผ ์ถ๊ฐํด ์ฃผ๋๋ฐ, ์ด ๊ณผ์ ์ด Position Encoding์ ๋๋ค. ํฌ์ง์ ์ธ์ฝ๋ฉ์ ์์ ์ ๋ณด๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ ์ง์ ์ํ์ ์ ์ง์ ๋ณํ๋ฅผ ํฌ์ฐฉํ๊ณ ์ง์์ ์ธ ์ง์ ์ถ์ ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
๐ค ์ง์ ์ถ์ ์ ๊ด์ ์์ ๋ฌธ์ ํ์ด ์ด๋ ฅ ๋ฒกํฐ๊ฐ ์์ ์ ๋ณด๋ฅผ ๋ด๋ ์ด์ ๋ ๋ฌด์์ผ๊น์?
์ง์ ์ํ๋ ํ์์ด ํน์ ์๊ฐ์ ์ผ๋ง๋ ๋ง์ ์ง์์ ๊ฐ์ง๊ณ ์๋์ง๋ฅผ ๋ํ๋ ๋๋ค. ์ด ์ํ๋ ํ์์ ๋ฌธ์ ํ์ด ๊ฒฝํ์ ๋ฐ๋ผ ์์ํ ์งํํ๋ ๊ฒฝํฅ์ด ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ํ์์ด ๋ง์ ๋ฌธ์ ๋ฅผ ์ฌ๋ฌ ๋ฒ ํ๋ฉด์ ๊ทธ ๊ฐ๋ ์ ์ ์ง์ ์ผ๋ก ์ดํดํ๊ฒ ๋๋ ๊ฒ์ ๋๋ค. ์ด๋ฌํ ์ง์ ์ํ๋ Wavy transitions, ์ฆ ํ์์ ์ง์ ์ํ๊ฐ ๋ถ๊ท์นํ๊ฒ ๋ณํํ๋ฉด ์๋ฉ๋๋ค. ์ด๋ค ๋ฌธ์ ์์ ์ ํ์๋ค๊ฐ ๋ค์ ๋ฌธ์ ์์ ๊ฐ์๊ธฐ ํ๋ฆฌ๋ ์์ผ๋ก ์ง์ ์ํ๊ฐ ์์ฃผ ๋ณ๋ํ๋ฉด ๋ชจ๋ธ์ด ํ์์ ์ค์ ํ์ต ๊ณผ์ ์ ์ ๋๋ก ๋ฐ์ํ์ง ๋ชปํ๊ฒ ๋ฉ๋๋ค. ๋ฐ๋ผ์ ์ง์ ์ถ์ ๋ชจ๋ธ์์๋ ์ด๋ฌํ ๋ถ์์ ํ ๋ณํ๊ฐ ์๋๋ก ํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.
๋ง์ฝ ํ์์ด 1๋ฒ ๋ฌธ์ ์์ ์ฑ๊ณตํ๊ณ 2๋ฒ ๋ฌธ์ ์์ ์คํจํ๋ค๋ฉด, ํฌ์ง์ ์ธ์ฝ๋ฉ์ด ์์ผ๋ฉด ๋ชจ๋ธ์ ๋ ๋ฌธ์ ์ ๊ฒฐ๊ณผ๋ฅผ ๋ ๋ฆฝ์ ์ผ๋ก ๊ณ ๋ คํ ์ ์์ต๋๋ค. ํ์ง๋ง ํฌ์ง์ ์ธ์ฝ๋ฉ์ด ์๋ค๋ฉด, ๋ชจ๋ธ์ ๋ฌธ์ ์ ์์์ ๊ณผ๊ฑฐ์ ์ฑ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ํ์์ ์ง์ ์ํ๊ฐ ์ฌ์ ํ ๊ฐ์ ๋๊ณ ์๋ค๋ ์ ์ ์ดํดํ ์ ์๊ฒ ๋ฉ๋๋ค. ์ด๋ฌํ ์ ๊ทผ์ ํ์์ด ๊ฐ ๋ฌธ์ ๋ฅผ ํตํด ์ด๋ป๊ฒ ๋ฐฐ์๊ฐ๊ณ ์๋์ง๋ฅผ ๋ช ํํ ์ถ์ ํ ์ ์๋๋ก ํ์ฌ, ์ดํ ๋ฌธ์ ํ์ด์์ ์ด๋ค ๊ฐ๋ ์ด ๋ ํ์ํ ์ง๋ฅผ ์์ธกํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํฉ๋๋ค.
์ด๋ฌํ ๋งฅ๋ฝ์์ ํฌ์ง์
์ธ์ฝ๋ฉ์ ์ํธ์์ฉ ์๋ฒ ๋ฉ()์์ ํ์์ ๊ณผ๊ฑฐ ์ํธ์์ฉ์ ์์๋ฅผ ์ธ์ํ๊ธฐ ์ํด ์ ์ฉ๋๋ฉฐ, ์ด๋ ์ง์ ์ํ๋ฅผ ์๊ฐ์ ๋ฐ๋ผ ์ถ์ ํ๋ ๋ฐ ํ์์ ์
๋๋ค. ๋ฐ๋ฉด, ๋ฌธ์ ์๋ฒ ๋ฉ์ ๊ณ ์ ๋ ์ ๋ณด์ด๊ธฐ ๋๋ฌธ์ ํฌ์ง์
์ธ์ฝ๋ฉ์ด ํ์ํ์ง ์์ต๋๋ค.
์ด๋ ๊ฒ ํฌ์ง์
์ธ์ฝ๋ฉ๊น์ง ๋ํด SAKT ๋ชจ๋ธ์ ์๋ฒ ๋ฉ ๋ ์ด์ด์์ ์์ฑ๋๋ ์ต์ข
์ถ๋ ฅ์ ๋ฌธ์ ํ์ด ์ด๋ ฅ ๋ฒกํฐ ๊ณผ ํ์ฌ ๋ฌธ์ ๋ฒกํฐ ์
๋๋ค.

์์์ SAKT๋ ๊ณผ๊ฑฐ์ ๋ชจ๋ ํ๋์ ์ฌ์ฉํ๋ ๋์ , ํด๋น KC์ ๊ด๋ จ๋ ์ค์ํ ํ๋๋ง์ ์ ํํ์ฌ ๋ฐ์ดํฐ ํฌ์์ฑ ๋ฌธ์ ๋ฅผ ๋ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ๋ค๊ณ ํ๋๋ฐ์. ํ์ฌ ํ์์ด ํ๊ณ ์๋ ๋ฌธ์ ์ ์ด์ ๋ฌธ์ ํ์ด ์ด๋ ฅ์ ์ฐ๊ด์ฑ์ ๊ณ์ฐํ๊ธฐ ์ํด Self-attention ๋ ์ด์ด๋ฅผ ๊ฑฐ์ณ ์ฟผ๋ฆฌ ๐, ํค ๐พ, ๊ฐ ๐๋ฅผ ์์ฑํฉ๋๋ค.
์ฟผ๋ฆฌ () : ํ์ฌ ๋ฌธ์ ์ ์ ๋ณด๋ก, ํ์์ด ํธ๋ ๋ฌธ์ ์ ๋ํ ํํ (from exercise embedding)
ํค () : ์ด์ ๋ฌธ์ ๋ค์ ์ ๋ณด๋ฅผ ๋ํ๋ด๋ ํํ (from interaction embedding)
๊ฐ () : ์ด์ ๋ฌธ์ ์ ๊ฒฐ๊ณผ(์: ์ ๋ต ์ฌ๋ถ) (from interaction embedding)
๊ฐ ๋ฒกํฐ(Q, K, V)๋ ๋ค์๊ณผ ๊ฐ์ ์์ ํตํด ๋ณํ๋ฉ๋๋ค.

: ์ํธ์์ฉ์ ์๋ฒ ๋ฉ ๋งคํธ๋ฆญ์ค
: ์ด๋(๋ฌธ์ )์ ์๋ฒ ๋ฉ ๋งคํธ๋ฆญ์ค
: ๊ฐ๊ฐ ์ฟผ๋ฆฌ, ํค, ๊ฐ์ ํฌ์ ๋งคํธ๋ฆญ์ค
ํฌ์๊ณผ ๊ด๋ จํด์๋ ๊ณ ์ ๋ธ๋ก๊ฑฐ ๋ถ์ ํฌ์คํ
์ ์ฒจ๋ถํฉ๋๋ค.
[์ ํ๋์ํ] ํฌ์(projection)๊ณผ ์ต์์์น๋ฒ(least square method)
์ง์ ์ถ์ ์์ ํฌ์ ๋งคํธ๋ฆญ์ค๊ฐ ํ์ฉ๋๋ ์ด์ ๋ฅผ ๊ฐ๋จํ ์ ๋ฆฌํ๋ฉด ๋ฐ์ดํฐ์ ํน์ฑ์ ๋ณํํ๊ณ ๋ค์ํ ๊ณต๊ฐ์ผ๋ก ๋งคํํจ์ผ๋ก์จ ๋ชจ๋ธ์ด ๊ณผ๊ฑฐ ๋ฌธ์ ํ์ด ์ด๋ ฅ๊ณผ ํ์ฌ ๋ฌธ์ ๊ฐ์ ์ฐ๊ด์ฑ์ ํจ๊ณผ์ ์ผ๋ก ๊ณ์ฐํ์ฌ ํ์์ ์ง์ ์ํ๋ฅผ ๋ ์ ์ถ์ ํ ์ ์๊ฒ ํฉ๋๋ค.
์ด๋ ๊ฒ ๋ณํํ ๋ฒกํฐ Q, K, V๋ก ์ด์ ์ํธ์์ฉ๊ณผ ํ์ฌ ๋ฌธ์ ๊ฐ์ ๊ด๋ จ์ฑ์ ๊ณ์ฐํ๊ธฐ ์ํด ์ดํ
์
๊ฐ์ค์น๋ฅผ ์ฌ์ฉํ๋๋ฐ, ์ดํ
์
๊ฐ์ค์น๋ฅผ ์ฐพ๊ธฐ ์ํด scaled dot-product attention์ ์ฌ์ฉํฉ๋๋ค. ์ดํ
์
๋ฉ์ปค๋์ฆ์ ๋ค์๊ณผ ๊ฐ์ ์์์ ์ฌ์ฉํฉ๋๋ค.

๋ ์ฟผ๋ฆฌ์ ํค์ ๋ด์ ์ ๊ณ์ฐํ์ฌ, ์ฟผ๋ฆฌ์ ํค ๊ฐ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํฉ๋๋ค. ๋ก ๋๋๋ ๊ฒ์ ์ค์ผ์ผ๋ง์ ๋๋ค. ์ด๋ ์ฐจ์์ด ์ปค์ง์๋ก ๋ด์ ๊ฐ์ด ์ปค์ง๋ ๊ฒฝํฅ์ด ์์ด, softmax ๊ณ์ฐ์ ์์ ์ฑ์ ๋์ด๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. softmax ํจ์๋ ์ ์ฌ๋๋ฅผ ํ๋ฅ ๋ก ๋ณํํ์ฌ ๊ฐ ์ด์ ์ํธ์์ฉ์ด ํ์ฌ ๋ฌธ์ ์ ์ผ๋ง๋ ์ค์ํ์ง๋ฅผ ๋ํ๋ ๋๋ค.
์๋ ์ฌ์ง์์ ๋ ๊ฐ๊ฐ ๋ฅผ ์ ๋ด์ ์ ๊ณ์ฐํ์ฌ ๋์ถํ ์ดํ ์ ๊ฐ์ค์น์ ๋๋ค.

๋ฉํฐํค๋ ์ดํ
์
์ ์ฌ๋ฌ ๊ฐ์ ์ดํ
์
ํค๋๋ฅผ ์ฌ์ฉํ์ฌ ์๋ก ๋ค๋ฅธ ์๋ธ์คํ์ด์ค์์ ์ ๋ณด๋ฅผ ๋์์ ์ฒ๋ฆฌํ ์ ์๋๋ก ํฉ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ๋ชจ๋ธ์ด ๋ค์ํ ์ ๋ณด์ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ผ ์ ์์ต๋๋ค.

: ์๋ฒ ๋ฉ๋ ์ํธ์์ฉ ์ ๋ ฅ ๋งคํธ๋ฆญ์ค
: ์๋ฒ ๋ฉ๋ ์ฐ์ต ๋ฌธ์ ๋งคํธ๋ฆญ์ค
: ๊ฐ ํค๋์ ๊ฒฐ๊ณผ๋ฅผ ๊ฒฐํฉ(concatenate)ํ๋ ํจ์
: ๊ฐ ์ดํ ์ ํค๋์ ๊ฒฐ๊ณผ๋ก ๊ฐ ํค๋๋ ๋ ๋ฆฝ์ ์ผ๋ก ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํฉ๋๋ค.
: ์ต์ข ์ถ๋ ฅ์ ์ํ ์ ํ ๋ณํ ๋งคํธ๋ฆญ์ค๋ก ์ด ๋งคํธ๋ฆญ์ค๋ ๊ฐ ํค๋์ ๊ฒฐ๊ณผ๋ฅผ ๊ฒฐํฉํ ํ ์ต์ข ์ฐจ์์ ๋ง์ถ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค.
: ์ดํ ์ ํค๋์ ์
๊ฐ ํค๋์ ๊ณ์ฐ ๋ฐฉ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.

๋ชจ๋ธ์ (๐ก+1)๋ฒ์งธ ๋ฌธ์ ์ ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ ๋, ๐ก๊ฐ์ ์ํธ์์ฉ๋ง ๊ณ ๋ คํด์ผ ํฉ๋๋ค. ์ฆ, ํ์ฌ ๋ฌธ์ ๋ฅผ ์์ธกํ ๋ ๋ฏธ๋์ ์ํธ์์ฉ(์: ๐>๐)์ ์ ๋ณด๋ฅผ ์ฌ์ฉํ๋ฉด ์ ๋ฉ๋๋ค. ์ด๋ฅผ ์ํด causality layer๋ฅผ ์ฌ์ฉํ์ฌ ๋ฏธ๋์ ํค์ ๋ํ ๊ฐ์ค์น๋ฅผ ๋ง์คํนํฉ๋๋ค. ์ด ๋ง์คํน์ ๋ชจ๋ธ์ด ๊ณผ๊ฑฐ ์ํธ์์ฉ๋ง ๊ณ ๋ คํ๊ฒ ํ์ฌ ์ ํํ ์์ธก์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
์์์ ์ค๋ช
ํ ์์ฒด attention ๋ ์ด์ด๋ ์ด์ ์ํธ์์ฉ์ ๊ฐ์ค์น ํฉ์ธ ๋ฅผ ์์ฑํฉ๋๋ค. ๊ทธ๋ฌ๋ ๋ฉํฐํค๋ ๋ ์ด์ด์์ ์ป์ ํ๋ ฌ์ ํ์ธ Multihead()๋ ์ฌ์ ํ ์ด์ ์ํธ์์ฉ์ ๊ฐ์ธ ์ ์ ํ ์กฐํฉ์
๋๋ค. ์ ํ ๋ณํ๋ง์ผ๋ก๋ ๋ณต์กํ ๋ฐ์ดํฐ ํจํด์ ์ ๋ชจ๋ธ๋งํ๊ธฐ ์ด๋ ต์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๋ ๊ฐ์ ์ ํ ํจ์ ๋ ๋ ๋ณ์ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ง์ ์ผ๋ก ์ ํํฉ๋๋ค. ํ์ง๋ง ๋ง์ ์ค์ ๋ฐ์ดํฐ๋ ๋น์ ํ์ ๊ด๊ณ๋ฅผ ๊ฐ์ง๋๋ค. ๋ฐ๋ผ์ ๋ชจ๋ธ์ ํ์ฑํ ํจ์(์: ReLU)๋ฅผ ํตํด ๋น์ ํ์ฑ์ ๋์
ํ์ฌ ๋น์ ํ์ฑ์ ํตํฉํ๊ณ ์๋ก ๋ค๋ฅธ ์ ์ฌ ์ฐจ์ ๊ฐ์ ๋ค์ํ ์ํธ์์ฉ์ ๊ณ ๋ คํ์ฌ ๋ชจ๋ธ ํํ๋ ฅ ํฅ์์ ์ํด ํผ๋ ํฌ์๋ ๋คํธ์ํฌ๋ฅผ ์ฌ์ฉํฉ๋๋ค.

: ๋น์ ํ ํ์ฑํ ํจ์๋ก, ์ถ๋ ฅ์ด 0๋ณด๋ค ์์ผ๋ฉด 0์ผ๋ก ์ค์ ํ๊ณ , 0๋ณด๋ค ํฌ๋ฉด ๊ทธ๋๋ก ์ถ๋ ฅ
: ํ์ต๋๋ ํ๋ผ๋ฏธํฐ ๋งคํธ๋ฆญ์ค๋ก, ๊ฐ๊ฐ ๐ร๐ ์ฐจ์
: ํ์ต๋๋ ํธํฅ ๋ฒกํฐ๋ก, ๊ฐ๊ฐ ๐ ์ฐจ์
์์ฐจ ์ฐ๊ฒฐ์ ๋ฎ์ ๋ ์ด์ด์ ํผ์ฒ๋ฅผ ๋์ ๋ ์ด์ด๋ก ์ ํํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. ์ด๋ ๋ฎ์ ๋ ์ด์ด์ ์ ๋ณด๊ฐ ์์ธก์ ์ค์ํ ๊ฒฝ์ฐ, ์ด๋ฅผ ๋ง์ง๋ง ๋ ์ด์ด๋ก ์ฝ๊ฒ ์ ๋ฌํ ์ ์๊ฒ ํด์ค๋๋ค.
ํ์์ด ํน์ ๊ฐ๋ ์ ์ํ๋ ๋ฌธ์ ๋ฅผ ํธ๋ ๊ฒฝ์ฐ, ์์ฐจ ์ฐ๊ฒฐ์ด ์ต๊ทผ์ ํด๊ฒฐ๋ ๋ฌธ์ ์ ์๋ฒ ๋ฉ์ ๋ง์ง๋ง ๋ ์ด์ด๋ก ์ ํํ์ฌ ๋ฎ์ ๋ ์ด์ด์ ์ ๋ณด๋ฅผ ๋ชจ๋ธ์ด ํ์ฉํ๊ธฐ ์ฝ๊ฒ ๋ง๋ญ๋๋ค.
์์ฐจ ์ฐ๊ฒฐ์ self-attention ๋ ์ด์ด์ ํผ๋ํฌ์๋ ๋ ์ด์ด ๊ฐ๊ฐ์ ๋ค์ ์ ์ฉ๋ฉ๋๋ค.
๋ ์ด์ด ์ ๊ทํ๋ ์ ๋ ฅ์ ์ ๊ทํํ์ฌ ์ ๊ฒฝ๋ง์ ์์ ์ฑ๊ณผ ํ์ต ์๋๋ฅผ ํฅ์์ํค๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์ ๋ ฅ์ ์ ๊ทํํ๋ฉด ๊ฐ ๋ ์ด์ด์ ์ถ๋ ฅ์ ์์ ํํ๊ณ , ํ์ต ๊ณผ์ ์์ ๋ ๋น ๋ฅด๊ฒ ์๋ ดํ๊ฒ ํ ์ ์์ต๋๋ค.
๋ ์ด์ด ์ ๊ทํ์ self-attention ๋ ์ด์ด์ ํผ๋ํฌ์๋ ๋ ์ด์ด ๊ฐ๊ฐ์ ๋ค์ ์ ์ฉ๋ฉ๋๋ค.
๋ง์ง๋ง์ผ๋ก ์์์ ์ป์ ํ๋ ฌ ์ ๊ฐ ํ์ Fully Connected Network๋ฅผ ํต๊ณผ์ํจ ํ ์ด์ง ๋ถ๋ฅ(์ ๋ต/์ค๋ต)์ ์์ธกํ๊ธฐ ์ํด ์ต์ข
์ ์ผ๋ก 0 ๊ณผ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก ์ถ๋ ฅํ๋ ์๊ทธ๋ชจ์ด๋ ํ์ฑํ ํจ์์ ํต๊ณผ์์ผ ํ์์ ์ ์ค๋ต์ ์์ธกํฉ๋๋ค.

: ์ค์นผ๋ผ์ด๋ฉฐ ํ์์ด ์ด๋ ์ ๋ํ ์ฌ๋ฐ๋ฅธ ์๋ต์ ์ ๊ณตํ ํ๋ฅ
: ์ ์ ๋ฒ์งธ ํ
ํ๋ จ์ ๋ชฉํ๋ ๋ชจ๋ธ ํ์์ ๊ด์ฐฐ๋ ํ์ ์๋ต์ ์์ ๋ก๊ทธ ๊ฐ๋ฅ๋๋ฅผ ์ต์ํํ๋ ๊ฒ์
๋๋ค. ํ๋ผ๋ฏธํฐ๋ ์ ์ฌ์ด์ ํฌ๋ก์ค ์ํธ๋กํผ ์์ค์ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ํ์ต๋ฉ๋๋ค.

: ์๊ฐ ๐ก์์ ํ์์ ์ค์ ์๋ต(์ ๋ต์ผ ๊ฒฝ์ฐ 1, ํ๋ฆด ๊ฒฝ์ฐ 0)
: ๋ชจ๋ธ์ด ์์ธกํ ์ ๋ต ํ๋ฅ

์ฑ๋ฅ ๋น๊ต๋ฅผ ์ํด AUC(Area Under Curve) ์งํ๋ฅผ ์ฌ์ฉํ๊ณ , ์ต์ ์ง์ ์ถ์ (KT) ๋ฐฉ๋ฒ์ธ DKT, DKT+, ๊ทธ๋ฆฌ๊ณ DKVMN๊ณผ ๋น๊ตํ์ต๋๋ค.
๋ชจ๋ธ ํ์ต ์ ์ ์ฒด ๋ฐ์ดํฐ์ ์ค 80%๋ฅผ ํ์ต์ ์ฌ์ฉํ๊ณ ๋๋จธ์ง 20%๋ฅผ ํ ์คํธ์ ์ฌ์ฉํ์ต๋๋ค. ๋ชจ๋ ๋ฐฉ๋ฒ์ ๋ํด ์จ๊ฒจ์ง ์ํ์ ์ฐจ์ ๐๋ {50, 100, 150, 200}์ ์๋ํ์ต๋๋ค. SAKT(Successive Attention Knowledge Tracing)๋ TensorFlow๋ก ๊ตฌํ๋์์ผ๋ฉฐ, ADAM ์ตํฐ๋ง์ด์ ๋ฅผ ์ฌ์ฉํด ํ์ต๋ฅ 0.001๋ก ํ์ตํ์ต๋๋ค.
ASSISTChall ๋ฐ์ดํฐ์ ์ ๋ฐฐ์น ํฌ๊ธฐ 256, ๋๋จธ์ง ๋ฐ์ดํฐ์ ์ 128์ ์ฌ์ฉํ์ต๋๋ค. ์ํธ์์ฉ์ด ๋ง์ ๋ฐ์ดํฐ์ (ASSISTChall, ASSIST2015)์์๋ ๋๋กญ์์ ๋น์จ์ 0.2๋ก ์ค์ ํ๊ณ , ๋ค๋ฅธ ๋ฐ์ดํฐ์ ์์๋ 0.2๋ฅผ ์ ์งํ์ต๋๋ค. ์ํ์ค์ ์ต๋ ๊ธธ์ด ๐์ ํ์๋น ํ๊ท ๋ฌธ์ ํ๊ทธ ์์ ๋น๋กํ์ฌ ์ค์ ํ์ต๋๋ค. ASSISTChall๊ณผ STATICS ๋ฐ์ดํฐ์ ์ ๐=500, ASSIST2009๋ ๐=100๊ณผ 50, ์ธ๊ณต ๋ฐ ASSIST2015 ๋ฐ์ดํฐ์ ์ ๐=50์ผ๋ก ์ค์ ํ์ต๋๋ค.
SAKT ๋ชจ๋ธ์ ๋ค์ํ ๋ฐ์ดํฐ์
์์ ์ฑ๋ฅ์ด ํฅ์๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ๋ฉฐ, ํนํ ์ดํ
์
๋ฉ์ปค๋์ฆ์ด ํจ๊ณผ์ ์ผ๋ก ์๋ํ์ฌ ํฌ์ํ ๋ฐ์ดํฐ์
์์๋ ๊ฐํ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ฐํํฉ๋๋ค. Synthetic ๋ฐ์ดํฐ์
์์๋ ๋์ ์๊ด๊ด๊ณ๋ฅผ ํตํด ๊ฐ๋
๊ฐ์ ๊ด๊ณ๋ฅผ ์ ์ดํดํ๊ณ , ๋ค๋ฅธ ๋ฐ์ดํฐ์
์์๋ ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ์ ์งํ๊ณ ์์ต๋๋ค.

๊ณผ๊ฑฐ ์ํธ์์ฉ์์์ ๊ฐ ๋ฌธ์ (ํค ์ญํ )์ ํ์์ด ๋ค์์ ํ ๋ฌธ์ (์ฟผ๋ฆฌ ์ญํ ) ๊ฐ์ ์ดํ ์ ๊ฐ์ค์น๋ฅผ ์๊ฐํํจ์ผ๋ก์จ, ํ์์ ํ์ฌ ๋ฌธ์ ํด๊ฒฐ์ ์ํฅ์ ๋ฏธ์น๋ ๊ณผ๊ฑฐ ๋ฌธ์ ๋ค์ ํ์ ํ ์ ์์ต๋๋ค. ์ด๋ฅผ ํตํด ํน์ ๋ฌธ์ ์(e1, e2) ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ๋ถ์ํ๊ณ , ๊ฐ ์ฟผ๋ฆฌ์ ๋ํ ๊ฐ์ค์น์ ํฉ์ด 1์ด ๋๋๋ก ์ ๊ทํํ์ฌ ๊ด๋ จ์ฑ ํ๋ ฌ(relevance matrix)์ ๋ง๋ญ๋๋ค. ์ด ํ๋ ฌ์ ๊ฐ ์์ (e1, e2)๋ e2๊ฐ e1์ ๋ฏธ์น๋ ์ํฅ์ ๋ํ๋ ๋๋ค.

Synthetic ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ๋ถ์์ ์ํํฉ๋๋ค. ์ด ๋ฐ์ดํฐ์ ์ ์จ๊ฒจ์ง ๊ฐ๋ (hidden concepts)์ด ์๋ ค์ ธ ์๊ธฐ ๋๋ฌธ์ ์๋ก ๋ค๋ฅธ ๋ฌธ์ ๊ฐ์ ๊ด๋ จ์ฑ์ ๋ํ ์ง์ค ๊ฐ(ground truth)์ ์ ์ ์์ต๋๋ค. ๋ชจ๋ ์ํ์ค๋ 1์์ 50๊น์ง์ ๋ชจ๋ ๋ฌธ์ ํ๊ทธ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
์ ์ฌ๋ ํ๋ ฌ์ ์ฌ์ฉํ์ฌ ๋ฌธ์ ํ๊ทธ ๊ฐ์ ์ํฅ ๊ทธ๋ํ๋ฅผ ๊ตฌ์ถํฉ๋๋ค. ๊ฐ ์จ๊ฒจ์ง ๊ฐ๋ ์ ํด๋นํ๋ ์ฒซ ๋ฒ์งธ ๋ฌธ์ ๋ฅผ ์ํ์ค์์ ์ถ์ถํ๊ณ , ๊ฐ ํ์ ๋ฐฉ๋ฌธํ์ฌ ํด๋น ํ์ ์ฐ๊ฒฐ๋ ๋ฌธ์ ์ ๋ ๋ฒ์งธ ๋ฌธ์ ๋ฅผ ์ฐ๊ฒฐํฉ๋๋ค. ์ด ์ฐ๊ฒฐ์ ์ดํ ์ ๊ฐ์ค์น์ ๋น๋กํ์ฌ ์ ๋ ฌ๋ฉ๋๋ค. ์ด ๊ณผ์ ์ ํตํด ๋ฌธ์ ํ๊ทธ๊ฐ ์จ๊ฒจ์ง ๊ฐ๋ ์ ๋ฐ๋ผ ์๋ฒฝํ๊ฒ ๊ตฐ์งํ(clustering)๋ฉ๋๋ค.
ํฅ๋ฏธ๋ก์ด ์ ์ ์ํ์ค์์ ๋ฉ๋ฆฌ ๋จ์ด์ ธ ์์ง๋ง ๋์ผํ ๊ฐ๋ ์ ์ํ๋ ๋ ๊ฐ์ง ์ด๋์ SAKT๋ก ์๋ณํ ์ ์๋ค๋ ๊ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์ฟผ๋ฆฌ ๋ฌธ์ 22๋ ์ํ์ค์์ ๋ฉ๋ฆฌ ๋จ์ด์ ธ ์๋ ๋ฌธ์ 5์ ๊ฐ์ฅ ๋ง์ ๊ฐ์ค์น๋ฅผ ํ ๋นํฉ๋๋ค. ์ด๋ ๋ ๋ฌธ์ ๊ฐ์ ์๊ด๊ด๊ณ๊ฐ ๋ฉ๋ฆฌ ๋จ์ด์ ธ ์์์๋ ๋ถ๊ตฌํ๊ณ ํ์ธ๋ ์ ์์์ ๋ณด์ฌ์ค๋๋ค. ์๋ก ๊ด๋ จ ์๋ ๋ ๋ฌธ์ ๋ ๋์ ์ดํ ์ ๊ฐ์ค์น๋ฅผ ๊ฐ์ง๋ฉฐ, ํ๋์ ๋ฌธ์ ์ ๋ํ ์ฑ๊ณผ๋ ๋ค๋ฅธ ๋ฌธ์ ์ ์ฑ๊ณผ์ ์ํฅ์ ๋ฏธ์น ์ ์์ต๋๋ค.

๋ ผ๋ฌธ์์ ablation study๋ ํน์ ๋ชจ๋ธ์ด๋ ์์คํ ์ ์ฑ๋ฅ์ ์ํฅ์ ๋ฏธ์น๋ ๋ค์ํ ๊ตฌ์ฑ ์์๋ ๊ธฐ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํ ์คํ์ ์ ๊ทผ๋ฒ์ ๋๋ค. ์ด ์ฐ๊ตฌ ๋ฐฉ๋ฒ์ ๋ชจ๋ธ์ ๊ฐ ๋ถ๋ถ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๊ฑฐ(๋๋ "ํ๋ฝ")ํ์ฌ ๊ทธ ๋ถ๋ถ์ด ์ ์ฒด ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ๋ถ์ํฉ๋๋ค.
ํ 4๋ d=200์ผ ๋ ๋ชจ๋ ๋ฐ์ดํฐ ์ธํธ์์ ๊ธฐ๋ณธ SAKT ์ํคํ
์ฒ์ ๋ชจ๋ ๋ณํ์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.

๋ค์์ ๋ชจ๋ธ์ ์ฌ๋ฌ ๋ณํ ๊ฒฐ๊ณผ๋ฅผ ์ ๋ฆฌํ ํ์ ๊ฒฐ๊ณผ์ ๋๋ค.
| ์์ ๋ด์ฉ | ํจ๊ณผ | ๊ด์ฐฐ ๊ฒฐ๊ณผ |
|---|---|---|
| ์์น ์ธ์ฝ๋ฉ ์์ (No Positional Encoding, PE) | ์์น ์ธ์ฝ๋ฉ์ ์ ๊ฑฐํจ. ํน์ ์ด๋์ ๋ํ ํ์์ ์ฑ๊ณผ๋ฅผ ์์ธกํ๋ ๋ฐ ์ฌ์ฉ๋๋ ์ดํ ์ ๊ฐ์ค์น๋ ์ํธ์์ฉ ์๋ฒ ๋ฉ์๋ง ์์กดํ๊ณ , ์ํ์ค์์์ ์์น๋ ๋ฌด์๋จ. | ํฌ์ ๋ฐ์ดํฐ ์ธํธ(ASSIST2009, ASSIST2015)์์๋ ๊ทธ ์ํฅ์ด ๋ ๋๋ ทํ๊ฒ ๋ํ๋ฌ๊ณ , ๋ฐ์ง ๋ฐ์ดํฐ ์ธํธ(ASSISTChall, STATICS)์์๋ ๋ ๋๋๋ฌ์ง. |
| ์์ฐจ ์ฐ๊ฒฐ ์์ (No Residual Connection, RC) | ์์ฐจ ์ฐ๊ฒฐ์ ์ ๊ฑฐํจ. ์์ฐจ ์ฐ๊ฒฐ์ ์ ์์ค ํน์ง(์ํธ์์ฉ ์๋ฒ ๋ฉ)์ ์ ์งํ๋ ๋ฐ ๋์์ ์ค. | ASSIST2015์์๋ ์์ฐจ ์ฐ๊ฒฐ ์์ด ์ฑ๋ฅ์ด ํฅ์๋์์ผ๋ฉฐ, ์ด๋ ๋ณต์ก์ฑ์ด ๋ฎ์ ์ํคํ ์ฒ์์์ ์ ํ๋ ์ด์ ์ ๋ํ๋. |
| ๋๋กญ์์ ์์ (No Dropout) | ๋๋กญ์์ ์ ๊ทํ๋ฅผ ์ ๊ฑฐํจ. ๋๋กญ์์์ ๊ณผ์ ํฉ์ ๋ฐฉ์งํ๋ ๋ฐ ๋์์ ์ฃผ๋ฉฐ, ํนํ ํ๋ จ ๋ ์ฝ๋ ์๊ฐ ์ ์ ๋ชจ๋ธ์์ ํจ๊ณผ์ ์. | ๋ฐ์ดํฐ ์๊ฐ ์ ์ ๋ฐ์ดํฐ ์ธํธ(ASSIST2009 ๋ฐ STATICS)์์ ๊ณผ์ ํฉ ๊ฐ๋ฅ์ฑ์ด ๋์ ๋๋กญ์์์ ์ญํ ์ด ๋ ์ค์ํจ. |
| ๋จ์ผ ํค๋ (Single Head) | ๊ธฐ๋ณธ ์ํคํ ์ฒ์์ ์ฌ์ฉ๋๋ ๋ค์ฏ ๊ฐ์ ํค๋ ๋์ ๋จ์ผ ํค๋๋ง ์ฌ์ฉํจ. ์ฌ๋ฌ ํค๋๋ ์๋ก ๋ค๋ฅธ ํ์ ๊ณต๊ฐ์์ ์ดํ ์ ๊ฐ์ค์น๋ฅผ ์บก์ฒํ์ฌ ๋ชจ๋ธ์ ํํ๋ ฅ์ ํฅ์์ํด. | ๋ชจ๋ ๋ฐ์ดํฐ ์ธํธ์์ ๋จ์ผ ํค๋๋ฅผ ์ฌ์ฉํ ๋ ์ฑ๋ฅ์ด ์ผ๊ด๋๊ฒ ์ ํ๋จ. |
| ๋ธ๋ก ์์ (No Block) | ์ ํ ์ดํ ์ ๋ธ๋ก์ ์ ๊ฑฐํจ. ๋ค์ ์ด๋์ ์์ธก์ด ๋ง์ง๋ง ์ํธ์์ฉ์๋ง ์์กดํ๊ฒ ๋จ. | ์ดํ ์ ๋ธ๋ก์ด ์์ผ๋ฉด ์ฑ๋ฅ์ด ํฌ๊ฒ ๋จ์ด์ ธ, ๊ทธ ์ค์์ฑ์ ๊ฐ์กฐํจ. |
| 2๊ฐ ๋ธ๋ก (2 Blocks) | ์ ํ ์ดํ ์ ๋ธ๋ก์ ์๋ฅผ ๋ ๊ฐ๋ก ์ฆ๊ฐ์ํด. ๋งค๊ฐ๋ณ์ ์ฆ๊ฐ, ํ์ง๋ง ๋ฐ๋์ ๋ ๋์ ์ฑ๋ฅ์ผ๋ก ์ด์ด์ง์ง ์์. | ๋ณต์ก์ฑ์ ์ถ๊ฐํด๋ ์ฑ๋ฅ์ด ๊ฐ์ ๋์ง ์์, ๋ชจ๋ธ์ด ์ด๋ฏธ ํ์ํ ์ํธ์์ฉ์ ํจ๊ณผ์ ์ผ๋ก ์บก์ฒํ๊ณ ์์์ ๋ํ๋. |

๊ทธ๋ฆผ 4๋ ํ๋ จ ๋จ๊ณ์์ GPU์ ์คํ ์๊ฐ์ ๋ฐ๋ฅธ ๋ค์ํ ๋ฐฉ๋ฒ์ ํจ์จ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
NVIDIA Titan V ์ ํ์ ๋จ์ผ GPU์์ ์คํ์ ์ํ
๊ณ์ฐ ํจ์จ์ฑ์ ๋น๊ตํ๋ฉด SAKT๋ ํ ์ํฌํฌ์์ 1.4์ด๋ง ์๋นํ๋๋ฐ, ์ด๋ DKT+(65์ด/์ํฌํฌ)๊ฐ ์๋นํ ์๊ฐ๋ณด๋ค 46.42์ด ์ ๊ณ , DKT(45์ด/์ํฌํฌ)๋ณด๋ค 32๋ฐฐ, DKVMN(26์ด/์ํฌํฌ)๋ณด๋ค 17.33๋ฐฐ ์ ์ต๋๋ค.

SAKT๋ self-attention ๋งค์ปค๋์ฆ์ ํ์ฉํ๋ ํธ๋์คํฌ๋จธ๋ฅผ ํ์ฉํฉ๋๋ค. ํต์ฌ์ ํ์์ ๋ฌธ์ ํ์ด ์ด๋ ฅ์ ๋ฐํ์ผ๋ก ํ์ฌ ํ๊ณ ์๋ ๋ฌธํญ๊ณผ์ ์ฐ๊ด์ฑ์ ๊ณ ๋ คํ์ฌ ์ง์ ์ถ์ ์ ํจ์ผ๋ก์จ ๋ฐ์ดํฐ ํฌ์์ฑ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ค๋ ์ ์ด์๋๋ฐ์.
DKVMN(Dynamic Key-Value Memory Networks for Knowledge Tracing) ํฌ์คํ ์์๋ ์ธ๊ธํ๋ ์ ์ง์ฝํฌ๋น ์๋ํ ํฌ ์ฐ๊ตฌ์์์๋ DKVMN ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋ฉํ์์๋ก ํ์ํ ์ง์๊ฐ๋ ์ถ์ถ์ ํ๊ณ SAKT ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๊ฐ๋ณ ๋ฌธํญ์ ๋ํ ์ ๋ต ํ๋ฅ ์ ์์ธกํ๋ ์ง์ ์ถ์ ๋ชจ๋ธ์ ๊ตฌ์ถํ์๋ค๊ณ ํฉ๋๋ค. ๊ฐ ๋ชจ๋ธ์ ํน์ง์ ๊ณ ๋ คํ์ ๋ ์ง์ ์ถ์ ํจ๊ณผ๋ฅผ ๋์ด๊ธฐ ์ข์ ์์ด๋์ด๋ผ๋ ์๊ฐ์ด ๋ค์๋๋ฐ์. ์์ธํ ๊ตฌ์ถ ๋ฐฉ๋ฒ๊ณผ ํ์ฉ ํํฉ์ ํ์ธํด ๋ณด๊ณ ์ถ๊ธฐ๋ ํ์ต๋๋ค.
๊ฐ์ธ์ ์ผ๋ก ํ์ฌ๊น์ง ๋ฆฌ๋ทฐํ ๋ ผ๋ฌธ ์ค SAKT ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ์ ๊ฐ์ฅ ๋ง์ ์๊ฐ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค. ํ์ง๋ง ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ์งํํ ์๋ก ๋ ผ๋ฌธ ์ฝ๋ ๋ฐฉ๋ฒ, ์ ์ ๋ฆฌํ๋ ๋ฐฉ๋ฒ ๋ฑ์ด ์ตํ์ง๊ณ ์์ด ํ์คํ ์ฑ์ฅํ๊ณ ์๋ค๋ ์๊ฐ์ด ๋ญ๋๋ค. ๋ฐํ ์์๋๋ก KT ๋ ผ๋ฌธ์ ๋ฆฌ๋ทฐํ๊ณ ์๋๋ฐ์. KT๋ฟ ์๋๋ผ AI ๋ถ์ผ ์์ฒด๊ฐ ์๋ ๋นจ๋ฆฌ ๋ฐ์ ํ๋ ๋งํผ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ ๋น ๋ฅด๊ฒ ์ ๋ฐ์ดํธ ๋๊ณ ์์ด์ ๊ฐ ๊ธธ์ด ๋ฉ๋ค๋ ์๊ฐ์ด ๋ค๊ธฐ๋ ํ์ง๋ง ๊ธฐ๋ฐ์ ์ ๋ค์ง๋ ๊ฒ์ด ์ค์ํ๋ค๋ ๋ฏฟ์์ ๊ฐ์ง๊ณ ์๋ ๋งํผ ์ฐจ๊ทผ์ฐจ๊ทผํ ๋ด๊ณต์ ์์๊ฐ๊ณ ์์ต๋๋ค.
ํ์ฌ๋ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ์ค์ฌ์ผ๋ก ์คํฐ๋ ์ค์ธ๋ฐ์. ์ด์ ๊ทธ์น์ง ์๊ณ ์ฝ๋ ๊ตฌํ ๋ฐ ์ธ์ฌ์ดํธ๋ฅผ ๋ฐํ์ผ๋ก ๋ฐ์ดํฐ์ ์ ํฉํ ๋ฐฉ๋ฒ๋ก ์ ์ฐพ์ ์ ์ฉํ๋ ์ญ๋์ ํค์ ๋๊ฐ๊ณ ์ ํฉ๋๋ค.
์ดํด๊ฐ ์ ๋๋๋ก ๋ด์ฉ๊ณผ ์๊ฐํ ์๋ฃ๋ฅผ ์ ๋ฆฌํด ์ฃผ์
จ์ต๋๋ค.
uoahvu(๋์ฐ) ๋ SAKT ํฌ์คํ
๋ํ ๋ณธ ๊ธ์ ์ฝ์ผ์๋ฉด์ Transformer์ ๋ํด ์ ๋๋ก ํ์ตํ๊ธฐ๋ฅผ ํฌ๋งํ์๋ ๋ถ๋ค์ ์ํด ์ ์์ฑ๋ ๋ธ๋ก๊ทธ ์๋ฃ ์ถ์ฒ ๋๋ฆฝ๋๋ค.
Tigris ๋ Transformer ์๋ฆฌ์ฆ
์ฝ๋ฉ ์คํ๋ผ ๋ Attention ์๋ฆฌ์ฆ