๋ฉํ๋ฐ์ดํฐ(metadata)๋ ๋ฐ์ดํฐ์ ๋ํ ๋ฐ์ดํฐ๋ฅผ ์๋ฏธํ๋ค.
๋ฌธํญ๋ฐ์์ด๋ก (IRT, Item Response Theory)๋ ์ฌ๋ฌ ์ฌ๋๋ค์ด ์ฌ๋ฌ ๋ฌธํญ์ ์๋ตํ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ (1) ์๋ต์์ ๋ฅ๋ ฅ๊ณผ (2) ๊ฐ๋ณ ๋ฌธํญ(๋ฌธ์ )์ ๋์ด๋, ๋ณ๋ณ๋ ฅ, ์ถ์ธก๋๋ฅผ ์ธก์ ํ๋ ๋ถ์ ์ด๋ก ์ด๋ค.
๊ฐ๊ด์ ์ธ ์ฉ์ด ์ ์ ๋ฐ ๋ถ์ผ๋ณ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋ป
ํ๋ก์ ํธ ์๊ฐ์ง๋จ, ๋ฐฉ๋ฒ๋ก ๋ฐ ๋ฐ์ดํฐ ์์ค ๋ฆฌ๋ทฐ,ใ ก ๋์ฆ ๋ฐ๊ตด ๋ฐ ์ ์ ํ๋ก์ธ์ค.
๋ฐ์ดํฐ ์์ง ์ ์ ์คํจ์ฑ์ ๊ณ ๋ฏผํด๋ณด๊ณ ๋์ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐํ ์๊ฐ์ ์์ํ์.
์ฐ๋ง์ ๊ธํ ์ผ๋ค์ ์ฒ๋ฆฌํ๋ค๋ณด๋ ์ด๊ฑธ ์ ์๊ฐ์ ๋ชป ๋๋๋ค. ๊ทธ๋ฌ๋ 80%๋ ํ์ผ๋ฏ๋ก A+์ ์๋์ง๋ง ํต๊ณผ ^^* ์กฐ์ง ๋ด์์ ์๋ก์ด ์๋๋ฅผ ํ๋ ๊ฒ์์ ๊ฐ์ฅ ํฐ ํจ๊ณผ๋ฅผ ์ฃผ๋ ๊ฒ์ ์ค๋์ด๋ค. digital transformation ํน์ data science์ ๊ฒฝ์ฐ์๋ ํด๋น ๋ณํ๋ฅผ ์ ๋ํ๊ธฐ ์ํด์๋ ๋์์๋ ๋ด๋ถ ์ค๋์ ํ์๋ก ํ๊ณ ์๋ค. (๋๋ฌด ๊ณต๊ฐ๋...
DDUX์ ์ ๊ทผ์์ ๋งํ๋ ๋ฐ์ดํฐ๋ ๋ฌด์์ธ๊ฐ?
01. ๊ฒฝํ ๋งฅ๋ฝ ์ค์ฌ ์ ํ ์ธ๋ถํ ์ ํ์ ์๋นํ๊ณ ์ฌ์ฉํ๋ ์๋น์, ์ฌ์ฉ์๋ฅผ ์ค์ฌ์ผ๋ก ํ ๊ฒฝํ ๋งฅ๋ฝ์ ๋ถ์ํ๊ณ ์ดํดํ๋ ค๋ ๋ ธ๋ ฅ์ ํตํด ์ ํ์ ๊ธฐํํ๊ณ ๊ฐ๋ฐํ๋ ค๋ ๊ณผ์ ์์ ์ฌ๋๋ค์ด ์ข์ํ ๋งํ ์ ํธ ์์ฑ๋ค์ ๋์ถํ๋ ค๋ ๋ ธ๋ ฅ๋ค์ด ์์ด์๋ค. ์ ํธ ์์ฑ ๋์ถ -> ์ ํธ
๋์ฆ ์ค์ฌ ๊ณ ๊ฐ ์ธ๋ถํ, ๋ฌธ์ ์ค์ฌ ์ ๊ทผ, ๋์ฆ ์ค์ฌ ๋ฐ์ดํฐ ๊ตฌ์กฐ, ์ฌ๋ก
์ฌ์ฉ์, ์ ํ, ๋ฐ์ดํฐ๋ฅผ DDUX ๊ด์ ์์ ์ฌ์ ์ํ๊ธฐ
WHY : DDUX ์ค์์ฑ ์ดํดํ๊ธฐ๊ฐ๋ ์ดํด, ์ค๋ฌด ํ์ฉ ์ฌ๋ก ๋ฆฌ๋ทฐ, ์ค๋ฌด ํ์ฉ ๊ฐ๋ฅ์ฑ ํ์WHAT : DDUX ์ ๊ทผ ๋ฐฉ์ ์ ์ํ๊ธฐ๋ง์ธ๋์ ์ ๋ฆฝ, DDUX ๊ด์ ์ ์ฌ์ฉ์ ์ ์, DDUX ๊ด์ ์ ์ ํ ์ ์, DDUX ๊ด์ ์ ๋ฐ์ดํฐ ํ์ฉ ๋ฐฉ์ ์ ์HOW : DDUX ์คํ
Contents-based filtering์ ์ฝํ ์ธ ๊ธฐ๋ฐ ํํฐ๋ง ๋ฐฉ์์ผ๋ก, ์ฌ์ฉ์๊ฐ ํน์ ์์ดํ ์ ์ ํธํ๋ ๊ฒฝ์ฐ ๊ทธ ์์ดํ ๊ณผ ๋น์ทํ ์ฝํ ์ธ (content)๋ฅผ ๊ฐ์ง ๋ค๋ฅธ ์์ดํ ์ ์ถ์ฒํด์ฃผ๋ ๊ฒ์ด๋ค.
ํ๊ฐ์งํ์ ๋ํด์ ๋ ๊ณต๋ถํด์ผํ ๋ฏ.
๊ณต์๋ฌธ์(https://scikit-learn.org/stable/modules/classes.html์ฌ์ค ๊ณต์๋ฌธ์๋งํผ ์ ์ค๋ช ๋ ๊ฒ์ด ์ด๋์๊ฒ ๋๋ง ๊ทธ ๋ฐฉ๋ํ ๋ด์ฉ๊ณผ ๋ด๊ฐ ํ๊ณ ์ถ์ ๋ฌธ์ ์ ์ ์ ์ฉํ๊ณ ์ถ์ ๊ฒ์ด ์ฌ๋๋ง์์ธ์ง๋ผ ์ข์ข๋ฐ๋ฆฌ ๋ณต์ต์ ํ๋ ์ค์ด๋ค.
2010๋ ๋ฐํํ ์ ํ๋ธ ์ถ์ฒ ์์คํ
ํต๊ณ : ์ฌ๋, ์ฌ๋ฌผ, ์ฌ๊ฑด, ์ฌํ์ ํ์ ํน์ ์์ฐ ํ์ ๋ฑ์ ์กฐ์ฌํ์ฌ ์์ง๋ ๊ฐ์ข ๋ฐ์ดํฐ์ ์์ฝ. ์ง๋จํ์์ ๋ํ ๊ตฌ์ฒด์ ์ธ ์์ ๊ธฐ์ ์ ๋ฐ์ํ๋ ์ซ์. ํต๊ณํ: ์ฐ์ ์ ๋ฐฉ๋ฒ์ ๊ธฐ์ด๋ก ํ์ฌ ์ฃผ๋ก ๋ค๋์ ๋ฐ์ดํฐ๋ฅผ ๊ด์ฐฐํ๊ณ ์ ๋ฆฌ ๋ฐ ๋ถ์ํ๋ ๋ฐฉ๋ฒ์ ์ฐ๊ตฌํ๋ ์ํ์ ํ