12/19๊ธฐ์กด์๋ ๋ฐ์ดํฐ๋ฅผ ๋๋ ๋ ์์ด์ ๋๋์๋๋ฐ ์๊ณ์ด ๋ฐ์ดํฐ์์๋ ์์ด์ ๋๋์ง ์๊ณ ์์๋ฅผ ๊ณ ๋ คํด์ ๋๋๋ค์์ฐ์ด ํ ์คํธ๋ฅผ ์ํ์ค ์ธ์ฝ๋ฉ ํ๋ ๊ฒ์ฒ๋ผ ์ธ์ด๋ ๋งฅ๋ฝ์ด ์๊ธฐ ๋๋ฌธ์ ์์ผ๋ฉด ์๋ ์๋ฏธ๋ฅผ ์์ด๋ฒ๋ฆด ์ ์๋ค๐ฅ ์๊ณ์ด ๋ฐ์ดํฐ์์๋ ์์๊ฐ ์ค์ex) ์ง๋
12/12์ด๋ฒ์ฃผ ๋ชฉ์์ผ์๋ ๋ณด๊ฐ์ด ์์ต๋๋ค. ๋ค์์ฃผ ์์์ผ์๋ ๋ณด๊ฐ์ด ์์ต๋๋ค.CNN์ ์ฃผ๋ก ์ด๋ฏธ์ง์ ์ฃผ๋ก ์ฌ์ฉ์ด๋๊ณ ๋ฌผ๋ก ํ ์คํธ์๋ ์ฌ์ฉ์ ํฉ๋๋ค. ํ์ง๋ง ์ด๋ฏธ์ง์์ ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.ํ ์คํธ ๋ถ์์ ํ ๋ ๋จธ์ ๋ฌ๋(Bag Of Words, TF-IDF), ๋ฅ
โจDNN๊ณผ CNN์ ๋ํด ์์๋ณด์์~โจ: ์ฌ๋์ ์ ๊ฒฝ๋ง ์๋ฆฌ์ ๊ตฌ์กฐ๋ฅผ ๋ชจ๋ฐฉํ์ฌ ๋ง๋ ๊ธฐ๊ณํ์ต ์๊ณ ๋ฆฌ์ฆ์ด์ ๋ชจ๋ ๋น์ ํ ํจ์๋ฅผ ํ์ต๐ ๋ค์์ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋ฐ๋ ์ ๋ ฅ์ธต(Input) -> model = Sequential()๐ ์ ๋ ฅ์ธต๊ณผ ์ถ๋ ฅ์ธต ์ฌ์ด์ ์กด์ฌํ๋ ์๋์ธต(H
12/5Q. ๋ ์ด์ด ์ธต๋ง ๋ณด๊ณ ํ๊ท ๋ชจ๋ธ์ด๋ผ๋ ๊ฒ์ ์ด๋ป๊ฒ ์ ์ ์์๊น?A. loss์ ์์คํจ์๋ฅผ ์์ฑํ๋ฉด ์ ์ ์๋ค\-> ๋ถ๋ฅ์์๋ activation function์ ์ง์ ํ์ง ์์ผ๋ฉด ์ถ๋ ฅ์ธต์ Dense(1 or 3 ...๋ฑ)๋ก ์ ๋ ฅํ ์ ์์โ ๋ถ๋ฅ ๋ฌธ์ ๋ b
11/28Q. ์ ํ๋๋ก ์ ๋๋ก ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ธก์ ์ ํ๊ธฐ ์ด๋ ค์ด ์ฌ๋ก๋ ์ด๋ค๊ฒ ์์๊น?A. ํฌ๊ท๋ณ ๊ฒ์ฌ๊ฒฐ๊ณผ, ๋ถ๋ํ ๊ฒ์ถ(์๋ถ ์ฌ๋ถ), ์คํธ๋ฉ์ผ ๋ถ๋ฅ, ์ํ ๋์ถ ์ฌ๊ธฐ, ์ ์ฉ์นด๋ ์ฌ๊ธฐ, ์์ฅํ์ง์ข ๋ชฉ ์ฌ๋ถ, ๊ฒ์ ์ด๋ทฐ์ , ๊ด๊ณ ์ด๋ทฐ์ , ๊ทธ์ธ ์ด๋ทฐ์ => ์ด๋ฐ ์ฌ๋ก๋
TP(True Positive) : ์ฐธ๊ธ์ , ๋ณ์ ๊ดํด ์ (๋ณ์ด ์์๊ฒ์ด๋ค.)๋ผ๊ณ ์์ธกํ ํ์๊ฐ ์ค์ ๋ณ์ ๊ฐ์ง ๊ฒฝ์ฐTN(True Negative) : ์ฐธ๋ถ์ , ๋ณ์ ๊ดํด ์๋์ค(๋ณ์ด ์์ ๊ฒ์ด๋ค)๋ผ๊ณ ์์ธกํ ํ์๊ฐ ์ค์ ๋ก ๋ณ์ด ์๋ ๊ฒฝ์ฐFP(False Positiv
ํน์ง๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ๋นํด ๊ฐ๋จํ ์๋ ์๋ฆฌํ์ต ์๋๊ฐ ๋งค์ฐ ๋น ๋ฆ์กฐ์ ํด์ค ํ๋ผ๋ฏธํฐ๊ฐ ์ ๋ค์ด์์น์ ์ํฅ์ ํฌ๊ฒ ๋ฐ์๋ฐ์ดํฐ๊ฐ ์์นํ ๋ณ์๋ก๋ง ์ด๋ค์ก์ ๊ฒฝ์ฐ, ๋ฐ์ดํฐ์ ๊ฒฝํฅ์ฑ์ด ๋๋ ทํ ๊ฒฝ์ฐ ์ฌ์ฉํ๊ธฐ ์ข์์ ํํ๊ท๋ฅผ ๋ณด์ํ ๋ชจ๋ธRidgeLassoElasticNetํน์ง๋ง๋ค์ด์ง ๋ชจ๋ธ์
๐1. ๋ถ๋ฅ์ ํ๊ท ์์ ๋ฐ ๋ค์ค ์ถ๋ ฅ ์์ ์ด ๊ฐ๋ฅํ ๋ค์ฌ๋ค๋ฅํ ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ๋ก ๐2. IF-THEN ๋ฃฐ์ ๊ธฐ๋ฐํด ํด์์ด ์ฉ์ดex) Sunny์ผ ๋ ๋ ธ๋ ๊ฒฝ์ฐ 2, ์ ๋ ธ๋ ๊ฒฝ์ฐ3overcast์ผ ๋ ๋ ธ๋ ๊ฒฝ์ฐ 4, ์๋ ๊ฒฝ์ฐ 0Rainning์ผ๋ ๋๊ฐ์ ๋ ธ๋ ๊ฒฝ์ฐ
๋จธ์ ๋ฌ๋ ๋ชจํ: Loss ํจ์๋ฅผ ์ ์ํ๊ณ ๊ทธ loss ํจ์๋ฅผ ์ต์ ํ ํ๋ ๊ฒLoss: ์ค์ ๊ฐ๊ณผ ์ธก์ ๊ฐ์ด ์ฐจ์ด๋ฅผ ์ด๋ป๊ฒ ์ ์ํ๋๊ฐ ex)MSE\-> KNN & decision tree๋ ์ํ์ ์ธ loss ํจ์๋ ์์ง๋ง majority voting ๋ฑ์ ํตํด loss๋ฅผ ์ต
๐Dataset: ์ ์๋ ๊ตฌ์กฐ๋ก ๋ชจ์์ ธ ์๋ ๋ฐ์ดํฐ ์งํฉ๐Data point(observation): ๋ฐ์ดํฐ ์ธํธ์ ์ํด ์๋ ํ๋์ ๊ด์ธก์น ๐feature(variable, attribute): ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ฑํ๋ ํ๋์ ํน์ฑ(์ซ์ํ, ๋ฒ์ฃผํ, ์๊ฐ, ํ ์คํธ, ์ด
๋จธ์ ๋ฌ๋: ์ธ๊ณต์ง๋ฅ์ ๊ตฌํํ๋ ๋ฐฉ๋ฒ ์ค ํ๋, ์ ์ฉํ ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ํ์ตํ๋ ๊ฒex) ์ ์ง๋จ, ์์จ์ฃผํ์๋์ฐจ๋ฅผ ์ดํํ๋ ๋ฐ ์์ด์ ์์ ๋๋ฅผ ๊ฒ์ฆ๊ณผ๊ฑฐ์ AI: Knowledge Engineering\-> ์ง์์ ์ ์กฐ์งํด์ ์ ์ฉํ ํจ์ ๋ง๋ค๊ธฐ(์ฌ๋์ด ํจ์๋ฅผ ์ง์ ์ฝ
์ ์: ์ฌ๋ฌ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฐ๊ฒฐํ์ฌ ๋ ๊ฐ๋ ฅํ ๋ชจ๋ธ์ ๋ง๋๋ ๊ธฐ๋ฒโ ๊ฐ๋ ฅํ ํ๋์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๋์ ๋ณด๋ค ์ฝํ ๋ชจ๋ธ ์ฌ๋ฌ ๊ฐ๋ฅผ ์กฐํฉํ์ฌ ๋ ์ ํํ ์์ธก์ ๋์์ ์ฃผ๋ ๋ฐฉ์์์๋ธ ํ์ต ์ ํ๐1. votingโข ์ฌ๋ฌ ๊ฐ์ ๋ถ๋ฅ๊ธฐ๊ฐ ํฌํ๋ฅผ ํตํด ์ต์ข ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๊ฒฐ
โ ๋ฒ์ฃผ๊ฐ ์ ์ ๊ฐ์ ํผ์ฒ๋ก ๋ง๋ค์ด์ฃผ๋ฉด ์๊ธฐ๋ ๋ฌธ์ โ ๊ณผ๋์ ํฉโ ๋๋ฌด ํฌ์ํ ๊ฐ์ด๋ผ๋ฉด one-hot-encodingํ ๋ ์ด๋ค ์ ์ฒ๋ฆฌ๋ฅผ ํ ์ ์์๊น?โ ordinal๊ณผ one-ho encoding์ผ๋ก ์ด์ฐํ, '๊ธฐํ' ๋ฑ์ผ๋ก data binning, ๊ฒฐ์ธก์น๋ก ์ฒ๋ฆฌโ
=> ์ง์ ๋ ์กฐํฉ๋ง ๋ณด๊ธฐ ๋๋ฌธ์ ํด๋น ๊ทธ๋ฆฌ๋๋ฅผ ๋ฒ์ด๋๋ ๊ณณ์ ์ข์ ์ฑ๋ฅ์ ๋ด๋ ํ์ดํผํ๋ผ๋ฏธํฐ๊ฐ ์๋ค๋ฉด ์ฐพ์ง ๋ชปํ๋ ๋จ์ ์ด ์์ต๋๋ค.=> ๋๋คํ ๊ฐ์ ๋ฃ๊ณ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ์ต๋๋ค. ์ฒ์์๋ ๋ฒ์๋ฅผ ๋๊ฒ ์ง์ ํ๊ณ ๊ทธ ์ค์ ์ข์ ์ฑ๋ฅ์ ๋ด๋ ๋ฒ์๋ฅผ ์ ์ ์ขํ๊ฐ๋ฉด์ ์ฐพ์ต๋๋ค
โ MAE(ํ๊ท ์ ๋์ค์ฐจ)์ค์ฐจ๊ฐ์ describe ๊ฐ ์ค mean ๊ฐmae = abs(y_train - y_predict).mean()\-> ์์ ๊ฐ์ ์ ํํ ํ๊ธฐ ์ํด ์ค์ฐจ์ ์ ๋๊ฐ์ ์ ์ฉํด์ฃผ์ด์ผ ํจ (abs)โ MAPE(์ค์ ๊ฐ - ์์ธก๊ฐ/ ์ค์ ๊ฐ)์ ์ ๋๊ฐ์ ๋ํ ํ๊ท ์ค
python์ ๋ํํ๋ ๋จธ์ ๋ฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฐ์ดํฐ ๋ถ์์ ์ํ ๊ฐ๋จํ๊ณ ํจ์จ์ ์ธ ๋๊ตฌ์คํ์์ค, ์์ ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅ์ฃผ์ ๊ธฐ๋ฅ 6๊ฐ์ง<์ถ์ฒ: Scikit-learn ๊ณต์ ๋ฌธ์>โญclassification (๋ถ๋ฅ): ๋ฒ์ฃผํ, ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๋๋๋ ๊ฒ ex) ๋ฒ์ฃผํ๋ ๋ฐ