โ ๋ ผ๋ฆฌํ๊ท๋ ?
๋จธ์ ๋ฌ๋์์, ์ ๋ ฅ๊ฐ๊ณผ ๋ฒ์ฃผ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ๊ตฌํ๋ ๊ฒ
๐งฉ ์ ์ฉ ์์ (์ด์ง๋ ผ๋ฆฌ)
๐ ๋ํ๊ต ์ํ ์ ๋ ๊ณต๋ถํ ์๊ฐ์ ๊ฐ์ง๊ณ ํด๋น ๊ณผ๋ชฉ์ ์ด์ ์ฌ๋ถ(Pass or fail)๋ฅผ ์์ธกํ๋ ๋ฌธ์
input๊ฐ: ๊ณต๋ถํ ์๊ฐ
output๊ฐ: ์ด์์ฌ๋ถ(Pass or Fail)
์ด ๋ฌธ์ ๋ฅผ ๋ง์ฝ ์ ํํ๊ท๋ฅผ ์ฌ์ฉํ๋ฉด ์ฐ์ค๊ฝ์ค๋ฌ์ด ๊ทธ๋ํ๊ฐ ๋ํ๋๋ค. ๋ฐ๋ผ์ ์ด๋ฐ๊ฒฝ์ฐ ์ด์ง ๋
ผ๋ฆฌ ํ๊ท๋ก ํด๊ฒฐํ ์ ์๋ค. ๋ฐ๋ก Sigmoid function์ ์ฌ์ฉํ์ฌ ์๋์ ๊ฐ์ ๊ทธ๋ํ๋ฅผ ๋ง๋ค ์ ์๋ค.
์ค์ง์ ์ธ ๊ณ์ฐ์ ์ ํํ๊ท์ ๋๊ฐ์ง๋ง, ์ถ๋ ฅ์ Sigmoidํจ์๋ฅผ ๋ถ์ฌ 0์์ 1์ฌ์ด์ ๊ฐ์ ๊ฐ์ง๊ฒ ๋๋ค.
์์ ๊ทธ๋ํ์ ๊ฐ์ด ์์ธกํ ๋ผ๋ฒจ์ด 0์ผ ๊ฒฝ์ฐ ํ๋ฅ ์ด 1์ด ๋๋๋ก ํด์ผํ๊ณ , ์์ธกํ ๋ผ๋ฒจ์ด 1์ผ ๊ฒฝ์ฐ ํ๋ฅ ์ด 0์ด ๋๋๋ก ๋ง๋ค์ด์ผ ํ๊ณ , ๋ฐ๋๋ก ์ ๋ต ๋ผ๋ฒจ y๊ฐ 1์ผ ๊ฒฝ์ฐ์๋, ์์ธกํ ๋ผ๋ฒจ 1์ผ ๋ ํ๋ฅ ์ด 1์ด ๋๋๋ก ๋ง๋ค์ด์ผ ํ๋ค.
์ด๋ ๊ฒ ๊ฐ๋ก์ถ์ ํด๋์ค๋ก ํ์ํ๊ณ ์ธ๋ก์ถ์ ํ๋ฅ ๋ก ํ์ํ ๊ทธ๋ํ๋ฅผ 'ํ๋ฅ ๋ถํฌ๊ทธ๋ํ'๋ผ๊ณ ํ๋ค. ์ด ๊ทธ๋ํ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ ๋๋ Crossentropy ๋ผ๋ ํจ์๋ฅผ ์ด์ฉํ๋ค.
์ ๋ ฅ๊ฐ์ ํ๋ฅ ๋ถํฌ๊ฐ ํ๋์๊ทธ๋ํ์ฒ๋ผ ๋์์๋, crossentropy๋ ํ๋์๊ทธ๋ํ๋ฅผ ๋นจ๊ฐ์ ๊ทธ๋ํ์ฒ๋ผ ๋ง๋ค์ด์ฃผ๋ ํจ์์ด๋ค.
๐ก Keras์์ ์ด์ง ๋ ผ๋ฆฌ ํ๊ท์ ๊ฒฝ์ฐ binary_crossentropy ์์ค ํจ์๋ฅผ ์ฌ์ฉํ๋ค.
๐งฉ ์ ์ฉ ์์ (๋คํญ๋ ผ๋ฆฌ)
๐ ๋ํ๊ต ์ํ ์ ๋ ๊ณต๋ถํ ์๊ฐ์ ๊ฐ์ง๊ณ ํด๋น ๊ณผ๋ชฉ์ ์ฑ์ (A, B, C, D, F)์ ์์ธกํ๋ ๋ฌธ์
input๊ฐ: ๊ณต๋ถํ ์๊ฐ
output๊ฐ: ๊ณผ๋ชฉ์ ์ฑ์ (A,B,C,D,F)
์ ๋ฌธ์ ๋ฅผ ๋ ผ๋ฆฌํ๊ท๋ก ํ๋ ค๋ฉด 5๊ฐ์ ํด๋์ค๋ก ๋๋ ์ ์๋ค.
โ One-hot encoding๋ ?
๋คํญ ๋ถ๋ฅ๋ฌธ์ ๋ฅผ ํ ๋ ์ถ๋ ฅ๊ฐ์ ํํ๋ฅผ ๊ฐ์ฅ ์์๊ฒ ํํํ ์ ์๋ ๋ฐฉ๋ฒ์ผ๋ก ์ฌ๋ฌ๊ฐ์ ํญ์ 0๊ณผ 1๋ก๋ง ํํํ ์ ์๋ค.
โ Softmaxํจ์๋ ?
์ ํ ๋ชจ๋ธ์์ ๋์จ ๊ฒฐ๊ณผ๋ฅผ ๋ชจ๋๊ฐ ๋ํ๋ฉด 1์ด ๋๋๋ก ๋ง๋ค์ด์ฃผ๋ ํจ์๋ก ์์ธก์ ๊ฒฐ๊ณผ๋ฅผ ํ๋ฅ ๋ก ํํํ๊ธฐ ์ํจ์ด๋ค.
๐ก Keras์์ ๋คํญ ๋ ผ๋ฆฌ ํ๊ท์ ๊ฒฝ์ฐ categorical_crossentropy ์์ค ํจ์๋ฅผ ์ฌ์ฉํ๋ค.
โ ์ ์ฒ๋ฆฌ(Preprocessing)๋ ?
๋์ ๋ฒ์์ ๋ฐ์ดํฐ ์ ์ ์์ ์ผ๋ก ํ์์๋ ๋ฐ์ดํฐ๋ฅผ ์ง์ฐ๊ณ ํ์ํ ๋ฐ์ดํฐ๋ง์ ์ทจํ๋ ๊ฒ,null ๊ฐ์ด ์๋ ํ์ ์ญ์ ํ๋ ๊ฒ, ์ ๊ทํ(Normalization), ํ์คํ(Standardization) ๋ฑ์ ๋ง์ ์์ ๋ค์ ํฌํจํ๊ณ ์๋ค.
๋ํ์ ์ธ ์ ์ฒ๋ฆฌ ์์ ์ผ๋ก๋ '์ ๊ทํ'์ 'ํ์คํ'๊ฐ ์๋ค.
๐งฉ ์ ์ฉ ์์
๐ ๋ถ๋์ฐ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ ๋, ์๋์ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋์ด ์์๊ฒฝ์ฐ
* ์ง์ ๋์ด (๋จ์: ํ)
* ์ค๊ณต ์ฐ๋ (๋จ์: ๋
)
* ์ธต ์ (๋จ์: ์ธต)
* ๊ฐ์ฅ ๊ฐ๊น์ด ์งํ์ฒ ์ญ๊ณผ์ ๊ฑฐ๋ฆฌ (๋จ์: km)
์ฌ๊ธฐ์ ๊ฐ๊ฐ์ ํน์ฑ๋ค์ด ๋จ์๊ฐ ๋ค ๋ค๋ฅด๊ณ , ๊ฐ์ ๋ฒ์๋ ์ฐจ์ด๊ฐ ํด ์ ์๊ธฐ๋๋ฌธ์ ์ง์ ์ ์ผ๋ก ๋น๊ต๊ฐ ๋ถ๊ฐ๋ฅํ๋ค. ๋ฐ๋ผ์ ์ ๊ทํ ๋๋ ํ์คํํ ํ์๊ฐ ์๋ค.
์ ๊ทํ
์ ๊ทํ๋ ๋ฐ์ดํฐ๋ฅผ 0๊ณผ 1์ฌ์ด์ ๋ฒ์๋ฅผ ๊ฐ์ง๋๋ก ๋ง๋ ๋ค.
๐ ๋ถ๋์ฐ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ ๋, ์๋์ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋์ด ์์๊ฒฝ์ฐ
* ์ค์ ์ ์: 50์ /100์ ๋ง์ 50์ /500์ ๋ง์
* ์ ๊ทํ์ ์: 0.5 0.1
์ด๋ ๊ฒ ์ ๊ทํ๋ฅผ ํ๋ฉด ๊ฐ์ 50์ ์ด๋ผ๋ ๊น๋ํ๊ฒ ๊ตฌ๋ถํ ์ ์๋ค.
๐ ์์ธํ ์ด์งํ๊ท์ฝ๋๋ colab ์ ๊ฒ์ํ์ต๋๋ค.
๐ ์์ธํ ๋คํญํ๊ท์ฝ๋๋ colab ์ ๊ฒ์ํ์ต๋๋ค
๊ฐ์๋ฅผ ๊ณ์ ๋ค์ผ๋ฉฐ ์ค์ตํ๋ค๋ณด๋๊น ์ฝ๋๋ฅผ ์ ์ด๋ด๋ ค๊ฐ๋ ๊ฒ์ด ์ ์ ์ต์ํด์ง๋ค.
์ํ์ ์ผ๋ก ์ดํด๋ฅผ ํ๋ ค๊ณ ํ๊ธฐ๋ณด๋ค๋ ๊ฐ๋
์ ์์๊ฐ๋ ค๊ณ ๋
ธ๋ ฅํ๋๊น ์ฝ๋๋ฅผ ์์ฑํ ๋ ์์ํด์ง๋๋์ด๋ค. ์ฃผ๋ง๋์ ์ผ๋จ ๊ฐ์๋ฅผ 1,2๊ฐ ๋ ๋ณต์ตํด์ ํ์คํ๊ฒ ์ดํดํ๊ณ ๋์ด๊ฐ์ผ ๋์ค์ ์ ์ ์ฌํ๋ ๋ถ๋ถ์ ๋ฐฐ์ธ๋๋ ์ดํด๋ฅผ ์ ํ ์์์๊ฒ ๊ฐ๋ค.