ํด๋น ๊ธ์ FastCampus - '[skill-up] ์ฒ์๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ ์ ์น์ ๊ฐ์๋ฅผ ๋ฃ๊ณ ,
์ถ๊ฐ ํ์ตํ ๋ด์ฉ์ ๋ง๋ถ์ฌ ์์ฑํ์์ต๋๋ค.
1. ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ด๋?
- ์
๋ ฅ x๊ฐ ์ฃผ์ด์ก์ ๋ ์ถ๋ ฅ y๋ฅผ ๋ฐํํ๋ ํจ์ f(x)
ํ๋ผ๋ฏธํฐ(๐, theta)๋?
- ๋ชจ๋ธ์ ๋์ ๋ฐฉ์์ ๊ฒฐ์ ํ๋ ์์
- ์: x๊ฐ ์
๋ ฅ๋์์ ๋ ์ด๋ค y๋ฅผ ์ถ๋ ฅํ ์ง๋ฅผ ๊ฒฐ์ ํ๋ ์์
ํ์ต์ด๋?
- (x, y) ํํ์ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก, x โ y๋ก ๊ฐ๋ ๊ด๊ณ๋ฅผ ์ฐพ์๋ด๋ ๊ณผ์
- ์ฆ, ์ต์ ์ ํ๋ผ๋ฏธํฐ ๐๋ฅผ ํ์ตํจ
๋ชจ๋ธ์ด๋?
- ๋์ ์๋ฏธ๋ก๋ ์๊ณ ๋ฆฌ์ฆ ์ ์ฒด
- ์ข์ ์๋ฏธ๋ก๋ ํ์ต๋ ํ๋ผ๋ฏธํฐ ์งํฉ์ ์๋ฏธ
2. ์ข์ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ด๋?
์ผ๋ฐํ(Generalization)๋ฅผ ์ํ๋ ๋ชจ๋ธ
์ผ๋ฐํ๋?
- ํ๋ จ ๋ฐ์ดํฐ์๋ง ์ ์๋ํ๋ ๊ฒ์ด ์๋๋ผ,
๋ณด์ง ๋ชปํ ๋ฐ์ดํฐ(unseen data) ์ ๋ํด์๋ ์ฌ๋ฐ๋ฅธ ์์ธก(Prediction)์ ํ๋ ๋ฅ๋ ฅ
์ ์ผ๋ฐํ๊ฐ ์ค์ํ๊ฐ?
- ์ฐ๋ฆฌ๊ฐ ๋ชจ๋ ๊ฒฝ์ฐ์ ์์ ๋ํด ๋ฐ์ดํฐ๋ฅผ ์์งํ ์๋ ์์
- ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ๋ค ์์งํ๊ณ ์์ผ๋ฉด ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ด ํ์ ์์ด ๋จ์ํ rule-based ํจ์๋ง ํ์ํ ๊ฒ
- ๋ฐ๋ผ์, ์๋ก์ด ์ํฉ(์ด์ ์ ์๋ ๋ฐ์ดํฐ)์์๋ ์ ์ ํ ํ๋จ์ ๋ด๋ฆฌ๋ ๋ชจ๋ธ์ด ์ค์
3. ๊ธฐ์กด ๋จธ์ ๋ฌ๋์ ํ๊ณ
- ๊ธฐ์กด ๋ชจ๋ธ๋ค์ ์ ํ ๋๋ ๋ฎ์ ์ฐจ์์ ๋ฐ์ดํฐ๋ฅผ ์ฃผ๋ก ๋ค๋ฃธ
- ๋น์ ํ ๋ฌธ์ ์ ๋ํด Kernel Trick ๋ฑ์ ์ฌ์ฉํ์ง๋ง ํ๊ณ๊ฐ ๋ช
ํ
Kernel Trick: ๋ฐ์ดํฐ๋ฅผ ๊ณ ์ฐจ์์ผ๋ก ๋งคํํ์ฌ ๋ณต์กํ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ๋จ์ํํ๋ ๋ฐ ์ฌ์ฉ
- ์ด๋ฏธ์ง, ํ
์คํธ, ์์ฑ ๋ฑ ๊ณ ์ฐจ์(high-dimensional) ๋ฐ์ดํฐ์์๋ ์ฑ๋ฅ ์ ํ๊ฐ ํผ
4. ๋ฅ๋ฌ๋์ด๋?
- Deep Neural Networks (DNN)์ ํ์ต์์ผ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ธฐ์
- ์ธ๊ณต์ ๊ฒฝ๋ง(Artificial Neural Networks)์ ํ์ฅ๋ ๊ฐ๋
- ๋ด๋ฐ(Neuron)๋ค๋ก ๊ตฌ์ฑ๋ ์ ๊ฒฝ๋ง์ด ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ํจ์ ์ญํ ์ ํจ
- ๊ฐ ๋ด๋ฐ์ด ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ์๋ฆฌ๋ฅผ ์ ํํ๊ฒ ์ ์๋ ์์
- ๊ธฐ์กด๋ณด๋ค ๊น์ ์ ๊ฒฝ๋ง ๊ตฌ์กฐ๋ฅผ ๊ฐ๋ ๊ฒ์ด ํน์ง
- ๋น์ ํ ํจ์ ๊ธฐ๋ฐ โ ๊ธฐ์กด ๋จธ์ ๋ฌ๋๋ณด๋ค ์ฐ์ํ ํจํด ์ธ์ ๋ฅ๋ ฅ
- ์ด๋ฏธ์ง, ํ
์คํธ, ์์ฑ ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๋น์ฝ์ ์ธ ์ฑ๋ฅ ํฅ์
- hand-crafted feature ์์ด๋ ํ์ต ๊ฐ๋ฅ
โ raw ๋ฐ์ดํฐ๋ฅผ ์
๋ ฅํ๋ฉด ์๋์ผ๋ก ํน์ง(feature)์ ํ์ต
5. ๋ฅ๋ฌ๋์ด ๊ฐ๋ฅํด์ง ์ด์
- ๊ณผ๊ฑฐ์๋ ํ์ต์ด ์ด๋ ค์ ๋ ๊น์ ์ ๊ฒฝ๋ง์ ํ์ต์ํฌ ์ ์๊ฒ ๋จ
- ์ธํฐ๋ท์ ๋ฐ๋ฌ๋ก ๋น
๋ฐ์ดํฐ ํ์ฉ์ด ๊ฐ๋ฅํด์ง
- GPU ๊ธฐ๋ฐ ๋ณ๋ ฌ ์ฐ์ฐ์ ๋์คํ โ ํ์ต/์ถ๋ก ์๋ ํฅ์
6. ๋ฅ๋ฌ๋์ ์ญ์ฌ ๋ฐ ํจ๋ฌ๋ค์ ๋ณํ
๐น 1980๋
๋
- ์ญ์ ํ(Back-propagation) ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ โ ๋ฅ๋ฌ๋์ ์ฒซ ์ ์ฑ๊ธฐ

๐น 2000๋
๋
- ๋ฅ๋ฌ๋ ์ฐ๊ตฌ ์ง์ (์ฃผ๋ชฉ์ ๋ํจ)
- ์ฃผ์ ๋ชจ๋ธ: Restricted Boltzmann Machine (RBM), Deep Belief Networks (DBN), Stacked Denoising Autoencoder
๐น 2010๋
๋ ์ด
- ImageNet ์ฐ์น, ์์ฑ ์ธ์์ ์์ฉํ

๐น 2015๋
- ๊ธฐ๊ณ ๋ฒ์ญ(Machine Translation) ์์ฉํ โ E2E(End To End)๋ก ๊ฐ์ฅ ๋จผ์ ์ ๋ณต๋จ

๐น 2017๋
- ์ํ๊ณ (AlphaGo) โ ๋ฐ๋์์ ์ธ๊ฐ ์ต๊ณ ์๋ฅผ ์ด๊น
๐น 2018๋
- GAN(Generative Adversarial Network)์ ํตํ ์ด๋ฏธ์ง ํฉ์ฑ์ ๋ฐ์

๊ธฐ์กด vs ์๋ก์ด ํจ๋ฌ๋ค์
| ๊ตฌ๋ถ | ๊ธฐ์กด ํจ๋ฌ๋ค์ | ์๋ก์ด ํจ๋ฌ๋ค์ |
|---|
| ํน์ง ์ถ์ถ ๋ฐฉ์ | hand-crafted feature ์ฌ์ฉ | raw ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋๋ก ์
๋ ฅ |
| ์ฒ๋ฆฌ ๊ตฌ์กฐ | ์ฌ๋ฌ sub-module ์กฐํฉ | ๋จ์ผ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ end-to-end ํ์ต (ํ๋์ ํ
์คํฌ์ ํ๋์ ๋ชจ๋ธ) |
| ์์ | ์์ฑ์ธ์, ๊ธฐ๊ณ๋ฒ์ญ ๋ฑ | ์ต์ ์์ฐ์ด ์ฒ๋ฆฌ ๋ฐ ์ปดํจํฐ ๋น์ ๋ชจ๋ธ ๋ฑ |
- ํ๋์ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ด ์ฅ์ ์ด ๋ ์๋ ์์ง๋ง, ์ ์ ๋๋์ง, ํด์์ด ๊ต์ฅํ ์ด๋ ค์์ง ์ ์์
- ๊ทธ๋์ DL์ ๋ธ๋๋ฐ์ค๋ค~!
โ ์ฅ์ ์ด์ ๋จ์ ์. ์ฌ๋์ด ์ค์ ํ ๊ฐ์ ์ด ํ๋ฆด ์๋ ์๊ธฐ ๋๋ฌธ์
7. ์ด๋ฆฐ ๋ฌธํ์ ํธ๋ ๋ ๋ณํ
- ์คํ์์ค ๊ธฐ๋ฐ ์ํ๊ณ ํ์ฑํ ex) GitHub(์ฝ๋), arXiv.org(๋
ผ๋ฌธ)
- ๋น ๋ฅธ ์ฝ๋, ๋
ผ๋ฌธ ๊ณต์ โ ์ฐ๊ตฌ ํธ๋ ๋๊ฐ ๋งค์ฐ ๋น ๋ฅด๊ฒ ๋ณํ
- ๋จ์ : ์ฌ์ฉ์์ ์ฐ๊ตฌ์์ ๋ถ๋ด ์ฆ๊ฐ
(์ต์ ์ฐ๊ตฌ๋ค์ ๋ฐ๋ผ๊ฐ๊ธฐ๊ฐ ๋๋ฌด ํ๋ค๋ค ๐.. ๋ชจ๋ ์ฐ๊ตฌ๊ฐ ๋ค ์ข์๋ณด์)
โ ์งํ ์์์ ์ง์ฃผ๋ฅผ ์ฐพ๋ ๋ฅ๋ ฅ์ด ๋งค์ฐ ๋งค์ฐ ์ค์ํ๋ค!
8. ๋ฅ๋ฌ๋์ ์ฃผ์ ํ์ฉ ๋ถ์ผ
- ์์ฑ ์ธ์: Siri, Google Assistant, Bixby ๋ฑ
- ๊ธฐ๊ณ ๋ฒ์ญ
- ์์จ์ฃผํ ์๋์ฐจ
- ์ด๋ฏธ์ง ๋ถ์: ๊ฐ์ฒด ์ธ์, ์ด๋ฏธ์ง ๋ถ๋ฅ
- ์ด๋ฏธ์ง ์์ฑ ๋ฐ ๋ณด์ : ํ๋ฐฑ โ ์ปฌ๋ฌ, ์ ํด์๋ โ ๊ณ ํด์๋
- ๋ฐ์ดํฐ ๋ถ์:
- ํ ํ์ ๋ฐ์ดํฐ(Tabular data)
- ์๊ณ์ด ๋ฐ์ดํฐ(Time-series data)
9. ๋ฅ๋ฌ๋ ์ํฌํ๋ก์ฐ ํ๋ก์ธ์ค
1. ๋ฌธ์ ์ ์ (Problem Definition)
- ๊ฐ์ฅ ์ค์ํ ๋จ๊ณ
- ๋ฌธ์ ๋ฅผ ๋จ๊ณ๋ณ๋ก ๋๋๊ณ ๋จ์ํ(simplify) ํ์
- ์
๋ ฅ x์ ๊ฒฐ๊ณผ y ์ ์:
y = f(x) ํํ๋ก ์ ๊ฒฝ๋ง์ด ์ฒ๋ฆฌ ๊ฐ๋ฅํ๊ฒ ๊ตฌ์ฑ
2. ๋ฐ์ดํฐ ์์ง (Data Collection)
- ์ ์๋ ๋ฌธ์ ์ ๋ง๊ฒ x์ y ์์ง
- ์์ง ๋ฐฉ๋ฒ ์์:
- ์์ฐ์ด์ฒ๋ฆฌ / ์ปดํจํฐ๋น์ : ์น ํฌ๋กค๋ง
- ๋ฐ์ดํฐ ๋ถ์: ์์คํ
์์ ์์งํ ์ค์ ๋ฐ์ดํฐ
- ๋ ์ด๋ธ๋ง(labeling) ํ์์ธ ๊ฒฝ์ฐ ๋ง์
โ ์๋ ๋ ์ด๋ธ์ด ์๋ ๊ฒฝ์ฐ๋ ์์ง๋ง, ๋๋ถ๋ถ ์์์
ํ์
โ ๋น์ง๋ ํ์ต(unsupervised learning)์ ๋๋ฌด ์์กดํ์ง ๋ง ๊ฒ
์์ฉํ ์์ค์ ๋ชจ๋ธ์ ๋ง๋ค ๋๋ ๋ ์ด๋ธ์ด ์์ด์ผ ์ํ๋ ์์ค์ ์ฑ๋ฅ์ด ๋์จ๋ค!!
๋ ์ด๋ธ๋ง์ด ์ฌ์ค ๋ค ๋์ด์ง๋ง, ์ฒ์์๋ ์ผ๋จ ์ง์ ๋ ์ด๋ธ๋ง์ ํ๋ฒ ํด๋ณด์!
๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๊ฐ์ ๊ฒฝ์ฐ๋ ๋จ์ ๋
ธ๊ฐ๋ค ๊ฐ๊ฒ ์ง๋ง, ์ด๊ฒ๋ ๋ชจ๋ธ ์ฐ๊ตฌํ ๋ ๋ชจ๋ ์ด์ด ๋๊ณ ํผ๊ฐ ๋๋ค.
3. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ๋ถ์ (Preprocessing & EDA)
- ์ ๊ฒฝ๋ง์ ๋ฃ๊ธฐ ์ํด ์
์ถ๋ ฅ ํํ ์ ์
- ์ฃผ์ ์์
:
- Cleaning, Normalization
- Exploratory Data Analysis (EDA): ๋ฐ์ดํฐ ํน์ฑ ํ์
- ์ปดํจํฐ ๋น์ ์ ๊ฒฝ์ฐ ๋ฐ์ดํฐ ์ฆ๊ฐ(Augmentation) ์ํ
์: ํ์ (rotation), ์ข์ฐ๋ฐ์ (flipping), ์ด๋(shifting)
- ํ์ค ๋ฐฉ๋ฒ์ด ์์ง๋ง, ์ด๊ฒ๋ ๋ง์ฐฌ๊ฐ์ง๋ก ๊ฒฝํ์น๊ฐ ๋ง์ด ์์ฌ์ผ ํจ
4. ์๊ณ ๋ฆฌ์ฆ ์ ์ฉ (Modeling)
- ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ฐ์ค ์ค์ ํ
- ํด๋น ๊ฐ์ค์ ๋ง๋ ์๊ณ ๋ฆฌ์ฆ(๋ชจ๋ธ)์ ๊ตฌํ ๋ฐ ์ ์ฉ
- ํ๋ฒ์ ์ฑ๋ฅ์ด ์ ๋์ฌ ์๊ฐ ์๋ค!!
- ์ฝ์ง์ด ๋งค์ฐ ํ์์ , ์ฝ๋๋ฅผ ์ฒ์๋ถํฐ ๊น๋ํ๊ฒ ์ง์(ํด๋ฆฐ ์ฝ๋์ ์ํคํ
์ณ ๋ฒ ์ด์ค ์ง์์ด ์ค์ํ ์ด์ )
5. ํ๊ฐ (Evaluation)
- ์ ์ํ ๋ฌธ์ ์ ๋ง๋ ํ๊ฐ ๊ธฐ์ค ์ค์
- ๊ณต์ ํ๊ณ ์ ๋ขฐ์ฑ ์๋ ํ
์คํธ ์ค๊ณ ํ์
- ํ
์คํธ์
์ ๋๋ฌด ์ฝ๊ฑฐ๋ ์ด๋ ต์ง ์๋๋ก
- ์ค์ ๋ฐ์ดํฐ ๋ถํฌ์ ๊ฐ๊น๊ฒ ๊ตฌ์ฑ
- ํ๊ฐ ์ ํ:
- ์ ๋์ ํ๊ฐ (extrinsic evaluation)
- ์ ์ฑ์ ํ๊ฐ (intrinsic evaluation)
6. ๋ฐฐํฌ (Deployment)
- ํ์ต ์๋ฃ๋ ๋ชจ๋ธ์ weights(ํ๋ผ๋ฏธํฐ) ํ์ผ์ ์ ์ฅ ๋ฐ ๋ฐฐํฌ
- RESTful API ๋ฑ์ ํตํด ์๋น์ค ํํ๋ก ๋ํ
- ๋ฐ์ดํฐ ๋ถํฌ ๋ณํ์ ๋ฐ๋ผ ์ ์ง๋ณด์ / ๋ชจ๋ธ ์
๋ฐ์ดํธ๊ฐ ํ์ํ ์ ์์
- ๊ทธ๋์ ์ฒ์๋ถํฐ ์ ์ ๊ฐ ์์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์๋ผ๊ณ ์ฌํ์ต ์ํฌ ์ ์๋๋ก ํด์ฃผ๋ ๊ฒ๋ ์ข์ ๋ฐฉ๋ฒ