Feature란
샘플을 잘 설명하는 특징:
Categorical (범주형)
1.Nominal Variable
2.Ordinal Variable
Continous (연속형)
3.Ratio Variable
4.Interval Variable
MNIST Classification
* 특정 위치에 선이 얼마나 굵거나, 얇은가
* 특정 위치에 선이 얼마나 휘어져 있거나, 기울어져 있는가
머신러닝, 인공지능 엔진에 필요없는 대표적인 (Bad)피쳐들이 존재함.
* 주민등록번호, 학생번호, 여권번호 (SQL의 Primary Key).
Traditional ML vs Current DL:
- Tradional ML
* Domain 지식을 활용하여, 가설을 세워서 전처리를 수행한후 Feature들을 추출 함.
* 이렇게 추출된 Feature들을 통해 Model을 만들기 떄문에 해석에 용이한 모델이 만들어짐.
* 하지만, 사람이 고려하지 못한 Feature들이 존재 할 수 있음.
-Current DL
* 최소한의 Raw Data에 대한 전처리를 수행하여, 모델을 학습함.
* 스스로 학습하고 결과를 보여주기 때문에 구현하기에 용이함.
* 그렇기 때문에 사람이 해석하기에 적합하지 않음.
Feature Vector:
* 각 특징들을 모아서 하나의 Vector로 만든 것.
(예) Tabular Dataset(Excel, CSV)에서의 Row가 해당함.