- DB 구축 -> 특징 설계 -> 학습 의 순서로 이루어진다.
기계학습은 이러한 특징을 설계하는 과정이 필요하다.
이때 딥러닝과의 차이는 딥러닝은 사람이 직접 특징을 정하지 않고, 인공지능이 스스로 모델에서의 특징을 뽑아내서 학습한다.
feature Engineering 이란 특징을 확장하여 사용하는 과정으로 크기, 모양, 색상, 무게, 밝기, 투명도 등 여러 feautre가 있을 때, 이러한 특징을 개씩 묶어서 학습한다.
이러한 특징들을 나타내는 공간을 feature space라고 한다.
전체 DB에서 데이터 세트를 나눠 학습을 진행한다.
훈련데이터 집합 training dataset
검증데이터 집합 validation dataset
테스트데이터 집합 test dataset