(ex) "고양이인가? 강아지인가?"
- 판별 모델 개발 : 사람의 기준은 경험적(직감적)이다. 명확한 정의가 불가능
- 이러한 경험적 기준을 -> 모델링화 -> Machine Learning
Feature Extraction (요인 추출) : 기존의 sample로부터 새로운 features(요인)을 추출 -> 이를 학습 model의 입력값으로 대신 사용 -> 예측 정확도를 효과적, 효율적으로 향상시키기 위함
- 학습 model의 성능에 엄청난 영향을 끼침 -> 거의 모든 ML 문제에서 Feature Extraction을 수행!
Loss Function (손실 함수) : 비용함수(Cost Function)라고도 함. 손실에는 그만큼의 비용이 발생한다는 개념에서 나옴
★ 일반적으로 기계학습에서 모델의 성능은 손실함수를 최소화할 수록 -> 증가
★ 지역최적해에 빠져서 전역최적해를 찾지 못하는 것을 경계해야함
1. 지도 학습 (Supervised Learning)
2. 비지도 학습 (Unsupervised Learning)
3. 강화 학습 (Reinforcement Learning)
When it predicts yes, how often is it correct?
When it's actually yes, how often does it predict yes?
★ Data를 Training, test 2개의 데이터로 나누지 않고 굳이 Validation set까지 3개로 나누는 이유는 무엇일까...
-> 모델의 성능을 평가하기 위해 Validation set을 사용한다.
-> Training의 일부를 모델의 성능을 평가하기 위해 희생 But 위 희생을 감수하지 못할만큼 Data의 크기가 작다면 cross-validation이라는 방법을 사용하기도 함
<문제점>