지도 학습(Supervised) :
정답이 주어진 데이터를 이용하여 학습한 후 테스트 데이터에 대한 미래 결과 예측
- 회귀 (Regression)
- 분류 (Classification)
비지도 학습(Unsupervised) :
학습할 데이터에 정답은 없고 입력 값만 있으며, 입력값 자체의 특성과 분포를 파악해서 그룹화 하는 군집화(Clustering)등에 주로 쓰임
- 군집화 (Clustering)
지도 학습은 학습 결과를 바탕으로 미래에 무엇을 예측하느냐에 따라 회귀(Regression)와 분류(Classification)로 나눌 수 있다.
Regression : 트레이닝 데이터로 학습하여 연속적인 값을 예측 (continuous Value) 값을 가지고 있음
Classification : 회귀 데이터와 동일 하지만 정답 부분은 연속적인 값이 아닌 Fail, Pass 또는 Low, Medium, High 등의 이산적인 값(Discrete Value)만을 가짐
비지도 학습은 학습 데이터에 정답은 없고 입력 값만 있음. 주로 군집화(Clustering) 알고리즘을 이용하여 뉴스를 주제별로 묶어 주거나 고객의 구매이력을 바탕으로 상품을 추천해주는 시스템 등에 쓰인다.