머신러닝이란, 프로그래머가 직접 수많은 규칙을 미리 정해주는 대신 프로그램 자체가 데이터를 통해 스스로 학습하도록 하는 방법이다.
Supervised Learning이란, 특정 input에 대해 "정답 (label)" output이 있는 데이터 셋이 주어지는 경우를 말한다. 프로그램은 이 정보로부터 input과 output의 관계를 유추하게 된다.
주어진 input 변수를 ouput 변수에 대응시키는 어떤 연속함수를 찾는 과정 Regression이다. Regression의 output은 continuous 값을 갖는다.
Classification은 주어진 input 변수가 어느 discrete category에 속하는지 찾아내는 것이다. Classification 문제의 output은 discrete 값을 갖는다.
Unsupervised Learning은 "정답 (label)" output을 제공하는 데이터 셋이 없는 문제이다. 따라서 Prediction Result에 대한 Feedback이 없다.