머신러닝 방법을 구분하는 방법에는 총 3가지가 있다.
지도학습
지도 학습은 정답이 있는 데이터를 활용해 데이터를 학습시키는 방식.
X(입력) → Y(label) 처럼 입력값을 통해 정답을 학습한다.
대표적으로 Classification 과 Regression 이 있다.
('#3 머신러닝의 Task' 참조)
https://velog.io/@chiroya/3-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D%EC%9D%98-Task
< 연관 알고리즘 >
CNN, RNN 같은 인공신경망 / SVM, 회귀분석 등의 벡터 기반 류
비지도학습
비지도학습은 정답이 없는 데이터들 간의 비슷한 특징들끼리 그룹화하여 결과를 예측하는 방식.
대표적으로 Clustering 과 차원축소가 있다.
< 연관 알고리즘 >
GAN, K-Means 등
강화학습
강화학습은 학습에 대한 보상을 받으며 학습하는 것을 말한다. 보상을 극대화시키기 위한 노력을 통해 정답에 가까운 답을 찾아내는 것이라고도 말할 수 있다.
위 그림처럼 강아지(Agent)는 사람(Environment)에게 보상(Rewards)를 받고자 행동(Actions)를 취할 것이고, 강아지는 더 좋은 보상을 받기 위해 학습하여 더 나은 결과 혹은 성과를 내게 될 것이다.