지도학습은 정답 데이터가 있는 상황에서 학습을 하는 알고리즘을 이야기한다. 현재 대부분의 머신러닝·딥러닝 알고리즘에서 사용하는 방식이다. 모델의 학습이 끝나면 문제를 예측한다. 만약 예측하는 결과값이 이산값이면 '분류 문제'라고 하고, 연속값이면 '회귀 문제'라고 한다.
딥러닝에서는 지도 학습 방법론으로 CNN(Convolutional Neural Networks), RNN(Recurrent Neural Networks)를 주로 사용한다.
비지도학습은 정답 데이터가 없는 상황에서 학습을 하는 알고리즘을 이야기한다. 지도 학습의 목적이 어떤 값에 대한 예측을 수행하는 것이라면, 비지도학습은 데이터의 숨겨진 특징을 찾아내는 것입니다.
비지도학습은 단독으로 사용되기보다는, 지도 학습의 인풋 데이터로 활용하여 지도 학습의 성능을 끌어올리는 용도로 많이 사용됩니다. 대표적인 비지도학습 방법론으로는 주성분 분석과 오토인코더가 있습니다.
지도·비지도 학습은 정적인 상태에서 학습을 진행하는 알고리즘이다. 반면 강화학습은 동적인 상태로 에이전트(Agent)가 주어진 환경(State)에서 어떤 행동(Action)을 취하고 이에 대한 보상(Reward)을 얻으면서 학습을 진행한다. 이때 에이전트는 보상을 최대화하도록 학습을 진행한다.
강화 학습의 대표적인 알고리즘으로는 Q-Learning, DQN(Deep-Q-Network) 기법을 많이 활용한다.