(*이 시리즈의 내용은 모두 '인공지능 100점을 위한 파이썬 수학' 서적의 내용을 정리한 것입니다. 사진과 같은 자료들 또한 출처가 위 책임을 밝힙니다.)
(1) 지도학습(Supervised Learning)
학습하는 대상을 보면서 정답인지, 오답인지 신호를 주면서 학습을 시킨다.
비교적 학습에 큰 어려움이 없다.
학습을 위한 데이터와 그 데이터에 대한 정답 레이블이 함께 주어진다.
MNIST 데이터에서, x는 28x28 크기의 손으로 쓴 글씨 정보를 담고 있고, 동시에 정답 레이블인 0~9 사이의 답 t를 함께 가지고 있다. 데이터 x를 가지고 0에서 9사이의 어떤 값을 가질 것인지를 추론한 다음 그것이 맞는지 정답 t를 통해 확인한다.
다른 분야에 비해 상당 부분 이론이 잘 정비되어 있고, 학습률도 좋다.
(2) 비지도학습(Unsupervised Learning)
이를테면 강아지 사진 1만 장과 고양이 사진 1만 장을 가지고 각각의 사진마다 dog, cat이라는 레이블이나 강아지는 0, 고양이는 1을 붙인다면 지도학습이 된다.
지도학습에서는 2만 장의 정답 레이블이 적힌 데이터를 가지고 학습을 하게되지만, 정답 레이블이 없다면 정답 없이 학습을 진행하므로 비지도학습이 된다.
데이터를 AI가 알아서 분류하면서 적당한 선에서 그룹을 나눈다.
(3) 강화학습(Reinforcement Learning)
지도학습, 비지도학습과는 다른 종류이다.
강화되는 방향으로 향하는 학습.
지도학습이나 비지도학습이 이미 존재하고 움직이지 않는 데이터에 대한 분류라면 강화학습은 변하는 환경에서 어떤 행위를 했을 때 주어지는 보상을 더 크게 얻기 위한 학습이다.