머신러닝 유형에는 지도학습, 비지도학습, 강화학습이 있다.
지도학습에는 기존에 분류된 학습용데이터(training data)로 구성된 입력변수와 원하는 출력변수(label)이 수반된다. 알고리즘을 이용해 입력변수와 출력변수를 맵핑하는 함수를 찾아 일반화를 통해 새로운 사례들을 예측한다.
지도학습의 대표적인 알고리즘
지도학습에 정답지(label)를 줬다면 비지도학습에는 정답지를 주지않는다.
기계에 미분류된 데이터만 제공을 하고 고유패턴을 발견하도록 설정한다.
비지도학습의 대표적인 알고리즘
학습하는 시스템을 agent라 하는데, agent가 환경을 관찰해 스스로 행동하게 한다. 행동의 결과로 보상을 주는데 보상을 최대화하도록 학습한다.
강화학습의 대표적인 알고리즘