강화학습 첫걸음 - 머신러닝의 유형

Yubin Hong·2021년 7월 21일

강화학습 첫걸음

목록 보기

1/5

1.1. 머신러닝의 유형(지도학습, 비지도학습, 강화학습)

지도학습은 학습단계와 추론 단계로 이뤄져 있다.

손글씨 이미지 분류를 예로 들 수 있다. 여기에서 데이터는 이미자와 이미지에 나타난 숫자가 무엇인지를 알려주는 레이블(0부터 9 중 하나의 값)이 쌍을 이루고 있다.

지도학습은 손글씨 분류 외에도 이미지나 음성, 텍스트 데이터 분류 등에 응용된다. 분류 외에 회귀(Classification)이라는 Task에도 지도학습을 사용할 수 있다.

비지도 학습을 한마지로 표현하면 '그룹 나누기'라고 할 수 있다. 많은 양의 데이터를 비슷한 데이터끼리 그룹화(Clustering)한다.

예를 들어, 우리 회사 고객을 구매 기록을 기반으로 그룹화하는 시스템"은 비지도학습 시스템이다. 구매 이력에서 나타나는 특징으로 고객의 그룹을 나누고 각 그룹마다 서로 다른 판매전략을 실행할 수 있다.

강화학습은 주로 "시간변화에 따른 시스템 제어 규칙 구성" 혹은 "대전형 게임의전략 구성" 등에 응용되는 기법이다.

예른들어, 로봇의보행제어 시스템이나 바둑같은 게임의 인공지능에 강화학습이 사용된다.

"
"
"
"
"
"
"
"
"
"
"
"
"

Reference

기억보단 기록을