강화학습 첫걸음 - 머신러닝의 유형

Yubin Hong·2021년 7월 21일
0

강화학습 첫걸음

목록 보기
1/5
post-thumbnail

앞으로 배울 내용

  1. 강화학습이란 무엇인가?
  2. 미로찾기를 위한 강화학습 구현
  3. 역진자 문제를 위한 강화학습 구현
  4. 파이토치를 이용한 딥러닝 구현
  5. 딥러닝을 적용한 강화학습 - DQN 구현
  6. 딥러닝을 적용한 강화학습 - 심화과정
  7. AWS GPU 환경에서 벽돌깨기 구현





오늘은 1. 강화학습이란 무엇인가!


1.1. 머신러닝의 유형(지도학습, 비지도학습, 강화학습)

1.1.1 지도학습

지도학습은 학습단계와 추론 단계로 이뤄져 있다.

손글씨 이미지 분류를 예로 들 수 있다. 여기에서 데이터는 이미자와 이미지에 나타난 숫자가 무엇인지를 알려주는 레이블(0부터 9 중 하나의 값)이 쌍을 이루고 있다.

지도학습은 손글씨 분류 외에도 이미지나 음성, 텍스트 데이터 분류 등에 응용된다. 분류 외에 회귀(Classification)이라는 Task에도 지도학습을 사용할 수 있다.


1.1.2 비지도학습

비지도 학습을 한마지로 표현하면 '그룹 나누기'라고 할 수 있다. 많은 양의 데이터를 비슷한 데이터끼리 그룹화(Clustering)한다.

예를 들어, 우리 회사 고객을 구매 기록을 기반으로 그룹화하는 시스템"은 비지도학습 시스템이다. 구매 이력에서 나타나는 특징으로 고객의 그룹을 나누고 각 그룹마다 서로 다른 판매전략을 실행할 수 있다.


1.1.3 강화학습

강화학습은 주로 "시간변화에 따른 시스템 제어 규칙 구성" 혹은 "대전형 게임의전략 구성" 등에 응용되는 기법이다.

예른들어, 로봇의보행제어 시스템이나 바둑같은 게임의 인공지능에 강화학습이 사용된다.

"
"
"
"
"
"
"
"
"
"
"
"
"

Reference

profile
기억보단 기록을

0개의 댓글