강화학습 첫걸음 - 심층강화학습의 응용 사례

Yubin Hong·2021년 7월 30일

PyTorch 강화학습 심층강화학습

강화학습 첫걸음

목록 보기

3/5

앞으로 배울 내용

강화학습이란 무엇인가?
미로찾기를 위한 강화학습 구현
역진자 문제를 위한 강화학습 구현
파이토치를 이용한 딥러닝 구현
딥러닝을 적용한 강화학습 - DQN 구현
딥러닝을 적용한 강화학습 - 심화과정
AWS GPU 환경에서 벽돌깨기 구현

오늘은 1. 강화학습이란 무엇인가!

1.3 심층 강화학습의 응용사례

1.3.1 심층강화학습의 응용사례

강화학습의 연구 및 응용은 불완전 정보 게임(imperfect information game) 수행과 현실공간에 존재하는 지적 시스템 구축에 초점이 맞춰져 있다.

불완전 정보 게임을 먼저 설명하겠다. 장기나 바둑은 완전 정보 게임에 해당한다. 프레이어가 게임 상태에 대한 모든 정보를 서로 알 수 있기 때문이다. 이와 달리 대부호, 포커, 마작 같은 게임은 불완전 정보 게임이라고 한다. 플레이어에 따라 알 수 있는 정보가 서로 다르기도 하고 손에 들고 있는 패처럼 자신 외에는 아무도 알 수 없는 정보가 있기 때문이다. 하지만 불완전 정보 게임 역시 인공지능이 인간을 초월하는 것은 시간문제로 여겨지고 있다.