강화학습의 연구 및 응용은 불완전 정보 게임(imperfect information game) 수행과 현실공간에 존재하는 지적 시스템 구축에 초점이 맞춰져 있다.
불완전 정보 게임을 먼저 설명하겠다. 장기나 바둑은 완전 정보 게임에 해당한다. 프레이어가 게임 상태에 대한 모든 정보를 서로 알 수 있기 때문이다. 이와 달리 대부호, 포커, 마작 같은 게임은 불완전 정보 게임이라고 한다. 플레이어에 따라 알 수 있는 정보가 서로 다르기도 하고 손에 들고 있는 패처럼 자신 외에는 아무도 알 수 없는 정보가 있기 때문이다. 하지만 불완전 정보 게임 역시 인공지능이 인간을 초월하는 것은 시간문제로 여겨지고 있다.
강화학습과 심층강화학습의 응용 분야는 PC에서 게임을 수행하는 것부터 현실공간에서의 응용으로 범위가 점차 이동하고 있다.
"
"
"
"
"
"
"
"
"
"
"
"
"
Reference