아래는 linear programming 방식으로 MDP를 푸는 식이다.
이 식의 unique optimal solution은 optimal value function
풀어서 쓰면 아래와 같다.