TIL - 2021.10.11

Wanna be __·2021년 10월 11일
0

TIL

목록 보기
41/45
post-thumbnail

Today, I Learned

1. AI

Expectation

이전까지 봤던 최적의 선택 방법인 Minimax 방식과는 조금 다른 선택을 한다면?
ex) 단순 min, max 값만 보고 가는게 아니라 평균을 보고 선택한다던지 등의 선택이라면

Expectimax Search
Minimax 전략은, 항상 얻을 수 있는 최선/최악의 결과를 계산하여 선택하는 것
하지만 항상 이것이 최적의 결과를 얻어내는 것 은 아님. 손해를 덜 볼 지언정, 가장 이득을 볼 수 있는 risk를 감당하지 않기 때문.
따라서 기존 Min node, Max node와 더불어 chance node를 둔다.

Average를 계산할 때, 각 기대값의 평균을 구함. (Value * Probability)

여기서 alpha-beta pruning 처럼 pruning을 적용할 수 있을까?
Depth-Limited expectation을 적용해서 Tree 끝까지 내려가는게 아니라 적절한 깊이까지 내려가서 적절히 추측하면 됨..

Probability
1/4 확률로 차 안막힘 / 1/2 확률로 적당함 / 1/4 확률로 차 막힘. 이런식으로 모델링을 하는것도 간단한 예시중에 하난데,
차 안막힘 막힘을 전체 차 대수로 표시할 수도 있고 아니면 5단계로 나타낼 수도 있고 이거는 design하는 사람에 달린 문제임.

Utility
효용이란 결국 각 상황에서 내가 얻게되는 value. 즉, 어떤 상황에 대한 preference를 나타내는 값임.
즉, 어떤한 합리적인 선호는 효용함수가 될 수 있음.
Minimax의 경우 Utility를 제곱한다고 해서 그 결과가 바뀌지 않는데, expectimax 방법을 사용할 때는 해당 utility를 그대로 사용하는가, 혹은 제곱하여 사용하는가에 따라 선택하는 값이 달라질 것.
즉, Minimax는 monotonic trasformation에 둔감 (크면 큰거지 얼마나 큰지는 중요하지 않음), 반대로 Minimax는 그 Scale 또한 중요함.

Rationality
Orderability
Transitivity
Continuity
Substitutability
Monotonicity
위 조건들을 만족하면, Rational하다! 라고 생각할 수 있음.
그리고 이런 조건을 조금 더 발전시킨것이

MEU Priciple

profile
성장하는 개발자

0개의 댓글