출근 시간에서 보여지는 균형점 수렴

x11·2023년 1월 17일

Equilibrium reinforcement learning stochastic gradient descent

Economic Thinking

목록 보기

2/2

Created on January 18, 2023

※ 유추가 들어갔으므로 논리적으로 완전히 동치가 아님을 주의

출근 시간에는 Rush hour이기 때문에 '아침에서 1분'이 '낮의 10분 이상'의 가치를 가진다. 그래서 보통 몇 시에 일어나서 몇 시에 나오고 몇 시에 교통수단을 이용하는지를 결정하게 된다. 그런데 사람이다 보니, 귀차니즘이 생기기 마련이고 Sequential한 일정이기 때문에 앞의 일정이 변경되면 새로운 Time table이 완성되어야 한다. 그래서 몇 가지 원칙만 세우고 출근을 지속적으로 하게 되는데 오늘 신기한 점을 발견하였다.

출근 Time table의 일정이 문제가 생기지 않는 마지노선으로 수렴하는 것이었다.

위와 같은 발견에 따라 아래와 같은 관찰을 도출하였다.

제약 조건(뒤의 일정에 차질이 생기는지 등)에 따라 계획하지 않고 Greedy algorithm으로 진행하려고 해도 Stochastic gradient descent 방식으로 균형점에 향함.
- 제약 조건을 위반한 경우, 향후 일정의 차질을 겪는 (-)의 Reward를 받아서 행동을 다음에 수정함(Reinforcement learning적 요소).
Learning rate은 그 사람의 기질에 의해서 좌우 되는거 같으며 그에 따라 수렴속도가 결정됨.

사진 출처: 자습해도 모르겠던 딥러닝, 머리속에 인스톨 시켜드립니다, 하용호

x11

이전 포스트

출근 시간에서 보여지는 균형점 수렴

Economic Thinking

무한리필집에서 볼 수 있는 경제학적 아이디어

0개의 댓글