# monte carlo

8개의 포스트
post-thumbnail

splunk/ 6. 주식 포트폴리오 작성

주식포트폴리오 작성 추신 : /home/sb111 에 있던 example_stock 을 /opt/splunk 로 옮겼다. 참고 : https://cafe.naver.com/splunker?iframeurlutf8=%2FArticleRead.nhn%253Fclubid%3

2022년 7월 15일
·
0개의 댓글
·

Monte Carlo Prediction and Temporal Difference Error

date: 2021-10-18 12:00:00우리는 policy iteration을 policy evaluation과 policy improvemet를 통해서 다이나믹 프로그래밍을 이용해 계산을 하였다.그런데, 대부분의 문제는 다이나믹 프로그래밍을 적용하기 어렵다.그

2022년 7월 7일
·
0개의 댓글
·
post-thumbnail

Off-Policy Monte Carlo

강화학습 시리즈는 패스트캠퍼스 박준영 강사님의 수업과 Sergey Levine의 Deep Reinforcement Learning 그리고 서튼의 강화학습 교재를 참고하여 만들어졌고 어떤 상업적 목적이 없음을 밝힙니다.Monte Carlo와 TD 방식으로 가치함수를 추정

2022년 2월 8일
·
0개의 댓글
·
post-thumbnail

Model-free RL의 기초 -2 모델 없이 정책 개선하기

강화학습 시리즈는 패스트캠퍼스 박준영 강사님의 수업과 Sergey Levine의 Deep Reinforcement Learning 그리고 서튼의 강화학습 교재를 참고하여 만들어졌고 어떤 상업적 목적이 없음을 밝힙니다.우리는 이전 시간에 상태 천이 확률 함수 없이도 가치

2022년 2월 8일
·
0개의 댓글
·
post-thumbnail

Model-free RL의 기초 -1 불확실한 세계에서 가치 추산하기

강화학습 시리즈는 패스트캠퍼스 박준영 강사의 수업과 Sergey Levine의 Deep Reinforcement Learning 그리고 서튼의 강화학습 교재를 참고하여 만들어졌고 어떤 상업적 목적이 없음을 밝힙니다.우리는 지난 시간에 환경과 보상 함수에 대해 알고 있다

2022년 2월 6일
·
0개의 댓글
·
post-thumbnail

python multiprocessing(2)- multiprocessing 을 이용한 원주율 추정

python multiprocessing module 을 이용하여 embarrassingly parallel(서로 통신하지 않고 문제를 독립적으로 푸는 경우)한 문제의 속도를 향상시켜보자!

2021년 9월 7일
·
0개의 댓글
·

MCMC(Markov Chain Monte Carlo)

(Reference)참고링크 : 공돌이의 수학정리노트참고링크 : 잠재 디리클레 할당 파헤치기 1~3탄(용어 정리)타켓 분포 : 우리가 샘플을 추출하고자 하는 유사 확률 분포 $\\Rightarrow$ $f(x)$ 로 표기함제안 분포 : 제안 분포 는 우리가 쉽게 샘플을

2021년 2월 14일
·
0개의 댓글
·