profile
vegan, data scientist, effective altruist
post-thumbnail

Fisher Information

Fisher information은 MLE를 통해 추정한 파라미터의 신뢰구간을 구할 때 등장합니다. 머신러닝과 관련해서는 KL-divergence를 Fisher Information Matrix(FIM)으로 근사할 수 있습니다.

2022년 7월 26일
·
0개의 댓글
·
post-thumbnail

TRPO 구현을 위해 알야야 할 것들

최근에 강화학습 알고리즘 TRPO를 구현했습니다. 이를 위해 여러 자료를 찾아보면서 애를 먹기도 했기만 결과적으로는 많은 것을 배웠고, TRPO와 관련하여 여러 흥미로운 주제가 있다는 것을 알게 되었습니다.

2022년 7월 25일
·
0개의 댓글
·
post-thumbnail

Hessian 없이 Hessian-vector product 구하기

Hessian H를 직접 구하지 않고도 Hessian과 벡터 v의 곱 Hv를 구하는 것이 가능합니다. 많은 경우 H보다는 Hv가 필요하기 때문에, Hessian 행렬이 너무 커서 계산이 불가능한 경우에 유용하게 사용할 수 있습니다.

2022년 7월 19일
·
0개의 댓글
·