※ 본 글은 메모용으로 작성하였기 때문에 부정확할 수 있습니다.
※ 썸네일은 본인의 연구에 포함된 그림으로, 해당 글과 관련 없습니다.
※ 원 글 작성일: 2020-10-12
Website: COVID-19 Projections Using Machine Learning
Minimal assumptions: Because our model uses machine learning to learn the inputs and parameters, we minimize the number of assumptions we have to introduce. This allows us to avoid certain biases that can be present when incorporating various assumptions.
No differential equations: Unlike traditional SEIR models, our model does not use differential equations. As a result, we can skip the significant computations required to solve systems of ordinary differential equations. Instead, we follow a more traditional discrete mathematics approach by using a discrete state machine with probabilistic transitions. All of the math in our model can be understood by a motivated high school student.
ODE를 안 쓰고, 역시 Discrete-model을 사용했다.
(Discrete state machine with probabilistric transitions : 확률적 전이)
discrete-time state machine을 사용했다.
매일매일, probability distribution을 가진다(각각 모델에 대해).
이러한 분포는 convolved된다(총 현존하는 확진자와 합쳐져 다음 날의 확진자를 예측).
역시, smoothing 알고리즘으로 데이터를 조금은 정제함.
we use a simple machine learning technique called grid search.
MSE가 여러 sample data에서 동등하게 작동했다.
만약 이러한 FREE-VARIABLE이 5개만 있어도, 단 20일만의 data가지곤 정확히 estimation이 힘들 거다. 그러니 이러한 variable은 줄이는게 좋다. 그래서, 순간 순간 다른 variable들은 고정을 하고, 1개의 parameter만 변화를 주는 식으로 했다. 이는 signal-to-noise ratio를 개선시켜준다.
데이터가 충분히 많기 때문에 과적합을 피하기는 쉽다.
여기서는, robust validation을 사용했다. 필요하면 웹사이트 참고.