[연구리뷰]COVID-19 Predictions Using Machine Learning

temp·2021년 8월 2일
0
post-thumbnail

※ 본 글은 메모용으로 작성하였기 때문에 부정확할 수 있습니다.
※ 썸네일은 본인의 연구에 포함된 그림으로, 해당 글과 관련 없습니다.
※ 원 글 작성일: 2020-10-12

Website: COVID-19 Projections Using Machine Learning

About the Model

  • 해당 모델은, SEIR모델을 기반으로, paramater는 machine-learning technique을 사용했다(기대되는 output과 , 실제 결과의 error를 좁히는 방향으로).
  • 과적합을 줄이려는 여러가지 validation technique을 진행한 후, 예측 진행.

Minimal assumptions: Because our model uses machine learning to learn the inputs and parameters, we minimize the number of assumptions we have to introduce. This allows us to avoid certain biases that can be present when incorporating various assumptions.

  • 머신러닝 테크닉을 사용하기 때문에, 최소한 가정으로 진행했다.
    (여러가지 가정을 사용하면, 이가 합쳐질 때 어떤 편향이 생길 수도 있다)

No differential equations: Unlike traditional SEIR models, our model does not use differential equations. As a result, we can skip the significant computations required to solve systems of ordinary differential equations. Instead, we follow a more traditional discrete mathematics approach by using a discrete state machine with probabilistic transitions. All of the math in our model can be understood by a motivated high school student.

  • ODE를 안 쓰고, 역시 Discrete-model을 사용했다.
    (Discrete state machine with probabilistric transitions : 확률적 전이)

  • discrete-time state machine을 사용했다.

  • 매일매일, probability distribution을 가진다(각각 모델에 대해).

  • 이러한 분포는 convolved된다(총 현존하는 확진자와 합쳐져 다음 날의 확진자를 예측).

역시, smoothing 알고리즘으로 데이터를 조금은 정제함.
  1. R_0 : 정책시행 전 R
  2. post-mitigation R : 정책시행 후 R
  3. post-reopening R : 정책시행 후 2-4후부터, 피로가 증가 할 것이다.

we use a simple machine learning technique called grid search.

  • parameter들을 얻기 위해 grid search라는 간단한 머신러닝 테크닉을 썼다.
    또한,
    brute-force grid search method ,
    Loss function,
    Mean squared error ,
    absolute error,
    ratio error,
    ensemble of aforementioned error 등을 사용했었으나

MSE가 여러 sample data에서 동등하게 작동했다.

만약 이러한 FREE-VARIABLE이 5개만 있어도, 단 20일만의 data가지곤 정확히 estimation이 힘들 거다. 그러니 이러한 variable은 줄이는게 좋다. 그래서, 순간 순간 다른 variable들은 고정을 하고, 1개의 parameter만 변화를 주는 식으로 했다. 이는 signal-to-noise ratio를 개선시켜준다.

데이터가 충분히 많기 때문에 과적합을 피하기는 쉽다.
여기서는, robust validation을 사용했다. 필요하면 웹사이트 참고.

0개의 댓글