식품 내 유해한 미생물 및 독소에 의해 발생하는 질병이며 구토, 설사, 복통 등의 증상을 유발① 다양한 외부 변수를 이용하여 지역별/원인물질별 식중독 발생 확률을 예측하는 머신러닝 모델 개발② 일반 시민이 사용할 수 있는 식중독 발생 현황 대시보드 및 예측 시뮬레이션
인구데이터 수집 관련 이슈 ① 총 인구 데이터 월별 데이터가 2011년부터 존재하며 2010년 이전은 연말기준 인구로 제공되고 있다. 2010년 이전 연말 기준 인구를 해당 연도의 12월 자료로 처리하고 연중 인구는 보간(interpolate)하기로 하였다.
선형회귀의 기본 가정이 일부 충족되지 않으며 발생환자수와 발생건수가 특정 값에 집중된 결과 좋은 모델 성능을 기대하기 어려워짐 → 분류 모델링을 계획하고 발생확률을 제시하기로 결정식중독 발생여부 데이터가 지역별 분균형 편차를 보임 → 전국 시도 지역별 모형을 각각 모델
원인물질별 모형 모델링의 필요성 원인물질별(병원성대장균, 노로바이러스 등)로 식중독의 유행 조건과 예방 대책이 각각 다르나 지역별 모델에서는 이를 고려하지 않고 식중독 발생 확률만 제시하고 있다. 이에 원인물질별 식중독 발생 확률까지 제시하도록 모형을 개선하
앞서 모델링한 모형을 이용하여 대시보드를 구현하기로 하였다. 대시보드에서는 크게 독립변수 변화에 따른 식중독 발생확률 예측 시뮬레이션과 향후 식중독 발생 양상을 시계열로 예측하는 기능을 구현하는 데 초점을 맞췄다.당초에는 태블로를 이용하여 대시보드를 만들고자 하였다.