대회 소개 팔당댐 홍수 안전운영에 따른 한강 수위예측 AI 경진대회 청담대교, 잠수교, 한강대교, 행주대교 수위 예측하기 특이점 시계열 데이터 사용 22년 6월~7월 데이터를 사용하여 솔루션이 존재 Data Leakage가 존재할 수 밖에 없는 환경 외부 데이
csv 파일을 불러와 넣어준다.강수량 데이터는 rf_files물 데이터(워낙 다양한 데이터가 들어있어 물 데이터라고 퉁친다)는 water_files데이터를 각각 찍어보면 다음과 같다앞서 외부데이터 정리에서 다뤘던 것과 동일한 방법으로시계열 데이터를 integer 형태
대회측에서 제공해준 강수량 데이터와 물 데이터를 먼저 합쳐준다(rf_df와 water_df는 2-1에서 수정해둔 그 상태 그대로 이용)1편에서 가공해둔 외부 데이터 (gimpo_seoul_namyang.csv)를 불러내여 df에 합쳐준다.다음과 같이 끝에 wl_1019
모든 모델은 LGBM 모델을 사용하이퍼 파라미터 및 데이터 전처리를 계속 바꾸어가며 여러번 실험하였다하이퍼 파라미터는 optuna를 통하여 탐색 (optuna는 다음 편에서 계속) \- optuna의 목적 함수는 validation set의 RMSE점수 활용!test
optuna 돌릴 파일들을 lgb_shifted_optuna_files에 이미 넣어뒀다.(x_train, x_test, y_train 등등)target_col_num을 0에서 3까지 바꿔가며각 대교에 가장 적합한 하이퍼 파라미터를 찾는 과정이다.원래 넣어두었던 파일의