이번주는 저번주에 이어서 머신러닝 프로젝트를 진행했다
두 팀이 합쳐졌기 때문에 이게 merge라는 이름으로 지었다
데이터에 대한 설명
데이터의 특성들
이상치 검출을 위해 dbscan을 시도해보았다
별로 좋은 결과를 얻지 못함...
3시그마 방식으로도 도전
분포는 좋아졌지만 결과는 별로였음..
rfecv도 적용해보았지만 오히려 결과가 안좋아짐..
kfold는 그나마 좋은 결과를 얻음
최종적으로 optuna 튜닝을 진행
최고 0.921로 리더보드 7위까지 달성했다
오버피팅이나 데이터 편향에 대한 가설이 세워졌지만 아직 대회 종료 전이므로 확인할 길은 없다..