서울대학교에서 진행하는 빅데이터 핀테크 과정을 진행하며 기계학습 수업을 통해 진행한 ML 프로젝트에 관해 리뷰 해보고자 한다.
먼저 주제를 선정하는 과정에서 이미 분류에 관한 프로젝트는 한적이 있어 이번에는 회귀에 관한 분석을 목표로 진행하였고 아래 캐글의 data를 통해 분석을 진행하였다.
[kaggle Bike Sharing demand]
https://www.kaggle.com/competitions/bike-sharing-demand/overview
이번 프로젝트를 진행하며 다음과 같은 목표를 설정해두고 분석을 진행하였다.
프로젝트 목표
1. 캐글 Leader board의 상위권에 들도록 분석해보자
2. 최대한 다양한 모델을 사용해보고 해당 모델에 대한 하이퍼파라미터 최적화와 모델의 해석을 진행해보자
3. 프로젝트의 발표자료를 시각화 시간에 배운 파이썬 라이브러리인 Streamlit을 통해 제작해보자
프로젝트 기여사항
1. EDA
2. 해당 프로젝트에서 사용한 모든 모델에 대한 Baseline+Optuna code 작성
3. Streamlit의 각 페이지의 초안 작성
해당 프로젝트의 모든 내용은 Streamlit을 통해 제작후 배포 완료하였으며 아래 링크를 통해 확인할 수 있으며 분석코드와 Streamlit 제작 코드는 아래 깃허브 링크를 통해 확인할 수 있다.
[streamlit]
[github]