🗓️기간
24.11.14 - 24.11.15
👍👍Liked
두 번째 프로젝트를 완료했다. 이번 프로젝트는 머신러닝과 딥러닝 학습을 마친 후 진행되었으며, 고객 이탈 데이터를 분석하여 예측 모델을 만드는 것이 주제였다. 우리 팀은 신용카드 고객 이탈 예측 모델을 주제로 삼아 작업했다. 프로젝트를 통해 배운 내용을 전체적으로 복습하고 체득할 수 있어 좋았고, 전반적인 내용을 정리할 수 있었던 한 주였다.
📚 Learned
조별 과제를 진행하며 배운 점들이 많았다!
-
데이터 전처리
- 이상치 처리: 데이터에 맞는 이상치 기준을 설정하는 방법과 여러 가지 처리 방식을 배울 수 있었다. - IQR, z-score, Boxplot 시각화
- 결측치 처리: 결측치를 제거할지 대체할지 데이터 상황에 맞는 전처리 방법을 고민하며 상황별 접근법을 익혔다.
- Encoding: 예측 시 사용할 수 있도록 학습한
preprocessor
를 .pkl
로 저장해야 한다는 점을 새로 배웠다. 다양한 인코딩 방식뿐 아니라 맞춤형 인코더도 직접 만들어 보았다. 아직 파이프라인 구현까지는 못 했지만, 곧 도전할 예정이다.
-
데이터 모델링
- 모델별로 하이퍼파라미터를 조정하는 과정이 흥미로웠으며, 과적합(overfitting)과 과소적합(underfitting)을 평가하며 좋은 모델을 선택하는 경험을 쌓았다.
-
예측 평가
- 수치형 데이터의 정규화를 미처 적용하지 않아 예측 결과가 변동폭이 큰 경향이 있다는 것을 깨달았다. 짧은 프로젝트 기간과 팀원의 일부 부재로 인해 프로젝트 중에는 보완하기 어려웠지만, 이번 주에 수정해 프로젝트 완성도를 높일 계획이다.
-
Streamlit
- 처음에는 다소 걱정했지만, 실제로 사용해보니 생각보다 쉬웠다. 다만 커스터마이징에는 한계가 있어
streamlit.markdown()
을 사용해 CSS와 HTML 태그로 필요한 요소를 추가할 수 있었다. 동적 데이터 바인딩이 가능했으면 더 좋았겠지만, 현재 기능도 꽤 유용하게 느껴졌다.
🚧Lacked
- 파이프라인, 특성 스케일링(feature scaling), 특성 추출 (Feature Extraction)을 진행하고 싶었는데 시간적 여유가 부족했다.
🎯Longed For
- 프로젝트를 좀 더 향상시키고 피드백 받은 평가서 바탕으로 코드를 개선해보아야겠다.
오랜만에 돌아온 회고! 웰컴입니당 🤗♥️
이틀이라는 짧은 기간 안에 많은 내용 수행하셨네요!! 평가 받으신 내용 바탕으로 팀원분들과 리뷰해보시고 완성도도 높이신다니 너무 완벽 플랜..👍👍
이틀 기간의 단위 프로젝트들은 마지막 두 달 동안 진행되는 최종 프로젝트를 위한 연습이라고 생각해주시고, 벌써 최프 결과물이 기대가 됩니다!! 앞으로도 화이팅이에요~!!