2번째 프로젝트와 10주차가 끝났다! wrapup 리포트를 쓰면서 프로젝트에 대한 개인 회고를 진행해보았다.
일일 학습 정리로 매일 복습, 과제, 피어세션, 회고 정리했고 아래 링크 달았습니다.
팀장으로서 프로젝트 목표를 위해 팀을 체계적으로 잘 운영하는 것이 목표였다.
팀원들에게 해야 될 일들을 지정하고, 줌과 슬랙에서 회의를 주도하고, 목표에 멀어지지 않도록 관리하면서 팀장으로서 해야할 작업들에 충실했다. 동시에 팀원으로서도 subway EDA와 피처 엔지니어링, 모델링 등 여러 작업을 수행했다.
Haversine 방식으로 거리측정 코드를 짜서 지하철, 공원, 학교, 아파트 등 거리기반 피처들을 생성했다. 그외에도 recent_deposit, ARIMA, Rank 등 다양한 피처들을 생성했다. Light GBM 모델링 작업을 하면서 피처 선택과정을 진행했고, 스태킹과 가중평균 앙상블 작업을 시도해 모델의 성능을 개선했다.
지난 프로젝트에 비해 초반 EDA 과정부터 좀 더 체계적으로 진행되었으며, 작업 속도가 빨라 지난번에 비해 많은 것들을 시도해보았다. 지난 프로젝트 피드백 때 문제점들을 거의 다 반영해 프로젝트를 진행할 수 있었다. 온라인 프로젝트인만큼 방향을 잡아주는 역할이 중요하다는 것을 깨달았다.
EDA는 각자 파트를 맡아서 분업 후 토론을 통해 합치는 과정을 했고, 저번 프로젝트보다 데이터에 대한 이해가 좀 더 깊게 이루어졌다. 그리고 github issue에 discussion으로 아이디어를 남겨, 자칫 잊혀질 수 있었던 다양한 시도들을 할 수 있었다.
스태킹 방식으로 앙상블을 시도해 다양한 모델을 시도해볼 수 있었다.
EDA는 각자 파트를 나누다 보니 다른 사람이 맡은 데이터에 대한 이해가 부족했다. 그리고 issue의 discussion도 기록이 남은 것은 좋았지만, 정작 줌과 슬랙에서 토론을 진행해서 토론에 대한 과정이 남지 않는 것은 아쉬웠다.
스태킹 방식은 시도는 해보았지만, output이 최종 결과물로 낼 수준이 아니었다. 시간이 좀 더 있었다면 정교한 작업을 통해 좋은 결과물을 뽑아낼 수 있었을텐데 아쉬웠다.
EDA 분업 전 전체 데이터에 대한 이해를 확실히 하고 분업으로 넘어가는 방식을 시도할 것이다. 그리고 줌과 슬랙에서 진행되는 토론을 github issue에도 코멘트를 남기는 방식으로 기록을 남길 수 있게 할 것이다.
스태킹 방식도 조금 더 일찍 시도해서 기본모델을 트리모델로만 구성하지 않고 다양한 모델을 사용해, 앙상블을 통한 좋은 결과물을 얻어볼 것이다.