241024 TIL #523 AI Tech #56 프로젝트2 마감 및 팀 회고

김춘복·2024년 10월 23일

TIL aitech

TIL : Today I Learned

목록 보기

525/640

Today I Learned

2번째 프로젝트가 드디어 종료되었다.

프로젝트 2 마감

수도권 아파트 전세 실거래가 예측 모델 대회를 오늘로 마감했다.
결과
Public MAE 3483.0271 4등 -> Private MAE 4279.3377 4등
마지막 앙상블 과정에서 가중평균을 써서 점수를 낮춘 것이 유효했다.
바로 아래 순위인 5위와의 MAE 격차가 90인데,
1위와의 격차가 67, 2위와 29밖에 차이가 안나 더 아쉽다.
하이퍼파라미터 조정 할 시간이 조금만 더 있었다면 좋았을 텐데 아쉽다.
그래도 저번 프로젝트보단 인력이 부족한 상황에서 더 좋은 결과를 얻어서 만족한다.
자세한 개인 회고는 내일 작성할 예정.

팀 회고

좋았던 점

Tool 활용 (WandB, server, Git 등)

지난 프로젝트에서 개선점으로 뽑았던 tool 활용을 직접 활용해보고 프로젝트에 긍정적으로 작용함. 향후 상당히 많은 도움이 될 것 같은 시도들이었음

컨벤션 도입

코드 컨벤션, 깃 컨벤션, 팀 컨벤션 도입으로 체계적인 프로젝트 관리가 가능했다.

모델 이해 후 모델링 작업 착수

지난 프로젝트에선 모델 선정 시 큰 고민 없이 선정했었는데, 이번에는 미리 알아보고 모델을 도입해서 좀 더 잘 다룰 수 있었다.

EDA 단계에서 체계적인 분업화와 질서 있는 프로젝트 관리

각자의 아이디어를 서로 논의하며 구체화해 간 과정이 좋았다.

자동화 도입으로 원활한 실험 환경 구축

모듈화 된 코드와 서버에 모델 자동화 파이프라인 구축으로 원활한 모델링 작업이 가능했다.

개선점

Modeling 개선점

마지막 모델링 단계에서 하이퍼파라미터 조정이나 앙상블을 과정을 좀 더 체계적인 방식으로 수정해 기록을 하면서 제출하는 방식으로 개선하면 좋을 것 같다. 하이퍼파라미터 튜닝 단계에서 체계적인 서치 방식을 도입해 튜닝의 근거를 설명 가능하게 꾸리면 좋을 것 같다.
현재보다 조금 더 다양한 모델을 시도해볼 필요가 있다. 특히 딥러닝 모델에 대한 시도가 부족했다.

Feature engineering 개선점

프로젝트 초반 피처 추가 모듈화가 이뤄졌지만 마지막 단계에서 결국 csv 파일 공유로 넘어간 점이 아쉬웠고, modeling을 할 때 Feature 선택의 통일성 및 근거를 갖춰야 할 것 같다.
첫 시작부터 피처를 분담해 분석했기 때문에 데이터에 대한 이해가 지엽적으로 형성된 것 같다.