이번 프로젝트는 여러가지 의미로 참 우여곡절이 많았다.🫠
일단 처음 시작할 때 깊게 생각하지 않고 구현 모델을 정했던 것이 가장 큰 문제였던 것 같다.
이번 프로젝트 주제에서는 큰 성능을 기대할 수 없는 모델이었는데, 한 번 구현해봐야겠다는 가벼운 마음으로 시작했다가 3주동안 그 모델만 붙잡고 있게 될 줄은 몰랐다.
내가 3주 동안 붙잡고 있던 모델은 DeepFM으로, 메타 데이터를 활용하는데 특히 강점이 있는 모델이었다. 이번 프로젝트 주제가 Movie Recommendation으로 Top-k 추천이 목표인 프로젝트였기 때문에 General Model, Sequential Model 등 메타 데이터를 활용하지 않는 모델이 많아서, 메타 데이터를 활용하는 모델을 구현하여 앙상블이나 하이브리드 모델을 통해 두 결과값을 조합하여 성능 개선을 시도해보고 싶었다.
내가 간과했던 부분은 DeepFM은 CTR 예측과 관련된 모델이기 때문에 Top-K 문제 해결에 그다지 좋은 성능을 보이는 모델은 아니라는 점이었다.😭
결국 3주 동안 붙잡고 있었지만 눈에 띄는 개선을 달성하지 못하고, 남은 시간이 짧아서 MF 모델 구현을 진행했다.
MF 모델은 비교적 구조가 단순한 모델이기 때문에 MF 모델의 ALS 연산 과정에서 아이템 연산을 진행할 때 영화 제목과 장르를 텍스트로 만들어 이를 TF-IDF 벡터로 만든 후 이를 반영하는 방식으로 메타 데이터를 반영해보고자 했고, 눈에 띄는 개선은 아니었지만 미약하게 성능이 오른 것을 확인할 수 있었다.
이번 프로젝트를 진행하며 확실하게 느낀 것은, 프로젝트 진행 내용과 방향성을 정할 때 해결하고자 하는 목표와 가설을 명확하게 정하고, 이를 달성하기 위한 방향으로 모든 것을 진행해야 한다는 것이다.
우여곡절이 많았던 만큼 힘든 부분도 많았지만, 가장 큰 교훈을 얻어가는 프로젝트였던 것 같다.
🚩프로젝트, 강의를 통해 학습한 내용 정리