Titanic 문제는 머신러닝을 공부한 사람이라면, 누구나 들어봤을 유명한 문제이다.
Github Gist에 코드를 올렸다.
코드 보기
최근에 Kaggle을 시작했지만, 데이터 전처리 부분이 어렵게 느껴진다. 데이터의 NaN부분을 찾고 채우거나 one-hot vector로 인코딩하는 것이 아직 익숙하지 않아 시간이 오래걸렸다.
이번에 어떤 모델을 사용할지 고민했었는데, 첫 Competition인 만큼 어렵게 생각할 필요 없이 단순한 Fully-Connected Network(FCN)을 구성했다. Validation Accuracy는 대략 0.75가 나왔다.
그리고 개인적으로 pytorch보다 keras가 더 편하게 느껴졌다. 앞으로도 계속 Kaggle을 하면서 keras을 사용할 것이다.
앞으로 더 재밌는 Kaggle문제를 푼다는 생각에 신이난다!