아무리 예측모델이라고 해도 꽤나 중요한 점은 모델도 맞지만 데이터 전처리다.
기존 데이터에서의 특성을 새롭게 조합하여 새로운 특성을 만들거나, 차원축소 등의 데이터 전처리, 또는 필요없는 데이터를 지울 수 있다. corr을 통해 상관계수를 파악하여 0에 가까운 상관성이 없는 것들을 지우고 train 과 test에서의 차이를 비교하여 조금더 의미있는 특성들을 만들거나 남기는 것이 데이터 전처리의 목표이다.