프로젝트 4 (bike sharing)

김찬울·2021년 8월 17일

아무리 예측모델이라고 해도 꽤나 중요한 점은 모델도 맞지만 데이터 전처리다.

기존 데이터에서의 특성을 새롭게 조합하여 새로운 특성을 만들거나, 차원축소 등의 데이터 전처리, 또는 필요없는 데이터를 지울 수 있다.
corr을 통해 상관계수를 파악하여 0에 가까운 상관성이 없는 것들을 지우고 train 과 test에서의 차이를 비교하여 조금더 의미있는 특성들을 만들거나 남기는 것이 데이터 전처리의 목표이다.

데이터 전처리

profile
코린코린이

0개의 댓글