프로젝트 4 (bike sharing)

김찬울·2021년 8월 17일
0

아무리 예측모델이라고 해도 꽤나 중요한 점은 모델도 맞지만 데이터 전처리다.

기존 데이터에서의 특성을 새롭게 조합하여 새로운 특성을 만들거나, 차원축소 등의 데이터 전처리, 또는 필요없는 데이터를 지울 수 있다.
corr을 통해 상관계수를 파악하여 0에 가까운 상관성이 없는 것들을 지우고 train 과 test에서의 차이를 비교하여 조금더 의미있는 특성들을 만들거나 남기는 것이 데이터 전처리의 목표이다.

데이터 전처리

profile
코린코린이

0개의 댓글