fit()
과 transform()
의 역할fit()
: 데이터를 보고 기준(평균, 표준편차 등)을 학습.transform()
: 학습된 기준을 사용해 데이터를 변환.fit()
하면 평가 왜곡.fit()
하는 경우훈련 데이터와 테스트 데이터를 서로 다른 기준으로 변환하게 됨.
→ 테스트 데이터에 "정답 힌트"를 주는 것과 동일.
→ 모델이 과적합되고, 실제 성능을 왜곡해서 높은 점수를 부여.
(현실에서는 엉망이지만 테스트에서는 우수하게 보이는 상태)
fit()
은 기준을 정하는 과정: 작년 시험을 보고 기준을 설정. transform()
은 기준에 따라 데이터 처리: 올해 시험을 채점.