모든 변환기에서 스케일링은 (테스트 세트가 포함된) 전체 데이터가 아니고 훈련 데이터에 대해서만 fit() 메서드를 적용해야 함. 그런 다음 훈련 세트와 테스트 세트(그리고 새로운 데이터)에 대해 transform() 메서드를 사용해야 함.
테스트 데이터에 fit() 메서드를 사용하면 훈련 세트에서 fit 했던 기준과 또 다른 기준이 적용되기 때문임
훈련 데이터 : fit -> transform
테스트 데이터 : transform
출처
https://www.inflearn.com/questions/19038