이 글은 기본적으로 머신러닝 이론/실습 책인 《파이썬 머신러닝 완벽 가이드》의 내용을 바탕으로 작성되었으며, 이외에도 다양한 자료를 참고하였습니다.실습 데이터: 캐글 타이타닉 데이터사이킷런의 머신러닝 모델은 일반적으로 문자열 값을 인식하지 못합니다. 따라서 모든 문자열
실습 데이터: 캐글 타이타닉 데이터 데이터 스케일링(Data Scaling)이란 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업을 의미합니다. 값을 조정하는 과정이기 때문에 수치형 변수에만 적용해야 합니다.사이킷런에서는 스케일링을 수행하기 위한 다양한 스케일러
교차 검증(Cross Validation)은 별도의 여러 세트로 구성된 학습 데이터와 검증 데이터 세트에서 학습과 평가를 수행하는 것입니다.교차검증을 통해 각 세트에서 수행한 평가 결과에 따라, 이후 하이퍼 파라미터 튜닝 등의 모델 최적화를 더욱 쉽게 할 수 있습니다.