데이터 가공 ETL 과정 - 모델 훈련 - 결과 예측
Train_test_split() 함수를 이용하면, train, val, test 데이터를 쉽게 분리-제작할 수 있다
추가로 random, batch 옵션도 추가할 수 있음
추후에 Pipeline 만드는 작업 방식에 유용하게 사용할 수 있을 것 같다
-transformer()
-Exstimator
+-fIt()
+-predict()
-pipeline()
- 데이터셋 불러오기
- Train, Test 나누기
- 학습하기
- 예측하기
- 정확도 확인하기
꼭 sklearn 에 국한하지 않더라도 이 흐름에 맞춰 작업을 진행하고, 완성도를 파악하는데 도움이 될 것같다.
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
교육 과정 이전에 이미 책으로 배운 것들 인데도 자주 사용하지 않으니 머릿속에 저장되지 않은 것 같다.\
SkLearn은 머신러닝에 관련된 라이브러리라고 생각했는데, 유용한 함수가 많아 기억해둬야할 것 같다