Fund. 11. Sklearn 둘러보기

나융·2021년 9월 27일

aiffel

목록 보기

2/12

Dataset split

데이터 가공 ETL 과정 - 모델 훈련 - 결과 예측
Train_test_split() 함수를 이용하면, train, val, test 데이터를 쉽게 분리-제작할 수 있다
추가로 random, batch 옵션도 추가할 수 있음
추후에 Pipeline 만드는 작업 방식에 유용하게 사용할 수 있을 것 같다

-transformer()
-Exstimator
+-fIt()
+-predict()
-pipeline()

Sklearn workflow

데이터셋 불러오기

Train, Test 나누기

학습하기

예측하기

정확도 확인하기

꼭 sklearn 에 국한하지 않더라도 이 흐름에 맞춰 작업을 진행하고, 완성도를 파악하는데 도움이 될 것같다.

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

새롭게 알게 된 것들

교육 과정 이전에 이미 책으로 배운 것들 인데도 자주 사용하지 않으니 머릿속에 저장되지 않은 것 같다.\
SkLearn은 머신러닝에 관련된 라이브러리라고 생각했는데, 유용한 함수가 많아 기억해둬야할 것 같다

한주의 회고

아직 어려운 내용 보다는 이미 알고있는 내용들이나, 쉽게 기억할 수 있는 내용들이 대부분이다
새로운 정보를 듣고 자세하게 조사하고, 빠르게 구현하는 연습을 많이 하고싶다는 생각이 들었음

다음주의 다짐

노드를 따라가지만 말고, 내용보다 더 많은 시도를 해보싶다
작업 환경이 아직 확실히 고정되지 않은 듯, IDE 세팅도 좀더 빠르게 할 수 있도록 추가적으로 공부해볼 생각임

딥러닝 한발짝

이전 포스트

[ DeepML-CS231n ] Lec.03 Loss functions and optimization

다음 포스트

Fund. 14 딥러닝과 신경망의 본질

0개의 댓글