:Scikit-learn : 다양한 분류, 회귀, 그리고 서포트 벡터 머신, 랜덤 포레스트, 그라디언트 부스팅, k-평균, DBSCAN을 포함한 클러스터링 알고리즘
호출할 때마다 동일한 학습/테스트용 데이터 세트를 생성하기 위해 주어지는 난수. 어떤 값을 넣든 상관없다.
총 6단계
머신러닝2 EDA3 📝 강의안에서 사용한 distplot이 'distplot' is a deprecated function and will be removed in a future version.으로 떠서 hisplot을 이용해 시각화를 해 보았다.
MAE (Mean Absolute Error), MSE (Mean Squared Error), RMSE,,
slover-='liblineaer'
PIMA 인디언 당뇨병 예측 중..
MinMaxScaler(0,1), StandardScaler(평균0, 분산1), RobustScaler(사분위수) 4. feature 선택 추출 및 가공
강의안대로 진행이 되지 않아 따로 공부하여 기록하였다.
이번주는 강의와 코테와 과제 제출로 너무 바빠서 따로 스터디 노트를 정리할 여유가 없었다.대신 아이패드에 따로 정리해 두었던 공부 기록들의 일부를 올려보겠다.
np.array형식으로 집어넣는다!!
🔎 x와 y의 선형관계 파악, sns.regplot
X_train.reshape(-1,1)
🔎 야구선수 최동원 연봉 예측 과제