post-thumbnail

Section2. N214 로지스틱 회귀

성능 확인큰 데이터 : 2-way holdout작은 데이터 : k-fold cross-validation모델 선택큰 데이터 : 3-way holdout훈련데이터 : 모델을 fit 하는 데 사용검증데이터 : 예측 모델을 선택하기 위해서 예측의 오류를 측정할 때 사용테스트

2022년 5월 26일
·
0개의 댓글
·
post-thumbnail

Section2. N213 릿지 회귀

범주형 자료는 명목형(norminal)과 순서형(ordinal)로 나뉜다.명목형은 onehot encoding으로, 순서형은 ordinal encoding으로 처리 해주면 된다. 다만, onehot 인코딩을 해주면 high cardinality가 될 수 있기 때문에 유

2022년 5월 26일
·
0개의 댓글
·
post-thumbnail

Section2. N212다중선형회귀

train과 test 데이터셋은 분리해야한다. 단순선형회귀와 크게 다를 것은 없고, feature 지정해 줄 때 피쳐를 여러개 넣어주면 된다.r2 score가 -1에 가까울수록 쓰레기, 1에 가까울수록 보물MAE는 단위 유닛이 같으므로 보다 해석이 용이하고, MSE는

2022년 5월 26일
·
0개의 댓글
·
post-thumbnail

Section2. N211단순선형회귀

피쳐가 하나인 예측 모델의 경우 사용할 수 있다. 주로, 예측값과 실제값의 잔차의 제곱합을 최소화하는 OLS로 도출된다. 선형회귀는 보간(interpolate)과 외삽(extrapolate)을 예측하는 데도 도움이 된다. 이 때, 종속변수(y)는 반응변수, 레이블, 타

2022년 5월 26일
·
0개의 댓글
·
post-thumbnail

[ML]호텔 예약 취소 예측하기①

AI 부트캠프를 진행하면서 내가 스스로 결정해서 하는 프로젝트가 시작되었다. Section1에서 하던 것도 물론 재밌었지만, 스스로 예측한다는 느낌보다는 주어진 데이터를 가지고 분석하고 "아마도 잘 팔릴걸요....?"하는 느낌이어서 재미가 없었다. 따라서 이번에 시작

2022년 5월 12일
·
0개의 댓글
·