피쳐가 하나인 예측 모델의 경우 사용할 수 있다. 주로, 예측값과 실제값의 잔차의 제곱합을 최소화하는 OLS로 도출된다. 선형회귀는 보간(interpolate)과 외삽(extrapolate)을 예측하는 데도 도움이 된다. 이 때, 종속변수(y)는 반응변수, 레이블, 타
train과 test 데이터셋은 분리해야한다. 단순선형회귀와 크게 다를 것은 없고, feature 지정해 줄 때 피쳐를 여러개 넣어주면 된다.r2 score가 -1에 가까울수록 쓰레기, 1에 가까울수록 보물MAE는 단위 유닛이 같으므로 보다 해석이 용이하고, MSE는
범주형 자료는 명목형(norminal)과 순서형(ordinal)로 나뉜다.명목형은 onehot encoding으로, 순서형은 ordinal encoding으로 처리 해주면 된다. 다만, onehot 인코딩을 해주면 high cardinality가 될 수 있기 때문에 유
명확한 정의는 없으니, 스스로를 잘 브랜딩 하자. 특성 기술을 할 줄 아는 사람으로 인지되는 걸 지양하자. 요새는 너무 많음.스토리가 필요하다. 과거의 직무.기승전결 중 기와 결이 중요. 어떤 데이터를 분석했는지는 필요 없음.어떤 문제를 가졌고, 어떤 문제를 풀었고 어