머신러닝은 기본적으로 다항회귀(다양한 경우의 수)를 위해 존재.
변수의 모든 경우의 수를 사용해 분석 결과를 도출.
피처(독립변수), 레이블(종속변수)가 2차 함수 이상의 관계를 가지며 변수량이 많아 수 많은 경우의 수를 모두 도출하는 만큼 복잡.
모델 학습에서 2차항(제곱항)을 추가하는 것이 통제요인(더미변수)을 생성하는 것보다 전반적으로 긍정적.
(T-검정, ANOVA)
분석모델 성능과 설명력을 높이려면 학습, 검증 데이터를 분리하지 않고 모델을 생성.
(단, 정확성 확인은 불가 -> 논문을 위한 분석모델)
reshape를 사용해 numpy의 차원(배열)을 바꿀 수 있음.
그래프의 파라미터는 1차원 형식으로 입력해야하기 때문.
파이썬의 모든 추세선은 직선 방정식 -> 다항회귀를 위해서는 직접 생성해야함.
최대한 촘촘하게 생성해야 부드러운 곡선이 생성됨.
머신러닝은 pvalue, vif 등을 수동으로 계산해야함.