Day48

김재현·2023년 7월 26일

JUPYTER/DL/ML

목록 보기
25/73

연습문제 풀이2

명목형 데이터를 선정하면 그래프가 극단적으로 나옴. 즉, 분석에 용이하지 않은 형태로 생성

분석을 할 때마다 표준화를 진행하고 많아지는 DF의 변수 값을 나눌 때 생성하는 변수 자체와 상태를 구분하기 위해 코딩 규칙(컨벤션)을 생성
ex) 분석용 독립변수는 x_train, 분석용 종속변수는 y_train/ 표준화한 독립변수는 x_train_std, 표준화한 종속변수는 y_train_std

pca 분석은 데이터 표준화 후 진행
머신러닝의 학습 시간과 성능의 개선을 위해 표준화 진행


회귀분석

명목형 데이터

회귀분석은 되도록 명목형은 미포함한다. 다만, 명목형 변수가 종속 변수에 유의미한 영향(차이)을 보일 경우 통제요인(더미변수 또는 이진변수)으로 포함 가능. 이럴 경우 차원 축소를 진행할 경우 제외시키면 안됨.


0개의 댓글