[기계학습] 딥러닝 최적화

공부·2022년 12월 7일

이미지 예측 성능 향상

네트워크 구조 정의
데이터 set이 적을 때 전이 학습 적용한다.
Early Stopping은 학습 과정에서 적용한다.
규제는 과적합 후 적용한다.

과적합 확인

Validation loss가 커지고 있다.

클래스 가중치 적용

class_weights = class_weight.compute_class_weight('balanced',np.unique(train), train)

다진 분류의 경우 class_weight를 적용하여 class들을 밸런스 있게 만들어준다.

Image Augmentation

SMOTE

정형 데이터에서 많이 사용하지만 이미지에서도 많이 사용할 수 있다.

정형 데이터 범주형/수치형 혼합 전처리

age	workclass	education	gender	hours-per-week	occupation	income
39	State-gov	Bachelors	M	40	Adm-clerical	<=50k
50	Self-emp-not-inc	Bachelors	M	13	Exec-managerial	<=50k
38	private	Hs-grad	M	40	Handlers-cleaner	<=50k
53	private	11th	M	40	Handlers-cleaner	<=50k

간단 ver

ct = CloumnTransformes(
[("scaling", StandardScaler(), ['age', 'hours-per-week']), 
("onehot", OneHotEncoder(sparse = False), ['workclass', 'education', 'gender', 'occupation'])