[기계학습] 딥러닝 최적화

공부·2022년 12월 7일
0

이미지 예측 성능 향상

  • 네트워크 구조 정의
  • 데이터 set이 적을 때 전이 학습 적용한다.
  • Early Stopping은 학습 과정에서 적용한다.
  • 규제는 과적합 후 적용한다.

과적합 확인

  • Validation loss가 커지고 있다.

클래스 가중치 적용

class_weights = class_weight.compute_class_weight('balanced',np.unique(train), train)
  • 다진 분류의 경우 class_weight를 적용하여 class들을 밸런스 있게 만들어준다.

Image Augmentation

SMOTE

  • 정형 데이터에서 많이 사용하지만 이미지에서도 많이 사용할 수 있다.

정형 데이터 범주형/수치형 혼합 전처리

ageworkclasseducationgenderhours-per-weekoccupationincome
039State-govBachelorsM40Adm-clerical<=50k
050Self-emp-not-incBachelorsM13Exec-managerial<=50k
038privateHs-gradM40Handlers-cleaner<=50k
053private11thM40Handlers-cleaner<=50k

간단 ver

ct = CloumnTransformes(
[("scaling", StandardScaler(), ['age', 'hours-per-week']), 
("onehot", OneHotEncoder(sparse = False), ['workclass', 'education', 'gender', 'occupation'])
  • 범주와 수치 처리를 나누어 계산한다.
  • 범주는 one-hot encoding / 수치는 z-score
  • age의 평균과 표준편차가, hours-pre-week의 평균과 표준편차가 다르기 때문에 zscore 해주는 게 좋다.

복잡 ver

profile
리액트

0개의 댓글