이미지 예측 성능 향상
- 네트워크 구조 정의
- 데이터 set이 적을 때 전이 학습 적용한다.
- Early Stopping은 학습 과정에서 적용한다.
- 규제는 과적합 후 적용한다.
과적합 확인
클래스 가중치 적용
class_weights = class_weight.compute_class_weight('balanced',np.unique(train), train)
- 다진 분류의 경우 class_weight를 적용하여 class들을 밸런스 있게 만들어준다.
Image Augmentation
SMOTE
- 정형 데이터에서 많이 사용하지만 이미지에서도 많이 사용할 수 있다.
정형 데이터 범주형/수치형 혼합 전처리
| age | workclass | education | gender | hours-per-week | occupation | income |
---|
0 | 39 | State-gov | Bachelors | M | 40 | Adm-clerical | <=50k |
0 | 50 | Self-emp-not-inc | Bachelors | M | 13 | Exec-managerial | <=50k |
0 | 38 | private | Hs-grad | M | 40 | Handlers-cleaner | <=50k |
0 | 53 | private | 11th | M | 40 | Handlers-cleaner | <=50k |
간단 ver
ct = CloumnTransformes(
[("scaling", StandardScaler(), ['age', 'hours-per-week']),
("onehot", OneHotEncoder(sparse = False), ['workclass', 'education', 'gender', 'occupation'])
- 범주와 수치 처리를 나누어 계산한다.
- 범주는 one-hot encoding / 수치는 z-score
- age의 평균과 표준편차가, hours-pre-week의 평균과 표준편차가 다르기 때문에 zscore 해주는 게 좋다.
복잡 ver