멘토님이 말씀해주신 프로필 별 split관련해서 wandb log로 남겨 보았음.
실행 시 --dataset 파라미터를 각각의 Dataset class 이름으로 바꾸면 해당 데이터 셋으로 훈련 가능
MaskBaseDataset (random)
python train.py --augmentation AlbumAugmentation --model efficientnetv2_rw_m --criterion focal --name MaskBaseDataset --log_interval 30 --optimizer Adam --wdb_on True --dataset MaskBaseDataset --epochs 20
MaskSplitByProfileDataset(프로필 별 train, valid set randomsplit)
python train.py --augmentation AlbumAugmentation --model efficientnetv2_rw_m --criterion focal --name MaskSplitByProfileDataset --log_interval 30 --optimizer Adam --wdb_on True --epochs 20
profile 별 splitdataset을 썼을 때 리더보드 점수가 향상되는 효과를 보았다. 기존의 방법 사용 시 같은 인물의 사진이 train, validset 모두에 포함되어 사실상 검증 단계의 의미가 없어지는 split 방식이였다.