Train, Validation set Split 방법 관련

이경봉·2023년 5월 6일
0
post-thumbnail
post-custom-banner

멘토님이 말씀해주신 프로필 별 split관련해서 wandb log로 남겨 보았음.
실행 시 --dataset 파라미터를 각각의 Dataset class 이름으로 바꾸면 해당 데이터 셋으로 훈련 가능

MaskBaseDataset (random)
python train.py --augmentation AlbumAugmentation --model efficientnetv2_rw_m --criterion focal --name MaskBaseDataset --log_interval 30 --optimizer Adam --wdb_on True --dataset MaskBaseDataset --epochs 20

MaskSplitByProfileDataset(프로필 별 train, valid set randomsplit)
python train.py --augmentation AlbumAugmentation --model efficientnetv2_rw_m --criterion focal --name MaskSplitByProfileDataset --log_interval 30 --optimizer Adam --wdb_on True --epochs 20

Train Loss / Accuracy

Validation Loss / Accuracy

Leaderboard Score


profile 별 splitdataset을 썼을 때 리더보드 점수가 향상되는 효과를 보았다. 기존의 방법 사용 시 같은 인물의 사진이 train, validset 모두에 포함되어 사실상 검증 단계의 의미가 없어지는 split 방식이였다.

profile
👏안녕하십니까! 개발자, 데이터 분석가, AI 리서쳐를 꿈꾸는 이경봉 입니다. 항상 발전하며, 팀원들, 고객들과 끊임없이 소통하는 말 많은 개발자가 되는 것이 목표입니다!
post-custom-banner

0개의 댓글