😀 이 글을 작성한 이유는
데이터 증강
을 하기 위함이다. 데이터 증강은 훈련시에 더 많은 데이터를 학습하기 위함이며, 정확도 향상을 위해서 많은 데이터는 매우 중요하다. 따라서, 데이터가 부족한 경우, 데이터 증강은 필수적이다.
🔴 결과물 깃허브 코드 업데이트
® https://github.com/yuri0329/mouse_data_augmentation/blob/main/mouse_augmentation_for_image_training.ipynb
🟠 참고
- 데이터 증강에는
torchvision
모듈에서 제공하는 변환기 외에,albumentations
모듈의 변환기도 있다.torchvision
변환기와 비교해 (1) 처리속도가 빠르고, (2) 더 다양한 이미지 변환을 제공한다는 장점이 있다. 또한, (3) 이미지가 변환됨에 따라 box의 위치도 그 변환에 맞춰서 자동으로 조절해주는 기능이 있다.
® [albumentations 모듈 변환기, page 549] https://books.google.co.kr/books?id=7fxpEAAAQBAJ&pg=PA549&lpg=PA549&dq=from+albumentations.pytorch+import+ToTensorV2++%EB%AA%A8%EB%93%88&source=bl&ots=gphfUvStGR&sig=ACfU3U16Hh7big8Stu8WcGWMTRKs0CpywQ&hl=ko&sa=X&ved=2ahUKEwi8po3ClZL6AhVHQPUHHbuhC1YQ6AF6BAgjEAM#v=onepage&q=from%20albumentations.pytorch%20import%20ToTensorV2%20%20%EB%AA%A8%EB%93%88&f=false- [model 구현 프로젝트 과정, 데이터 증강에 대한 설명과 코드도 있음]
® https://visionhong.tistory.com/24- [데이터 증강방법]
® https://leedakyeong.tistory.com/entry/Python-albumentations-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC%EB%A5%BC-%EC%9D%B4%EC%9A%A9%ED%95%9C-Image-Agumentation
🟡 앞으로의 고민
- train dataset은 증강 필요
- test dataset은 데이터 증강 x
- val dataset은 증강에 대한 고민 필요 (실제환경에 있을 법한 것을 가지고, 검증하는 방법도 있음)
- 따라서, val dataset을 어떻게 설계할지에 대한 고민 필요
- 데이터를 부풀릴 때
: 학습시 데이터 부풀림 (data augumentation)
: 테스트 시에 데이터 부풀림 (test time augumentation)
: label noise를 해서 train 할 때, 애매하게 하는게 성능이 좋을 수 있음
: dataset or label에 noise를 넣을 수 있음
🟡 앞으로의 공부
- 영상을 통한 person detection
wall human pose
방법은 조명 관계 없이 wifi를 이용해서 detection 할 수 있음
® Zhao, Mingmin, et al. "Through-wall human pose estimation using radio signals." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018.