음악 분류 딥러닝을 만들자(9) - 모델 선정

응큼한포도·2024년 7월 4일
0

VIT - 큰 테이터 셋에 적합하고 비용이 커서 경량화랑 잘 안 맞음 -> 탈락

CNN + VIT 혼합 모델 중에서 MobileVit, TinyVit 고려

CNN 경량화 모델과 경량화 혼합 모델 2개를 선정하여 성능비교

CNN 경량화 테크닉

  1. pruning
  2. quantization
  3. distillation
  4. 경량화 아키텍처

pit는 경량화 모델에서 탈락

프루닝을 실시하면 이미 여러 신경망과 weight를 버리므로 dropout ratio는 작게 할 것

mobile-net이나 effienct-net 이 적합해 보인다.

모델 선정과 계획

1. mobileNet 선택

2. pruning, quantization등의 최적화 후 모델 성능 비교

3. 클래스 증가 후 파인튜닝

4. 추가적으로 적용할 기법 실험

5. 이 모든 건 객체지향적으로

트랜스포머 안 하는 이유

트랜스포머, vit 최신 기법이고 혁명 적인 건 알겠는 데 관련 논문을 살펴본 결과 기본적으로 데이터셋의 스케일은 M, FLOPs이나 parameter의 수는 B 이었던 것 같다. 최신 논문은 모르겠는데 일단 트랜스포머는 대규모에서 효과적이고 기업에서 gpu 10대씩 써서 일주일 동안 학습하더라

당연히 m2 깡통 맥북으론 안되지 그래서 탈락임. 아무리 좋고 최신의 기술이여도 목적에 안 맞는다.

profile
미친 취준생

0개의 댓글