아직도 부족한 점 투성이지만, git이나 linux command 등 거의 zero base에서 시작했던 것을 생각하면 팀원들 덕에 알게된 것들이 많은 것 같다.
주체적인 의견 제시를 하지 못했던 점이 아쉽다.
진로에 대해 고민이 많았는데, 대회를 하면서 생각보다는 흥미를 느끼게 된 것 같다.
1) 각 이미지 별 바운딩 박스의 개수의 분포 시각화
2) 각 이미지 별 바운딩 박스가 전체 이미지 영역에서 차지하는 비율의 분포 시각화
화면 단에 프로토타입을 표현하는 streamlit이나, 데이터에서 의미있는 정보를 찾아 그래프로 표현하는 과정이 재미있었다.
강의에서 이론으로 배워도 긴가민가 했었는데, 확실히 실습을 해보니까 조금 더 이해가 쉽고 머리에 남는 느낌이다.
아직도 low-level로 가면 모르는 게 투성이지만 그래도 처음과 비교하면 알게 된 점도 많다.
1) Cascade R-CNN + ResNext
2) Cascade R-CNN + SwinTransformer(v1/v2)
3) VFNet + SwinTransformer(v2_large)
4) Centernet + resnet18
5) Yolo v6 + EfficientRep
다양한 모델들과 백본들을 조합해서 실험해볼 수 있었다.
아쉬운 점은, 명확한 이유를 가지고 주체적으로 모델을 선택하지는 못했다는 점이다.
다음 대회에서는 강의나 이전 기수의 git repo를 확인해서 미리미리 모델을 정해보자.
1) cosine annealing
2) cosine restart
3) label_smooth_loss
cosine annealing / cosine restart에 대해 알게 되었고, scheduler를 변경함에 따라 눈으로 val mAP50 그래프의 흐름을 파악할 수 있었다.
label_smooth_loss가 mmdec에 없었기 때문에 mmcls에서 가져왔다.
그 과정에서 다양한 에러메시지에 대응하여 필요한 파일들을 수정해서 실험에 성공했다.
하지만 성능향상이 없었다는 점이 아쉽다.