[학부연구생] CVPR 2023 후기

junhjun·2023년 8월 5일
0

학부연구생

목록 보기
7/7

연구실 세미나에서 CVPR 2023 후기를 들으며 끄적인 내용이다.


참석자 8337명 중 한국인이 815명으로 굉장히 많이 참여했다고 한다.


논문 9155편 중 총 2359편이 채택되었고, 논문 제출 건은 점점 증가하고 있다고 한다.

CV 분야가 이렇게 핫한만큼 논문 채택도 어려울 것 같아 보인다.


Word Cloud for 2023 CVPR accepted paper titles

논문 제목에 쓰인 키워드를 가지고 워드 클라우드를 뽑은 것이라고 한다.

3D, Point Cloud, Diffusion Model 연구가 활발히 진행되고 있는 것 같다.


Models 트렌드

Diffusion, CLIP, NeRF 관련 연구가 굉장히 많아진 듯 하다.

Transformer, Attention, ViT, CNN 은 수치가 감소한 것처럼 보이지만,
이들은 이제 기본 요소, 베이스 라인으로 사용되기 때문에 이렇게 나타난 것 같다고 한다.

  • Diffusion Model : denoising, image editing, style transfer에 유용한 모델
  • CLIP : 이미지 + 텍스트 align 시키는 멀티모달 모델
  • NeRF : 2D 이미지를 3D로 예측하는 모델


Tasks 트렌드

detection, classification, segmentation 등 기존 task들의 인기는 떨어지고 있다.

editing에 대한 증가가 큰 것을 보니, 이미지 생성 분야에 대한 인기가 높아지고 있음을 알 수 있다.

Zero-shot이 떠오르는 추세이지만, 아직까지 Few-shot이 높다.

  • Zero-shot : 학습 데이터 전혀 없이 새로운 클래스를 추론하는 것
  • Few-shot : 제한된 양의 학습 데이터로 새로운 클래스를 추론하는 것


Modalities 트렌드

image, video 등 키워드는 그대로인 반면에, text, language, audio의 빈도수는 꾸준히 상승하고 있다.

CV와 NLP의 경계가 흐려지고, vision-language task가 많이 언급되고 있다고 한다. (CLIP 활용한 멀티모달 연구)


각 분야에서 등장하고 있는 초거대 생성 모델을 어떻게 효율적으로 fine-tuning 해서 사용할 지, 연구하는 것이 요즘 학회의 관심이라고 하셨다.

학회 발표 일정이 있을 때 겸사겸사 다녀오시는 것 같다.

경비를 모두 지원 받으셨다고 하셔서 부러웠다.

영어 공부를 다시 한 번 강조하셨다.

0개의 댓글