[Daily report] 25-08-06

kiteday·2025년 8월 6일
0

Daily report

목록 보기
61/67
  • Hybrid Global-Local Representation with Augmented Spatial Guidance for Zero-Shot Referring Image Segmentation
    zero-shot으로 training 없이 segmentation을 하는 모델. CVPR2025 논문으로 특히 RIS(Referring in segmentation, 텍스트로 지정할 영역을 입력으로 주는 방식)부분에 대한 연구이다. local branch와 global branch를 (각 branch는 transformer block을 쌓은 것) 주어서 특징을 추출하고 병합하는 방식이다. seg 모델은 SAM 이후로 끝난 줄 알았는데 제로샷 seg 모델 흥미롭다. 특히나 모델 자체 구조보다 이를 입증하기 위한 실험 방식들이 눈에 들어온다.
  • Multimodal Referring Segmentation: A Survey
    앞서 적은 논문의 분야인 Referring Segmentation의 서베이 논문. 서베이 논문을 이해하는 것으로 이쪽분야에 대한 지식 확장을 시작해도 좋을 듯.
  • PixNerd: Pixel Neural Field Diffusion
    저레벨에서 조금씩 키워서 이미지를 만드는 것이 아닌, 처음부터 큰 이미지를 생성하는 방식의 모델이다. Diffusion transformer라는 핵심 구조가 모델에 있는데 ViT의 일종인 SiT가 들어간 게 핵심인 듯 싶다. 흥미롭다.
profile
공부

0개의 댓글