Efficient Frequency Domain-based Transformers for High-Quality Image Deblurring

JHSIM·2025년 3월 8일

논문 원본 링크

  • 주제 : image deblurring
  • 한줄 요약 : FSAS(주파수 기반 자기-어텐션), DFFN(판별적 주파수 FFN)와 비대칭 구조(an asymmetrical network)을 활용한 Transformer 기반 이미지 디블러링 기법을 제안함.

Abstract

  • the properties of Transformers in the frequency domain 에서 image deblurring 방법을 다룸.
  • 이 방법은 the convolution theorem에서 동기를 받음.
  • 이것으로 an efficient frequency domain-based self-attention solver (FSAS)을 개발함 : the scaled dot-product attention by an element-wise product operation.
  • the naive feed-forward network (FFN) in Transformers로는 좋은 결과를 얻지 못함.
  • effective discriminative frequency domain-based FFN (DFFN)을 제안함.
  • FSAS and DFFN into an asymmetrical network 제안함.
  • 최신 기술(the state-of-the-art)에 비해 우수한 성능을 얻음.

* the convolution theorem : the correlation or convolution of two signals in the spatial domain is equivalent to an element-wise product of them in the frequency domain

Conclusion

  • the convolution theorem 을 기반으로 효율적이고 효과적인 방법을 제안함.
  • an efficient frequency domain-based self-attention solver (FSAS) 을 개발함.
  • the spatial complexity와 the computational complexity이 상당히 줄어듬.
  • a DFFN을 제안함.
  • an asymmetrical network 을 개발함.
  • 정확도(accuracy)와 효율성(efficiency) 측면에서 최신 기법(state-of-the-art) 대비 우수한 성능을 보임

0개의 댓글