EDSR

"Enhanced Deep Residual Networks for Single Image Super-Resolution"

EDSR 모델은 NTIRE 2017 SISR challenge에서 우승한 서울대 팀이 제안한 모델로써, 총 2개의 새로운 네트워크 구조(EDSR, MDSR)를 제안했는데 2개의 네트워크 모두 상당히 좋은 성능을 보여 주었음.
서울대 팀은 2016년 말에 Twitter 연구팀에서 제안했던 SRResNet이라는 네트워크 구조에서 불필요한 요소(ex : Batch Normalizaion)들을 제거하고, depth를 더 깊이 쌓음으로써 네트워크의 성능을 더욱 끌어올릴 수 있었음.

[Abstract]

EDSR의 큰 특징 4가지

  • 첫째, 가장 흔하게 사용되는 ReLU를 사용하였음.
  • 둘째, L1 Loss를 사용하였음.
  • 셋째, filter size=3x3, stride=1으로 통일하였음.
  • 넷째, batch normalization을 제거하였음.

[Results]

[EDSR structure]

EDSR에서는 BN(Batch Normalization) layer을 제거하였는데, 이 BN layer 제거함으로써 논문의 저자는 2가지 이익을 얻을 수 있었다고 함.

1) 모델의 유연성

  • BN layer는 feature들을 normalize 함으로써 모델의 유연성을 저하시키므로, 이를 제거하면 모델이 더욱 유연하게 데이터를 학습할 수 있게 됨.

2) GPU 메모리 사용량 감소

  • BN 층은 convolution 층과 동일한 양의 메모리를 소비하기 때문에 이를 제거하면 GPU 사용량이 약 40% 감소하고, 큰 모델에서 더욱 빠른 학습을 할 수 있도록 도와줌.

[참고자료]

https://dydeeplearning.tistory.com/4
https://huni-learning.tistory.com/6
https://blog.lunit.io/2017/09/29/enhanced-deep-residual-networks-for-single-image-super-resolution-winner-of-ntire-2017-sisr-challenge/

profile
Computer Vision Deep Learning Engineer

0개의 댓글