πμλ νμΈμ. μ€λ μμλ³Ό μ£Όμ λ λ°λ‘ Super Resolution(SR)μ λλ€.
Super Resolutionμ μ΄ν΄μνλΌκ³ νκ³ , μ΄λ μ ν΄μλ μμμ κ³ ν΄μλ μμμΌλ‘ λ³νν΄μ£Όλ κ³Όμ μ λλ€. μμμ ν΄μλκ° μ’μμλ‘ κ·Έ μμμ μμ²νλ μ¬λλ€μ λ§μ‘±λκ° μ’μμ λ°μ μκ² μ£ ? λ°λΌμ SRμ μ»΄ν¨ν° λΉμ Ό λΆμΌ μ€ λ§€μ° μ€μ©μ μΈ λΆμΌ μ€ νλλ‘ λ½νκ³ μμ΅λλ€.
κ·Έλ¦Ό1. μ νμ§ μ΄λ―Έμ§ κ³ νμ§ μ΄λ―Έμ§ λ³ν
λ₯λ¬λμ ν΅ν SRμ΄ λ±μ₯νκΈ° μ μλ λ°μ΄νλΉ λ³΄κ°λ²κ³Ό κ°μ λ€νμ κΈ°λ°μ 보κ°λ² νΉμ μ ν 맀νμ μ¬μ©νλ λ‘컬 ν¨μΉκΈ°λ°μ μ΄ν΄μν κΈ°λ²λ€μ΄ λ리 μ°κ΅¬λμμ΅λλ€. μ΄λ¬ν λ°©λ²λ€μ μλμ μΌλ‘ μ μ 볡μ‘λμ μ°μ°λμΌλ‘ κ³ νμ§μ μμλ€μ μμ±ν΄ λΌ μ μμμ΅λλ€. νμ§λ§ μ΄λ¬ν λ°©λ²λ€μ λ¨μν μ ν 맀νμ κΈ°λ°μΌλ‘ νκΈ° λλ¬Έμ, 볡μ‘νκ³ λΉμ νμ μΈ μ ν΄μλ-κ³ ν΄μλ λͺ¨λΈμ ꡬννκΈ° μ΄λ ΅λ€λ λ¨μ μ΄ μ‘΄μ¬νμ΅λλ€.
ν΄λΉ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ CNNκΈ°λ°μ μ΄ν΄μν μκ³ λ¦¬μ¦λ€μ΄ λ±μ₯νκΈ° λμμ΅λλ€. μ΄λ μ¬λ¬κ²ΉμΌλ‘ μμ λ€μΈ΅ λ€νΈμν¬λ₯Ό μ¬μ©νμ¬ λΉμ νμ κ΄κ³λ₯Ό μ λ°νκ² λΆμνμ¬ μ ννκ² λ³νν μ μλ ν©μ±κ³± νν°λ₯Ό νμ΅ν©λλ€.
νΉν μ΄λ¬ν λ₯λ¬λ κΈ°λ° Image Classificationμ ν° μ±λ₯μ λ³΄μΈ ResNetμμ μκ°μ μ»μ΄ Residual Learningμ μ΄μ©νμ¬ λ³΄λ€ κΉμ λ€νΈμν¬λ₯Ό ν¨μ¨μ μΌλ‘ νμ΅ μν¬ μ μμμ΅λλ€.
μΌλ°μ μΌλ‘ κΉμ λ₯λ¬λ λͺ¨λΈλ‘ κΉμ λ€νΈμν¬λ₯Ό μ€κ³νλ€λ©΄ μ°μ°λμ΄ λ§μμ§κ³ , νλΌλ―Έν° μκ° μ¦κ°νκ² λ©λλ€. νμ§λ§ κΉμ λ€νΈμν¬λ₯Ό νμ΅ μ μμ ν(back propagation)μ μ
λ ₯μΈ΅μΌλ‘ κ° μλ‘ κΈ°μΈκΈ°(Gradient)κ° μμμ Έ κ²°κ΅ κΈ°μΈκΈ°κ° μμ€λλ Gradient Vanishing νμμ΄ λ°μνκ±°λ λ°λλ‘ κΈ°μΈκΈ°κ° λ§€μ° μ»€μ Έμ λ°μ°νλ Gradient Exploding λ¬Έμ κ° λ°μνμ¬ λ€νΈμν¬μ νμ΅μ΄ μ λλ‘ λμ§ μμ μ μλ λ¬Έμ κ° μμ΅λλ€.
μ΄λ¬ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ EDSRμ ν¬κ² λκ°μ§ λ°©λ²μ μ¬μ©νμ΅λλ€. 첫λ²μ§Έλ μμ¬νμ΅(Residual Learing)μ΄κ³ , λλ²μ§Έλ SPCNN(Sub Pixel Convolutional Neural Network)μ
λλ€.
μμ¬ νμ΅μ΄λ μ
λ ₯ LR μμμ μ΅μ’
μΆλ ₯ HR μμμ λν΄μ£Όκ³ λ μμμ μ°¨μ΄ κ°μ νμ΅νλ λ°©λ²μ
λλ€. μΌλ°μ μΌλ‘ μ
λ ₯ LR μμκ³Ό μΆλ ₯ HR μμμ λΉμ·νκΈ° λλ¬Έμ κ·Έ μ°¨μ΄ κ°μ λ§€μ° μκ±°λ 0μ΄λ―λ‘ κΈ°μΈκΈ° μμ€/νμ£Ό λ¬Έμ λ₯Ό ν΄κ²°ν μ μμλ€.
EDSRμ 32κ° μ΄μμ μΈ΅μ μ¬μ©νμκ³ μ±λ μλ κΈ°μ‘΄μ λ€λ₯Έ λ€νΈμν¬ λλΉ 4λ°° μ΄μ λλ € νλΌλ―Έν° μλ κ·Έμ λΉλ‘νμ¬ λ§€μ° λ§μ΄ μ¦κ°νμμ΅λλ€. μ΄λ κΉμ΄μ§ λ€νΈμν¬λ₯Ό λ³΄λ€ μμ μ μΌλ‘ νμ΅νκΈ° μν΄ λ€νΈμν¬λ₯Ό μμ¬ λΈλ‘(Residual Block) λ³λ‘ λλκ³ κ°κ°μ μ€ν΅ 컀λ₯μ
(Skip Connection)μ μ¬μ©ν΄ μ°κ²°νλ©° νν° νλΌλ―Έν°λ€μ΄ λ μ½κ² μ΅μ νλλλ‘ λ€νΈμν¬λ₯Ό μ€κ³νμμ΅λλ€.
λν EDSRμμλ μ κ°κ°μ μμ¬ λΈλ‘ μμμ feature mapλ€μ΄ λν΄μ§λ©΄μ feature mapλ€μ λΆμ°μ΄ 컀μ§λ κ²½μ°κ° μ겨 νμ΅μ΄ μ μλλ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μΌμ ν μμ κ°μ CNN μΈ΅ μ΄νμ κ³±ν΄μ£Όλ Multi μΈ΅μ μΆκ°νμμ΅λλ€.
EDSRμμλ SPCNN(Sub Pixel Convolutional NeuralNetwork)μ μ¬μ©ν΄ νμ΅κ³Όμ μμ μ λ ₯ LR μμμ ν΄μλλ₯Ό ν€μ μ΅λλ€. SPCNNμ μ¬μ©νλ€λ©΄ CNNμΈ΅μ κ±°μΉ λ€ λ§μ§λ§ μΈ΅μμ feature mapμ κ°μλ₯Ό μ μ€μΌμΌλ§ λ°°μμ μ κ³± κ°λ§νΌ λλ €μ€ λ€ μ΄λ₯Ό ν½μ μ ν(Pixel Shuffle) μ°μ°μ ν΅νμ¬ μ μ ν λ°°μΉνμ¬ μνλ ν΄μλμ μΆλ ₯ HR μμμ 볡μν΄λΌ μ μμ΅λλ€. μ΄λ κΈ°μ‘΄ λ°μ΄νλΉ λ³΄κ°λ²μ μ¬μ©ν΄ μ λ ₯ LR μμμ ν΄μλλ₯Ό ν€μ°κ³ λ€νΈμν¬μ μ λ ₯ν κΈ°μ‘΄ VDSR(μ²μμΌλ‘ μμ¬νμ΅μ μ¬μ©ν¨) λλΉ ν¨μ¨μ μΈ μ°μ°μ΄ κ°λ₯νκ³ λ€νΈμν¬ μ νλ λν λμμ‘μ΅λλ€.
EDSRμ μ½λλ λ€μ μ¬μ΄νΈμμ νμΈ ν μ μμΌλ©°, Super Resolution taskμμ μ¬μ©λλ λ°μ΄ν° μ
μΈ DIV2K λ°μ΄ν°μ
μ νμ΅μν€κ³ ν
μ€νΈνκΈ° μν μ½λμ΄λ€.
EDSR μ½λ λ³΄λ¬ κ°κΈ°