CVPR 2020์ accept๋ < MetaIQA: Deep Meta-learning for No-Reference Image Quality Assessment >๋ฅผ ์ฝ๊ณ ์ ๋ฆฌํ ๋ด์ฉ์ด๋ค.
Image์ quality๋ฅผ ํ๊ฐํ๋ ๋ฐฉ์์ ๋ํด์ ๋ฐ์ดํฐ์ reference๊ฐ ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ IQA ๋ฐฉ์ ์ค์์๋ NR(No-Reference) ๋ฐฉ์์ด ๊ฐ์ฅ ๋ง์ด ์ฐ๊ตฌ๋๊ณ ์๋ค๊ณ ํ ์ ์๋ค.
NR ๋ฐฉ์์ IQA ๊ฐ์ ๊ฒฝ์ฐ์๋ ์๊ณก๋ ์ด๋ฏธ์ง์ ์๋ณธ ์ด๋ฏธ์ง๋ฅผ ์ฐธ์กฐํ์ง ์๊ณ quality์ ํ๊ฐํ๋๋ฐ, ์ฒ์ ์ด์ ๊ด๋ จํ ์ฐ๊ตฌ๋ค์ ๋๋ถ๋ถ ํน์ ํ distortion type์ focus๋ฅผ ๋ง์ถ๋ ๊ฒฝํฅ์ด ์์๋ค.
๊ทธ๋์ ์ดํ generalํ ๋ชฉ์ ์ ๋ง๋ NR-IQA์ ์ฐ๊ตฌ๊ฐ ํ๋ฐํด์ก๊ณ , ์ต๊ทผ ๋ค์ด์๋ dcnn(deep convolutional neural networks)๋ค๋ก ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ NR-IQA๊ฐ ์ฐ๊ตฌ๋์๋ค.
ํ์ง๋ง ๊ทธ๋ ๊ฒ ์ฐ๊ตฌ๋ dcnn๊ธฐ๋ฐ์ metric์ด ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์๋ ์ด์ ๋ ๊ต์ฅํ ๋ฐฉ๋ํ parameter๋ค์ด ํฌํจ๋์๊ธฐ ๋๋ฌธ์ด์๊ณ , ์ด ๋๋ฌธ์ ๊ต์ฅํ ๋ง์ ์์, ์ฌ๋์ ์ํด annotation ๋์ด ์๋ ๋ฐ์ดํฐ๋ค์ด ํ์ํ๋ค๋ ํ๊ณ์ ์ด ์กด์ฌํ๋ค. annotation ๋์ด ์๋ IQA database ์์ ํ๊ณ๋ก overfitting์ ๋ฌธ์ ์ ์ด ๋ฐ์ํ์๊ณ , overfitting์ ์ํ์ํค๊ธฐ ์ํด metric๋ค์ด ๋๋ถ๋ถ big training data(ex. ImageNet)๋ฅผ ์ฌ์ฉํ ์ ์๋ pre-trained network์ ์์กด์ ํ๊ฒ ๋์๋ค. ํ์ง๋ง ์ด ๊ฒฝ์ฐ์๋ ๊ทธ๋ ๊ฒ ๋ง์กฑ์ค๋ฌ์ด ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ ธ์ค์ง๋ ๋ชปํ๋ค๊ณ ํ๋ค.
์ด์ ๋ํด ์ด ๋ ผ๋ฌธ์์๋, pretrained๋ ๋ชจ๋ธ์ด IQA task๋ฅผ ์ํด ๋์์ธ๋๊ฑด ์๋๊ธฐ ๋๋ฌธ์ ์๋ก์ด distortion type์ ๋ํด์๋ ์ ์ํ์ง ๋ชปํ๋ค๋ ์ ์์ ์์ ๋งํ ๋ง์กฑ์ค๋ฝ์ง ๋ชปํ๋ ๊ฒฐ๊ณผ๋ ๋น์ฐํ ๊ฒฐ๊ณผ๋ผ๊ณ ์ง์ ํ๋ค.
๊ทธ๋์ ์ด ๋ ผ๋ฌธ์์๋ ์ด๋ฅผ ํด๊ฒฐํ์ฌ ๋ค์ํ distortion์์๋ ์ ํ๋จ์ ๋ด๋ฆฌ๋ Image Quality Metric์ ์ ์ํ๋๋ฐ,
deep meta-learning์ ๊ธฐ๋ฐํ NR-IQA metric |
Brighten, White noise, Motion blur ๋ฑ์ image quality์ ๋ํ ์ฌ์ ์ง์๋ค์ ์ป์ด์ ์ด๋ฅผ ์ด์ฉํ์ฌ ๋ชจ๋ฅด๋ distortion์ ๊ฐ์ง๋ image์ quality์ ๋ํ ํ๊ฐ๋ฅผ ํ๋ ์ฌ๋์ ํ๊ฐ๋ฐฉ์์ motivation ์ผ์ deep meta-learning์ ๊ธฐ๋ฐํ NR-IQA metric์ ์ ์ํ๋ค.
์ ์ฒด์ ์ธ framework๋ ํฌ๊ฒ ๋ ๋ถ๋ถ์ผ๋ก ๋๋ ์ ธ ์๋ค.
์ฆ meta learning ์ค few shot learning์ด ์ด๋ฃจ์ด์ง๊ณ ์์ผ๋ฉฐ, "์ฌ์ ์ง์์ ๊ณต์ ํจ์ผ๋ก์จ" ์ ์ ์์ example๋ง ๊ฐ์ง๊ณ unknown distortion์ ๋ํ NR-IQA model์ด ์ ํ์ตํ ์ ์๋๋ก ํ ๊ฒ์ด๋ค.
์ฒซ ๋ถ๋ถ๋ถํฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์์๋ณด์.
์ด ๋ชจ๋ธ์์๋ meta learning ์ ๊ทผ ๋ฐฉ์์ค optimization์ ๊ธฐ๋ฐํ ๋ฐฉ์์ด ๋์
๋์๋ค.
๋จผ์ ๋ง์ NR-IQA task๋ค๋ก๋ถํฐ quality ์ฌ์ ์ง์๋ค์ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ค์ ํ์ตํ๋ค. ์ด ๋ two level gradient descent method๋ฅผ ์ฌ์ฉํ๋ค. ๋จผ์ ๊ฐ๊ฐ์ NR-IAQ task์ ๋ํ training data๋ฅผ support set๊ณผ query set์ผ๋ก ๋ถ๋ฆฌํ๊ณ , ์ด ๋ level๋ก ์ด๋ฃจ์ด์ง gradient optimization์ bi-level gradient optimization์ด๋ผ๊ณ ํ๋ค๊ณ ํ๋ค.
๊ฐ๊ฐ์ set์ ์ญํ ์ ๋ค์๊ณผ ๊ฐ๋ค.
์ด "bi-level gradient optimization์ ๊ธฐ๋ฐํ meta learning ๋ฐฉ๋ฒ"์ด quality score์ ๋ฝ์๋ด๋ regression network์ ์ ์ฉ๋๋ ๊ฒ์ด๋ค.
์ด๋ฅผ ์ข ๋ ์์ธํ ์์๋๋ก ์ดํด๋ณด์.
๋จผ์ support set, query set์ ์๋ก ๊ฒน์น์ง ์๋๋ก ์ด N๊ฐ๋ก ๊ตฌ์ฑ๋ meta training set์ ๋ํด์ k task๋ค์ mini-batch๋ก ๋๋ค ์ํ๋งํ๋ค.
mini-batch ์์ ๊ฐ๊ฐ์ Support set์ ๋ํด ์์ธก๊ฐ๊ณผ ground truth์ธ quality score์ ์ฐจ์ด๋ก loss๋ฅผ ๊ณ์ฐํ๊ณ
support set์ ๋ํด์ Adam optimizer์ ์ฌ์ฉํด์ loss๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก optimizeํ ๊ฐ์ ๊ณ์ฐํ๋ค.
๋ค์ query set์ ๋ํด์ ๋์ผํ๊ฒ Adam optimizer์ ์ฌ์ฉํด์ loss๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก optimizeํ ๊ฐ์ ๊ณ์ฐํ๋ค.
=> k task์ ๋ํ mini-batch์ ๋ํ ๊ฐ์ด ๊ณ์ฐ๋์ด ๋์ค๊ณ ๊ทธ ์ต์ข
์ ์ธ ๊ฐ์ด update๋๋ ๋ฐฉ์์ด๋ค.
์ด๋ฅผ ๊ณ์ํด์ minibatch๋ก samplingํ๋ฉด, k๊ฐ์ ๋ค์ํ task์ ๋ํด image distortion์ ๊ณต์ ํ๋ quality prior model์ด ์ป์ด์ง๊ฒ ๋๋ค!
๋ค์์ผ๋ก quality prior model์ด ํ์ต๋๊ฒ ๋๋ฉด, ์ด ๋ชจ๋ธ์ unknwon distortion์ ๋ํ NR-IQA task์ fine-tuning์ ์ํ ์ฌ์ ์ง์์ผ๋ก ์ฌ์ฉ๋๋ค. m๊ฐ์ annotated quality score์ ๊ฐ์ง๋ ์ ์ ์์ training image๊ฐ ์ฃผ์ด์ง๋ฉด,
์ด๋ฌํ loss function์ ์ฌ์ฉํด์ ๋จผ์ loss๋ฅผ ๊ตฌํ๊ณ
์ฌ์ ์ prior model์ Adam optimizer ์ด์ฉํ์ฌ optimizeํ๋ค.(์ฆ, fine-tuningํ๋ค!).
fine tuning๊น์ง ๊ฑฐ์น quality model์ unknown distortion๋ฅผ ๊ฐ์ง input image x(query image๋ผ๊ณ ํ๋ค)์ quality socre๋ ์ถฉ๋ถํ ์ป์ ์ ์๋ ๋ชจ๋ธ์ด ๋๋ค.
(์ด ๋ ์ด Finetuning ๊ณผ์ ์์๋, ์ฌ์ ์ prior model์ ๊ฐ์ ธ์ fine-tuningํ๊ธฐ ๋๋ฌธ์ ์ถ๊ฐ์ ์ธ parameter๋ค ํ์ต์ด ํ์ ์๊ธฐ ๋๋ฌธ์ ํ์ต ํจ์จ์ฑ์ด ํฌ๊ฒ ํฅ์๋๊ณ , generalization ability ์ญ์ ํฅ์๋๋ค!)
์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๋ค์ ๋ณด๋ฉด, ํฌ๊ฒ ๋ ๋จ๊ณ๋ก ์ด๋ฃจ์ด์ ธ ์๊ณ , 1) ๋จผ์ prior model ํ์ต์ ์ํ meta-training์ด ์ด๋ฃจ์ด์ง ๋ค์, 2) unknown distortion์ ๊ฐ์ง image์ NR-IQA task๋ฅผ ์ํ fine-tuning์ด ์ด๋ฃจ์ด์ ธ ๋ชจ๋ธ์ด ํ์ต๋๊ณ , ๊ฒฐ๊ตญ query image x๋ฅผ ์ด ํ์ตํ quality model์ ๋ฃ์์ ๋ quality score์ ์์ธกํด์ ๋ฝ์๋ผ ์ ์๊ฒ ๋๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
์ด model์ backbone model๋ก ResNet 18 layer network๋ฅผ ์ฌ์ฉํ์๊ณ , ๋ฐ์ดํฐ๋ 224*224 pixel patch๋ก random cropํ์ฌ trainingํ์๋ค.
์ธ๊ณต์ ์ผ๋ก ์๊ณก์ ์ํจ IQA database์ ๋ํด์๋ ์ค์ ๋ก ์๊ณก์ด ์ผ์ด๋ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ํด quality score์ ๋ฝ์๋ด์ ๊ทธ ๋ฐ์ดํฐ ๋ฒ ์ด์ค์ ํจ๊ป annotation ๋์ด ์๋ score(์ฌ๋์ด 1์์ 100์ฌ์ด๋ก ์ค quality score)์์ ํผ์ด์จ ์๊ด๊ณ์&์คํผ์ด๋งจ ์๊ด๊ณ์๋ฅผ ๊ณ์ฐํ์ฌ ์ด ๋ชจ๋ธ์ ํ๊ฐํ์๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก, ๊ธฐ์กด์ sota model์ ๋ฐ์ด ๋๋ ์์ฃผ ์ข์ ์ฑ๋ฅ์ด ๋์๋ค๊ณ ํ๋ค!
Gradient map์ ๋ํด์ Visualization์ ํ ๊ฒฐ๊ณผ๋ ๋ณด๋ฉด, blur๊ฐ ์ฌํ ๋ถ๋ถ(distortion์ด ๊ฐํ ๋ถ๋ถ)์ distortion ์์น๋ค์ ์ ํํ๊ฒ ์ก์๋ด๊ณ ์๋๊ฑธ ํ์ธํ ์ ์๋ค.
๋ ผ๋ฌธ ์ ๋ฆฌ๋ฅผ ๋ง์น๋ฉฐ, ๋ค์ ์ง์ด๋ณด๋ฉด
์ด ๋ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋ MetaIQA์ ์ด ๋ ผ๋ฌธ์์๋ ์ ์ํ์๋ค.
meta learning ๋ฐฉ์์ IQA task์ ๋๊ณ ์๊ณ , ์ข์ ์ฑ๋ฅ์ ์ด๋์๋ค๋ ์ ์ด ์ธ์๊น์๋ค. meta learning์ ๋ํด ์ ํํ ๋ง์ด ์๊ณ ์์ง ๋ชปํด ๋ ผ๋ฌธ์ ๋ํ ์ดํด๊ฐ ์์ฌ์ ๋ ๊ฒ ๊ฐ์ meta learning์ ๋ํ ์ ๋๋ก ๋ ๊ณต๋ถ์ ๊ธ๋ ๋จ๊ฒจ๋ด์ผ๊ฒ ๋ค!
๋`(>๏น<)โฒ