[U] Week 4 - CNN Visualization

JaeJun Lee ·2022년 10월 13일

부스트캠프 AI Tech

목록 보기

25/30

CV 분야에서 CNN이 큰 효과를 보이고 있는데 CNN 구조가 어떻게 이루어지는지, 왜 성능이 잘 나오는지, 성능 향상을 위해 어떤 방법을 도입할 수 있는지에 대해 시각화를 통해 분석 및 확인할 수 있다.

해석이 가능하면 응용이 가능하다

먼저 모델 자체의 행동을 분석하는 방법이 있다.

간단한 방법으로는 filter를 visualization 하는 방법이 있다. 깊은 혹은 두 번째 이상 레이어의 filter 부터는 사람이 직관적으로 해석하기 어려운 특징들이 생성되기 때문에 보통 첫 번째 filter를 사용한다.

고차원에 데이터는 형태를 상상하기 어려운 경우가 많아 저차원으로 축소하여 분석하는 방법도 존재한다.

t-SNE

Maximally activation patches 방법이 있는데 데이터 분포 중 가장 큰 값을 가지는 패치를 추출하여 분석한다.

Class Visualization - Gradient ascent방법은 다음과 같은 방법을 사용한다.

I^* =argmax_If(I) - \lambda \Vert I\Vert^2_2 \\ \qquad\qquad\qquad\qquad\quad \tiny Regularization\, term

임의의 영상으로 분석하고자 하는 CNN 모델에 입력으로 하여 최종 class score를 출력하고 backpropagation을 통해 구한 입력 단에 gradient를 인풋 데이터에 더해 업데이트한다. 즉, class score가 높아지기 위한 인풋 데이터를 찾는 과정이며 이 과정을 반복한다.