VGGNet은 CNN 모델로 네트워크의 깊이가 모델이 좋은 성능을 보이는 데 중요한 역할을 한다는 것을 보여줬다. VGGNet의 필터 크기는 3x3, stride 1, 제로 패딩 1의 Conv 레이어로 이루어져 있으며, 필터 크기 2x2 (패딩 없음)의 Max-pool
오늘 리뷰할 논문은 skipnet이다. layer를 건너뛰어서 연산량을 줄이는 아니디어를 사용했다는 점이 마음에 들었다. 논문의 저자는 resnet의 아이디어를 차용해서 skipnet을 만들었다고 한다. residual block 앞에 skip-gate를 두어 해당
기존의 exhaustive search 방식의 비효율성으로 Object가 있을 법한 영역만 찾는 방법이 제안됨 이를 region proposal이라고 한다. 1) detector는 Object가 있을법한 영역을 찾기 위해 exhaustive search(slidin
수평선 기준 위의 모델들이 2-Stage detector이고 아래의 모델들이 1-Stage detector이다. Regional Proposal과 Classification이 순차적으로 이루어진다.Regional Proposal이란?기조ㄴ에는 이미지에서 object d
Introduction 컴퓨터비전에서의 문제들은 크게 다음 4가지로 분류할 수 있다. Classification Object detection Image segmentation Visual relationship 먼저 1, 2, 3의 차이를 살펴보겠다. Clas
이번 포스팅에서는 Fast R-CNN과 Faster R-CNN을 정리합니다.기존 R-CNN의 단점은 속도가 매우 느리다는 점이었습니다. 이를 보완하기 위해 Fast R-CNN, Faster R-CNN이 개발되었습니다. 모델명에서 Fast가 붙은 만큼 기존의 모델보다 속
기존 Fast R-CNN 모델은 여전히 Selective search 알고리즘을 통해 region proposals 추출하기 때문에 학습 및 detection 속도를 향상시키는데 한계가 있습니다. 또한 detection을 위한 과정을 end-to-end로 수행하지 못한
YOLO 연구진은 객체 검출(object detection)에 새로운 접근방식을 적용했습니다.기존의 multi-task 문제를 하나의 회귀(regression) 문제로 재정의했습니다.YOLO는 이미지 전체에 대해서 하나의 신경망(a single neural networ
이번 포스팅에서는 OHEM(Online Hard Example Mining)논문을 리뷰해보겠다.일반적으로 object detection시에 배경영역에 해당하는 region proposals의 수가 더 많아 클래스 불균형이 발생하고, 이 문제를 해결하기 위해서 Hard
본 논문에서는 Residual Block의 연산과정에 대해 분석하고 이를 통해 새로운 Residual Block을 고안한다.기존의 논문에서는 Fig.1(a)의 residual block을 사용했다. 이를 수식으로 풀어보자.$y_l = h(x_l) + F(x_l, W_l
WRN은 residual net의 width를 증가시키고 depth를 감소시킨 모델이다. 너비가 증가한다는 것은 filter 수를 증가시킨다는 것을 의미한다. 즉, WRN은 residual block을 구성하는 convolution filter수를 증가시켜서 신경망의
이번에 리뷰할 논문은 Aggregated Residual Transformations for Deep Neural Networks 이다.CNN의 성능을 높이기 위해 가장 먼저 드는 생각은 깊고 넓게 만드는 것이다. 하지만 본 논문에서는 깊이와 넓이가 아닌 cardina
SSD는 single-stage 중 처음으로 two-stage 모델의 정확도를 넘어선 detector이다. Single-stage이기 때문에 빠른 속도를 가지면서 높은 정확도를 달성한 것에 의의가 있다. 혁신적인 기술이 도입된 건 아니지만 기존의 아이디어들을 적절히 병
CNN Layer의 깊이가 깊어지면서, input 값에대한 기울기 정보가 소실되는 문제가 있었다. 이러한 문제를 해결하고자 ResNet, Highway Networks, GoogleNet 등 identity connection을 통해 신호(특성)을 우회하는 것을 시도하
기존의 이미지 분류 모델들은 CNN(Convolutional Neural Networks)을 기반으로 발전해 왔다. CNN은 지역적인 특징을 학습하는 데 매우 효과적이지만, 글로벌한 정보를 다루는 데 한계가 있다. 이를 해결하기 위해 Google Research는 Vi