CNN 구조 > 일반 신경망처럼 여러 층을 차례대로 거치며 복잡한 특징을 학습한다. (모서리, 직선) -> (원, 정사각형) -> (이미지의 일부)등을 학습한다. 가중치는 무작위 값으로 초기화 되며 활성화 함수를 사용한다. 오차를 역전파하며 가중치를 수정해 나아간다.
훈련 데이터는 실제 학습에서 사용하고, 테스트 데이터를 이용해서 학습된 모델의 성능을 평가한다.가장 중요한 원칙은 테스트 데이터를 학습에 사용해서는 안 된다.회색조 이미지 변환 : 컬러 이미지는 행렬이 3개나 필요한 만큼 파라미터를 증가시키며 학습의 계산 복잡도를 경감
학습률을 너무 작게 설정하면 학습이 오래걸리고, 너무 크게 설정하면 손실이 감소하지 않거나 발산하게 된다.확률적 경사 하강법은 오차의 최소점으로 향하면서 이동 방향에 진동이 일어난다.이러한 진동은 가중치의 수렴이 오래 걸리거나 최소점을 지나쳐 발산을 일으킨다.모멘텀은
학습 중인 신경망에 과적합이 발생했다면 신경망의 표현력을 감소시켜야 한다. 가장 먼저 시도 할 수 있는 방법은 규제화이다.오차 함수에 규제화항을 추가하는 것이다.은닉층 유닛의 가중치가 0에 가까워지고 모델의 표현력을 감소시키는 데 도움이 된다.가중치를 0을 향해 감소시
정규화 기법은 입력층에 이미지를 입력하기 위한 학습 데이터의 전처리에 집중되어 있었다. 이미 추출된 특징일 정규화하면 은닉층도 마찬가지로 정규화의 도움을 받을 수 있다. 추출된 특징은 변화가 심하므로 정규화를 통해 신경망의 학습 속도와 유연성을 개선할 수 있는데 이를
특징 추출과 분류 : 합성곱 신경망은 크게 특징 추출을 맡는 부분과 분류를 맡는 부분으로 나뉜다.특징 추출을 맡는 부분은 일련의 합성곱층, 분류를 맡는 부분은 마찬가지로 일련의 전결합층으로 구성된다.이미지 깊이는 증가, 크기는 감소 : 모든 층의 입력은 이미지이며 이전
얀 르쿤의 연구진이 합성곱 신경망의 구조인 LeNet-5를 발표했다.ReLU가 아닌 tanh를 활성화 함수를 사용했다.입력 이미지 -> C1(합성곱층) -> TANH -> S2(풀링층) -> C3 -> TANH -> S4 -> C5 -> TANH -> FC6(전결합층)
AlexNet은 2012년 ILSVRC 이미지 분류 콘테스트에서 우승을 차지했다.VGGNet이나 ResNet처럼 AlexNet의 단점이 이후 나온 신경망을 고안하게 되었다.LeNet은 6만 개의 파라미터를 가졌으나 AlexNet은 65만개 뉴런과 6천만 개의 파라미터를
2014sus VGG 연구 그룹에서 제안한 신경망 구조이다.LeNet이나 AlexNet과 동일하지만 신경망의 층수가 더 많다.VGG16은 층 16개로 구성되는데 합성곱층 13개 전결합층 3개이다.합성곱층의 필터 크기가 3x3인데 AlexNet보다 더 세밀한 특징일 추출
잔차 신경망(residual neural network) 2015년 MS에서 제안한 신경망 구조이다.잔차 모듈과 스킵 연결 새로운 구조가 사용되었다.층수가 매우 많은 신경망의 문제점은 앞쪽에 위치한 층의 가중치를 수정하기 위한 신호가 매우 작아진다.기울기 손실 문제가
신경망이 어떤 과업을 위해 많은 양의 데이터를 이용해 학습한 지식(특징 맵)을 학습 데이터가 비슷한 신경망의 일부 층을 사용한다.대규모 학습 데이터와 대규모 클러스터를 따로 갖추지 않아도 사전 학습을 이용하여 전이학습을 사용할 수 있다.신경망의 학습 과정에서 실제로 학
영역 제안 : 이미지에서 시스템이 처리할 영역ROI(regions of interest)를 제안한 딥러닝 모델 또는 알고리즘특징 추출 및 예측 : 각 박스 영역의 시작적 특징이 추출된다. 특징을 평가해서 물체 존재 여부와 물체의 클래스를 판단한다.비최대 억제(NMS)
영역 기반 신경망 구조 중 가장 기본적인 구조지만, 모든 다중 물체 인식 알고리즘의 밑바탕이 되는 구조이다. > ROI 추출기 : ROI는 물체를 포함하고 있을 가능성이 높은 이미지의 영역이다. 특징 추출 모듈 : 사전 학습된 합성곱 신경망에 ROI를 입력해서 특징을
2016년 웨이 리우의 논문에서 처음 제안되었다.R-CNN에 비해 단일 단계 탐지기는 합성곱층에서 위치와 클래스를 한번에 예측한다.물체 존재 확신도는 정답과 경계 박스의 중첩률을 계산해서 예측하며 50% 이상인 해당 영역에는 물체가 있을 확률이 높다고 판단한다.피드포워
2016년 웨이 리우의 논문에서 처음 제안되었다.R-CNN에 비해 단일 단계 탐지기는 합성곱층에서 위치와 클래스를 한번에 예측한다.물체 존재 확신도는 정답과 경계 박스의 중첩률을 계산해서 예측하며 50% 이상인 해당 영역에는 물체가 있을 확률이 높다고 판단한다.B개의