두 함수를 곱해서 합한다컬러 사진은 각 픽셀을 RGB 3개의 실수로 표현한 3차원 데이터흑백은 2차원 데이터 1개의 채널커널(kernel)이라고도 함필터는 이미지의 특징을 찾아내기 위한 공용 파라미터학습 대상의 필터 파라미터입력 데이터를 지정된 간격으로 순회하며 채널별
Alexnet은 ImageNet LSVRC-2010 대회에서 top-1, top-5 error rates가 각각 37.5%, 17.5%를 보여줬다.훈련이 된 분류기가 새로운 테스트 이미지들에 대해 예측한 클래스(=top-1 class)가 실제 클래스와 닽다면 top-1
Inception을 제안인셉션이란? deep cnn이고 ILSVRC14대회에서 분류와 인지를 위한 최신 세팅임인셉션 아키텍쳐의 특징은 네트워크 안에서 컴퓨터 리소스 활용이 커진다는 것그말은 즉, 컴퓨팅 연산 비용이 변하지 않고 유지하면서 네트워크의 깊이와 너비는 커질
https://pjreddie.com/media/files/papers/YOLOv3.pdf이번 논문은 실제 현장에서 많이 사용하는 욜로를 공부해볼 예정이다.
Yolo Site: https://pjreddie.com/darknet/yolo/Yolov2 paper: https://arxiv.org/pdf/1612.08242.pdf욜로v1의 단점을 보완해서 나온 욜로v2는 더 빠르고 강하고 좋다고 하는데 이번
https://arxiv.org/pdf/1506.01497.pdf
transformer: 2017 년 구글에서 발표한 논문 “Attention is all you need”에서 나온 모델로 인코더-디코더의 구조를 따르면서 어텐션 만으로 nlp에서 우수한 성능을 보여주었다vision transformer: 자연어 처리 모델인 trans
원스테이지 모델region proposal 건너띔한번에 클래스와 비박스를 찾음빠르기 때문에 실시간 디텍팅에 사용투스테이지 모델보다 퍼포먼스 낮음투스테이지 모델rpn(피쳐맵 입력 받아서 bbox계산후 정렬하고 iou높은거 놔두고 낮은건 지움)을 거친 후 나온 roi에서