딥러닝으로 해결하기 어려운 문제 (로보틱스, 가상현실)딥러닝 모델의 결과의 후처리딥러닝 모델 없이 데이터를 가공할 떄 활용: Morphological Transform: Edge & Contour Detection흑백이미지에서 일반적이미지에 기반한 연산원본 이미지를 입
고전 컴퓨터 비전을 활용해 raw image에서 객체의 contour를 추출딥러닝 모델을 사용하지 않으면서 딥러닝 모델 학습을 위한 데이터 가공 시 활용 가능데이터가 충분하지 않을 떄는 고전 알고리즘이 더 좋은 성능을 보일 떄도 많음: 컴퓨터 비전에서 가장 널리 사용되
Computer Vision 모델 학습부터 평가까지의 프로세스에 대한 경험데이터 - 모델 - 학습, 추론, 평가데이터 전처리 및 가공적절한 모델 선택 및 파라미터 튜닝평가 및 피드백문서타입 분류 경진대회실제 산업현장에서 필요로 하는 테스크문서데이터는 금융 의료 보험 물
VISUAL FEATURE란?VISUAL FEATURE in Computer Vision: Visual Feature : 컴퓨터 비전의 태스크 (classification, detection, segmentation, ...)를 해결할 떄 필요한 이미지의 특성을 담고

모델이 비선형성을 가질 수 있도록Feature Map에 Spatial Aggregation을 시켜줌 (DownSampling)\-> Feature Map의 크기를 감소 : 모델파라미터 감소, Receptive Field 달라짐ImageNet Large Scale Vis

일정 수준 이상으로는 더 깊은 레이어를 쌓아도 Training Error와 Test Error 모두 정확도가 오르지 않는 문제컨볼루션 레이어의 입력을 컨볼루션 레이어의 출력에 그대로 더해준 뒤 Activation Function을 통과시키는 구조를 2개의 컨볼루션 레이

Efficient Net MBConv Block Mobile Inverted Bottleneck Convolution (MBConv) Depthwise Separable Convolution : Depthwise Conv + Pointwise Conv Squeeze

네트워크가 비전 태스크를 수행하는 데에 유용한 Feature들을 학습할 수 있도록 함Convolution Layer를 여러개 쌓는 경우, 뒤 레이어의 결과값 하나를 만드는데 사용되는 이미지의 범위가 넓어진다.뒷레이어로 갈 수록 Receptive fieldConvolut

https://arxiv.org/abs/1512.04150모델이 어디를 보고 있는지 시각화 할 수 있는 방법을 제시Fully Connected Layer (FC Layer)의 단점 : Flatten 하는 과정을 거치기 때문에 Pixel의 위치 정보를 잃게 됨G

컴퓨터 비전에서 대중적인 TaskArchitecture : Backbone (CNN) + Classification Head (FC Layer)Input Image -> Backbone -> Fully Connected Layer -> OutputMnist, CIFAR
2-Stage Detector R-CNN 2-stage Detector로 Region Proposals 단계를 수행 R-CNN의 개선된 모델인 Fast R-CNN, Faster R-CNN 모델의 기반이 됨 CVPR 2014에 출판된 논문으로, 2-Stage Detec
1-Stage Detector Region Proposals없이, Feature Extractor만을 이용한 Object Detection 수행 Feature Extractor: 입력 이미지를 특성으로 변환, 해당 특성을 이용하여 추후 Classification 및

Semantic segmentation: Pixel-wise로 각각의 Class를 예측하여 물체 Category 별로 분할Category: 각 픽셀의 Label 예측Architecture: Backbone (Encoder) + DecoderPixel-Wise IoUKI

● MICCAI 2015에 출판된 논문으로, 바이오메디컬 이미징 분야에서 사용하다 보편화 됨● U-Net의 이름은 U자 모양의 아키텍처에서 유래● 입력 이미지를 Downsampling● 이미지의 공간 정보를 계층적으로 추상화 및 중요한 Feature 추출● Encod
컴퓨터 비전 분야는 빠르게 발전하고 있으며, 모델의 성능을 평가하는 것은 그 효율성과 신뢰성을 보장하는 데 필수적입니다. 다양한 메트릭스는 분류 정확도부터 객체 탐지 정밀도에 이르기까지 모델 성능의 여러 측면을 평가하는 데 도움을 줍니다. 이 가이드는 다양한 컴퓨터 비
: 깊은 네트워크의 중요성: 깊은 네트워크의 문제점 개선: 효율적이고 정확한 네트워크 제안, 기존 네트워크 TRADE-OFF 분석: 이미지 안에서 멀리 떨어진 객체끼리 관련성 파악 힘듦: 이미지 각 파트가 이미지 이해에서 얼마나 중요한지, 얼마나 서로 관련이 있는지 평