# CV

📸 Data augmentation(데이터 증강) - Image편 | 내가보려고정리한AI🧐
학습 데이터는 세상의 모든 데이터와 항상 같을까? 학습데이터는 항상 현실 데이터와 차이가 있을 수 밖에 없다. 이런 차이를 Data augmentation를 통해서 줄여나갈 수 있다.이번 장에서는 Image Data의 augmentation을 알아보겠다.

📸 Image Classification(이미지 분류)(2)- GoogLeNet, ResNet,DenseNet,SENet,EfficientNet| 내가보려고정리한AI🧐
이번 장에서는 GoogLeNet, ResNet가 Degradation problem를 어떻게 해결하였는지 알아보고, DenseNet, SENet, EfficientNet을 통해 Image Classification 성능을 더 높이는 방법을 알아보겠다.

📸 Image Classification(이미지 분류)(1)-LeNet,AlexNet,VGG부터 Degradation까지 | 내가보려고정리한AI🧐
이번 장부터는 Computer Vision의 tasks 중 image classification의 발전 과정을 살펴볼것이다. LeNet-5, AlexNet, VGG까지 모델들을 알아보며 깊은 layer를 가질 때 발생하는 Degradation problem을 살펴보겠다

🤖 Computer Vision이란? | 내가보려고정리한AI🧐
사람은 시각, 청각 등과 같이 오감을 통해 세상과 상호작용을 하면서 성장한다. 사람이 감각을 통해 받아들이는 정보의 75%는 시각을 통해 온다고 한다. 이런 인간의 시각을 모방하는 것이 Computer Vision이라고 할 수 있다.

[CV] Computer Vision (Week 4)
FC Layer(Fully, Connected Layer, Fully Connected Neural Network)의 경우 피쳐맵에 대해서 모든 텐서에 대해 내적을 하게 된다. 모든 텐서에 대해서 파라미터가 사용되기 때문에 1) 파라미터 개수가 증가하는 한계점이 있다.

Object Detection - YOLO, SSD, MRCNN 비교하기
Object Detection 이미지나 동영상에서 사람, 동물, 차량 등 의미 있는 객체(object)의 종류와 그 위치(bounding box)를 정확하게 찾기 위한 컴퓨터 비전(computer vision) 기술. 일반적으로 검출 대상에 대한 후보 영역을 찾고

🤖 CNN(Convolutional Neural Network)을 이해하고 Pytorch로 구현해보자 | 내가보려고정리한AI🧐
기존 까지 공부한 딥러닝 모델은 선형결합 - 비선형변환을 반복하며 모든 노드가 연결되어 있는 Fully Connected Layer로 구성된 percentron 모델이였다면, 이번 장에서는 CNN의 기본 원리와 pytorch로 구현된 CNN모델을 분석해보겠다.

네이버 부스트캠프 5기 19일차
Vistion Transformer은 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale으로 구글에서 2020년 10월 20일날 발표된 논문이다 이미지 분류에 Transformer을 사용

C로 컴퓨터비전 구현해보기(1)
한동안 교환학생을 갔다온다고 블로그 업로드를 미뤘는데...다시 시작해보려한다. 한동안은 교환가서 배운 내용들을 정리겸 올릴 계획이다. 교환 가서 들은 수업들이 석사수업들이라 쉬운 내용이 없어 차근차근 다시 공부하며 올릴 예정이다.가장 먼저는 C언어로 작성한 이미지 프로

KT AIVLE [7주차] - 시각지능 딥러닝 (수정중)
Convolutional Layer이미지 구조를 파괴하지 않으며 위치정보 보존하기 위함filterstridepaddingkernelFeature mapconv의 filter를 거치면 나옴conv의 목적이 여기서 달성됨Pooling (Subsampling - downsa

Diffusion 정리
Denoising Diffusion Probabilistic Models (DDPM) 1. DPM dataset을 확률분포로 표현하는 것이 매우 중요하다고 한다. 특히, 우리가 확률분포를 구하고자 할 때에는 tractability와 flexibility라는 개념이 중

Neural Shape Deformation Priors
동기: 기존의 ARAP 등의 deformation 방식은 triangle 구조에는 dependent 하지만 global한 prior 정보는 이용하지 못한다. (Global한 prior 정보의 예로는 머리와 발은 움직이는 방식이 다르다는 것) 딥러닝을 통해 prior를
컴퓨터비전이란
컴퓨터비전이란 컴퓨터를 이용하여 시각 기능을 가지는 기계 장치를 만드는 기술 분야이다. OMR카드를 인식해 수험자의 마킹 위치를 인식하는 것부터 자율 주행에 이르기까지 현대의 다양한 분야에서 컴퓨터비전은 폭넓게 이용되고 있다.그러나 현대의 컴퓨터비전은 아직 범용성을 가
cs231n - Lecture 9 | CNN Architectures
cs231n 강의 중 'Lecture 9 | CNN Architectures'를 정리한 내용이다.2012년, imageNet classification test에서 좋은 성능을 내어 우승한, 첫 딥러닝 기반 접근을 한 CNN 모델이다. 각 layer별로 ouput vo

cs231n - Lecture 3 | Loss Functions and Optimization
cs231n 강의 중 'Lecture 2 | Image Classification'을 정리한 내용이다.

Generative AI의 발판, GAN
Intro. Generative AI(생성 AI) 란? 그림 그려주는 인공지능 DALL-E, 목소리를 재현해주는 인공지능 VALL-E, 그리고 최근 화제가 되고 있는 텍스트 생성 인공지능 ChatGPT까지, 모두 세상에 없는 무언가를 뚝딱 만들어냅니다.

[논문 리뷰] Non-local Neural Networks
본 논문은 non-local operator를 신경망에 적용해서 image classification, object detection 등 다양한 CV 태스크에 성능을 올렸다가 전부임. 본 논문에서 소개하는 non-local opeartor는 쉽게 말해 이미지 내에 멀리

[논문 리뷰] On Calibration of Modern Neural Network
본 논문은 딥러닝을 공부하면서 나로서는 한번도 생각해보지 못했던 점을 문제 삼으면서 현대의 신경망을 사용할 때 고려해야할 calibration에 대해 설명하고, 이를 해결하는 매우 간단한 temperature scaling이라는 방법을 소개함한마디로 정의한다면 'the