
가장 빠른 객체 검출 알고리즘 모델 중 하나파이썬, 텐서플로 기반 프레임워크가 아닌 C++로 구현된 코드 기준 GPU사용 시, 초당 170 프레임 (170 FPS. frames per second)Single Network 하나만을 사용하여 속도가 매우 빠름Less f

1\. Introduction본 논문 이전까지 DNN(Deep Neural Network)는 음성인식, 사물인식 등에서 꾸준히 좋은 성과를 보여옴. 그러나 Input size가 고정된다는 한계점이 존재하여 순서가 있는 Sequencial problem을 제대로 해결할
1. 기존 RNN 모델의 문제점 위 그림과 같이 입력이 들어올 때 마다 hidden state 값을 순서대로 갱신하여, 최종 단어가 들어왔 을 때 마지막으로 갱신된 hidden state(위 그림에서는 h4)가 전체 문장의 의미를 함축하고 있으며 이 를 고정된 크기를

생성모델의 본질 : 데이터가 존재할법한 분포를 파악해 "실제같은", "실제와 유사한" 데이터를 만드는 것원하는 데이터의 분포를 얼마나 잘 추정했느냐가 생성모델의 Output 품질을 결정본 논문에서는 이 과정에서 두가지 trade-off 관계를 설명하며, Diffusio

배경지식Instance Segmentation : 각 픽셀마다 픽셀이 어떤 class에 해당하는지 예측하는 작업 수행(일반적인 segmentation 이라고 불림). 즉 이미지 내에 있는 각 물체들을 의미 있는(Semantic) 단위로 분할(Segmentation)하는

Abstract본 논문에서는, 일반적으로 Hela 세포로 알려진 자궁경부암 세포의 핵 외피의 semantic segmenation을 위한 전통적 접근법 및 4가지 딥러닝 접근법을 비교하고있음. 구체적으로는, 전통적인 이미지 처리 알고리즘과 VGG16, ResNet18,
Abstract 자동 기계 학습(AutoML)은 인간의 도움 없이 DL 시스템을 구축하기 위한 유망한 솔루션이며 광범위하게 연구되고 있음. 본 논문은 AutoML의 최첨단(SOTA)에 대한 포괄적이고 최신 검토를 제시함. 특히 NAS에 특히 초점을 맞춘 AutoML 방

본 논문은 GAN 논문 중에서도 가장 많이 인용된 논문 중 하나이다.본 논문의 Contribution은 크게 아래 2가지로 요약할 수 있다.Conditional Generative Adversarial Network(CGAN)을 사용하여 한 이미지를 다른 domain(

해당 논문은 ViT에서 모든 패치가 self attention을 수행하는 것이 계산량을 불필요하게 증대시켜 computation cost가 높아진다는 문제점을 언급하며, 각 patch를 window로 나누어 해당 윈도우 안에서만 self attention을 수행하고 그

Denoising Diffusion Denoising Diffusion Probabilistic Model 논문에서 소개된 모델의 동작원리 및 수식, Contribution을 정리한 글입니다.

구글은 AI agents 소개, agent의 구성, 동작방식, 예제를 통해 알아보는 현실세계 적용방안까지 포괄적으로 포함한 AI Agent Whitepaper를 발간 및 공개하였다. 본 글에서는 백서 내용을 간략히 정리하였음.