# Paper

[Paper] Better plain ViT baselines for ImageNet-1k
original ViT로부터 성능을 10%나 증가시킨 방법

[Paper] GA-Net: Guided Aggregation Net for End-to-end Stereo Matching
2019년에 CVPR에 게재된 Stereo Matching 관련 GA-Net 논문 간단 리뷰입니다.

[Paper Review] Character Region Attention For Text Spotting
Character Region Attention For Text Spotting ,2020

[Paper Review] You Only Look Once: Unified, Real-Time Object Detection
YOLOv1 모델 논문 리뷰

[논문 리뷰] Knowledge-inspired 3D Scene Graph Prediction in Point Cloud
Scene understanding은 AR/VR, robot navigation 등 여러 분야에 유용하지만 scanned 3D data는 incomplete하기 때문에 scene을 정확하게 이해하는데 어려움이 있다.사람은 scene에 대해 이해할 때 visual per

[Point Review] SceneCAD: Predicting Object Alignments and Layouts in RGB-D Scans
3D reconstruction은 occlusion이나 센서의 영향으로 불완전하기 때문에 application에 어려움이 있다.\-> RGB-D scan, objects with CAD model을 받아 그래프를 활용하여 scene을 CAD 모델로 나타낸다.Encode

[논문 리뷰] Image Generation from Scene Graphs
생성 모델의 유용성으로 text로부터 이미지를 생성하는 모델들이 나왔으나 sentence에 많은 object가 존재할 때는 생성에 어려움이 있었다.선형 구조의 sentence를 위 그림과 같이 objects와 relationships로 표현하는 scene grah로 나

[Point Review] Graph R-CNN for Scene Graph Generation
(b) Object node extraction(c) Relationship edge pruning(d) Graph context integration$I:$ image$V:$ 이미지 내의 object 노드 집합$E \\in {V \\choose 2 }:$ object

[Point Review] HorizonNet: Learning Room Layout with 1D Representation and Pano Stretch Data Augmentation
Room layout을 $y_w, y_c, y_f$에 대한 1D representation으로 나타낸다.$y_f$: 벽과 floor 사이의 boundary에 대한 좌표$y_c$: 벽과 ceiling 사이의 boundary에 대한 좌표$y_w$: 벽과 벽 사이의 boud

DALL-E 논문 정리
이번 DALL-E 논문은 MultiModal task에 관심이 많아져서 읽고 싶었던 논문이다.이미지 생성 모델답게 어려운 수식들이 있었지만 저걸 어떻게 하지?로 시작해서 어떤 아이디어로 이 모델이 학습되었구나를 알아가는 과정을 즐길 수 있었다.이전에는 논문 형식을 지키

[논문 리뷰] MC-Calib: A generic and robust calibration toolbox for multi-camera systems
Charuco board detection을 통해 모든 카메라의 intrinsic parameter initializationN-point technique을 통해 관측되는 board에 대한 camera pose에 대해 추정Single image에서 보이는 board

[Paper Review] Character Region Awareness for Text Detection(CRAFT), CVPR 2019
CRAFT, CVPR 2019

[Paper Review] CSPNet: A New Backbone that can Enhance Learning Capability of CNN 요약리뷰
CSPNet , IEEE 2020
HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis 논문 정리
#Speech #DeepLearning #Paper

SpanBERT 번역
우리는 텍스트의 범위를 더 잘 표현하고 예측하도록 설계된 pre-training 방식인 SpanBERT를 제시한다. 우리의 접근 방식은 (1) random token이 아닌 contiguous random span을 maksing하고 (2) masked span의 전체
[논문정리] GAN Tutorial
Generative Adversarial NetsUnsupervised Representation Learning with Deep Convolutional Generative Adversarial NetworksConditional Generative Adversar
MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis 논문 정리
#Speech #DeepLearning #Paper

[Paper Review] Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 요약리뷰
SPP Net, 2014