# CVPR

15개의 포스트
post-thumbnail

[CVPR2023] SkyEye: Self-Supervised Bird’s-Eye-View Semantic Mapping Using Monocular Frontal View Images

Affiliation: University of Freiburg Project page: http://skyeye.cs.uni-freiburg.de/ Code: not yet Video: https://www.youtube.com/watch?v=PGne5XG4f_8 Introduction 왜 BEV Segmentation을 해야할까? 우리가 평소에도 자동차 네비게이션에서 Bird's eye view를 사용하는 것은 정면을 보는 것과는 다른 이점이 있기 때문이다. 가장 두드러진 장점은 경로를 미리 예측하기 좋다는 것이다. 내비게이션 시스템을 벗어나서 그 위에 각 object들도 표현이 된다면 각 객체의 위치를 파악하기 수월하며 이를 이용하여 다른 객체들의 행동 예측하고

2023년 8월 27일
·
0개의 댓글
·
post-thumbnail

(2021) Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation

Abstract Copy-Past augmentation : 자른 객체를 랜덤하게 이미지에 붙이는 방법 이전에는, 주변 visual context를 반영하였지만, 본 논문은 더 simple한 방식을 제안 - 충분히 좋은 성능을 보여준다고 함 semi-supervised learning 가능하게 함 Method 랜덤하게 이미지 2장 선택 : src image, main image 각 이미지에 random jittering, random horizontal flipping 적용 하나의 이미지(=src image)에서 객체 부분 집합 랜덤하게 선택 부분 집합의 객체를 다른 이미지(= main image)에 붙이기 GT annotation 조정 : 완전히 가려진 객체는 삭제 & 부분적으로 가려진 객체는 수정 ![](https://velog.velcdn.com/images/c43t4rd/post/27504668-2469

2023년 7월 7일
·
0개의 댓글
·
post-thumbnail

CVPR 2023 (Vancouver) 후기

CVPR 2023에 가게 된 계기 저는 현재 석사과정을 진행하고 있는 학생입니다. 이번에 CVPR 2023에 참관할 수 있는 기회가 생겨 가게 되었고, 첫번째 해외 학회로 컴퓨터 비전 분야의 TOP conference 중 한 곳에 가게 되어 좋은 경험을 할 수 있었다. 장소 밴쿠버 컨벤션 센터에서 CVPR 2023이 열렸다. 실제로 가보니 정말 큰 장소였고 정말 많은 사람들이 컨퍼런스에 참여하였다. 그리고 바다 바로 옆이라서 큰 배도 볼 수 있었고 수상 경비행기도 수시로 날아다니며 멋진 풍경을 볼 수 있었다. ![](htt

2023년 6월 29일
·
0개의 댓글
·
post-thumbnail

[230623] BEVHeight: A Robust Framework for Vision-based Roadside 3D Object Detection

Abstract 최근의 자율 주행 시스템은 대부분 자차 센서에서의 인지 방법을 개발하는 데 초점을 맞추고 있지만, 사람들은 도로 가장자리 카메라를 활용하여 시각 범위를 넘어선 인지 능력을 확장하는 대체적인 접근 방식을 간과하기 쉽습니다. 우리는 최신 차량 비전 중심의 BEV 탐지 방법이 roadside 카메라보다 성능이 떨어진다는 사실을 발견했습니다. 이는 이러한 방법들이 주로 카메라 중심을 기준으로 깊이 복구에 초점을 맞추기 때문인데, 여기서 자동차와 ground 사이의 깊이 차이는 -> 거리가 증가함에 따라 빠르게 축소됩니다.

2023년 6월 16일
·
0개의 댓글
·
post-thumbnail

[230602]Unified Transformer Tracker for Object Tracking

Abstract SOT, MOT 에 대한 각각의 방법론은 때문에 서로 적용되기 어렵다. 제안 다른 시나리오에서의 tracking 문제들의 하나의 패러다임으로 처리 - SOT와 MOT의 target을 둘 다 추적한다. target을 localize 하기 위해 -> target feature와 tracking frame feature간 상관관계를 이용 제안한 모델은 각각의 tasks datasets 모두에 대해, 동시에 end-to-end로 학습된다. -> SOT와 MOT의 objectives 을 최적화하기 위해 Introduction SOT (어떤 object category 던) 첫 frame 의 annot

2023년 5월 31일
·
0개의 댓글
·

AI이것저것 - 1. CVPR2022

CVPR 1. CVPR이란?? > 국제 컴퓨터 비전 및 패턴인식 학술대회 국제전기전자공학회(IEEE), 국제컴퓨터비전재단(CVF)가 공동 주최하는 인공지능 대회 국제컴퓨터비전학술대회(ICCV), 유럽컴퓨터비전 학술대회(ECCV)같이 컴퓨터 비전분야의 3대 학회로 꼽힘 > 2. CVPR 2022 > 2022/06/19 ~ 2022/06/24에 미국 루이지애나주 뉴얼리언스에서 열림 > 링크 홈페이지 Paper Interaction Tool 우승 논문 > (봐볼만한 것들만 뽑아놓음, 자세한건 홈페이지 참조) > 우승 논문작 !

2022년 10월 11일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] Unified Transformer Tracker for Object Tracking

오늘 제가 리뷰할 논문은 2022년 CVPR에 기재 된 Unified Transformer Tracker For Object Tracking 입니다. https://arxiv.org/abs/2203.15175 Visual Tracking은 크게 두 가지로 나뉩니다. 하나는 Single Object Tracking 나머지는 Multiple Object Tracking입니다. 이 두 분야는 독립적으로 연구 되어 왔습니다. 그러다 두 가지를 모두 수행 할 수 있는 UniTrack 모델이 최초로 제시 되었고 이 논문에서는 Transformer를 이용해 SOT와 MOT를 모두 수행할 수 있는 아키텍처를 제안합니다. Background-1 제가 처음에 SOT와 MOT가 독립적으로 연구 되어왔다고 말했는데요

2022년 6월 20일
·
0개의 댓글
·
post-thumbnail

[2022 CVPR] Rethinking Semantic Segmentation: A Prototype View

1. Introduction 기존의 parametric segmentation (softmax, query) 는 한계가 있어 non-parametric segmentation을 제안할게! 현재 semantic segmentation에 널리 쓰이는 모델 design의 parametric segmentation에 대해서 새로 생각해보는 기회가 되었으면 좋겠다! keywords: parametric/non-parametric, prototype learning, intra-class variance 기존의 parametric segmentation (FCN-based/attention-based)은 class-wise prototype들을 학습하는 learnable prototype (softmax we

2022년 5월 24일
·
0개의 댓글
·
post-thumbnail

Actor-Critic Instance Segmentation - 논문 리뷰

논문 출처: https://ieeexplore.ieee.org/document/8954189 Introduction 이번에는 강화학습 알고리즘 중에 하나인 Actor-Critic의 DDPG 알고리즘을 이용해 Segmentation의 끝판왕인 Instance Segmentation 을 수행한 연구를 소개하겠다. Segmentation은 크게 Semantic Segmentation과 Instance Segmentation으로 나뉜다. Semantic Segmentation Defintion: Objects shown in an image are grouped based on defined categories. For instance, a street scene would

2022년 2월 16일
·
0개의 댓글
·
post-thumbnail

Hierarchical Object Detection with Deep Reinforcement Learning

논문 출처: https://arxiv.org/abs/1611.03718 Object Detection 의 R-CNN 계열의 알고리즘은 바로 물체를 찾는 것이 아니라 Region Proposal 과정이 선행된다. 하지만 이 과정에서 Computational Cost가 발생하고 무엇보다 인간이 사물을 보는 방식이 아니기 때문에 Region Proposal 없이 사물을 인식하는 것에 대해 여러 가지 방법으로 연구 되고 있다. 그 중에서 Deep Reinforcement Learning 방식으로 Object Localization 하는 방식을 소개하려 하고 한다. Introduction 기존 Object Detection 방식은 Convolution Layer을 이용해 pixel 단위에서 사물을 추론해

2022년 1월 27일
·
0개의 댓글
·
post-thumbnail

[Paper Review] LaserNet: An Efficient Probabilistic 3D Object Detector for Autonomous Driving - Part. 2

Uncertainty in deep learning 이 논문의 또다른 중요한 포인트 중 하나는 uncertainty 정보를 활용했다는 것입니다. 그래서 제목에 Probabilistic이라는 말이 들어가게 되었구요. uncertainty의 개념은 deep learning에서 처음 나온 것은 아니나, 이 논문에서도 언급하고 있는 Alex Kentall과 Yarin Gal의 논문 "What uncertainties do we need in bayesian deep learning for computer vision?"을 시작으로 deep learning기반의 컴퓨터 비전 문제에서 uncertainty의 활용에 대한 연구가 많이 이루어졌습니다. Yarin Gal의 "Uncertainty in Deep Learning"은 학위논문임에도 불구하고 엄청난 인용수를 자랑하기도 합니다. 이 글에서 uncertainty의

2021년 3월 1일
·
0개의 댓글
·
post-thumbnail

[Paper Review] LaserNet: An Efficient Probabilistic 3D Object Detector for Autonomous Driving - Part. 1

오늘 정리해볼 논문은 CVPR 2019에 나왔던 LaserNet입니다. Uber에서 나온 논문이고, 앞서 분석했던 VoxelNet, PointRCNN에 비해 인용수는 상대적으로 적은 논문이지만, 대표적인 Range Image 기반 방법론이라는 점에서 정리할 필요성이 있다고 생각하여 선정하게 되었습니다. 제목에 Probabilistic이라는 단어가 있는 것에서 유추할 수 있듯이, Uncertainty의 개념을 LiDAR object detection의 성능 향상을 위해 사용했다는 점도 주목할 만 합니다. 이번 논문은 정리하다보니 너무 길어지는 것 같아 파트 1, 2로 나누어 정리하고자 합니다. 파트 1에서는 range image의 개념과 range image에 뉴럴넷을 어떻게 적용했는지를 중심으로 살펴보고, 파트2에서는 uncertainty의 개념 소개와 함께 Probabilistic 3D object detector로서의 contribution을 중심으로 정리하고, 실험 파

2021년 2월 14일
·
1개의 댓글
·
post-thumbnail

[Paper Review] PointRCNN: : 3D Object Proposal Generation and Detection from Point Cloud

두 번째로 다룰 3D object detection 논문은 CVPR 2019에 나왔던 PointRCNN입니다. 첫 번째로 다루었던 VoxelNet이 1-stage였던 것에 반해 PointRCNN은 대표적인 2-stage detector입니다. 즉, region proposal이 먼저 이루어지고, 그 region에 대해 classification과 regression을 이어서 수행합니다. 그리고 VoxelNet은 3차원 공간을 3D voxel형태로 쪼개어 point cloud를 다루기 쉬운 형태로 바꾸어주는 voxel-based method였다면 PointRCNN은 point cloud 자체를 그대로 이용하는 point-based method라고 분류해서 말하기도 합니다. PointRCNN에서는 3D voxel을 이용하는 방법은 quantization에 따른 정보손실이 있을 뿐 아니라 3D CNN 연산이 비효율적인 점을 지적하며, po

2020년 11월 29일
·
0개의 댓글
·
post-thumbnail

[Paper Review] VoxelNet: End-to-end Learning for Point Cloud Based 3D Object Detection

오늘 정리할 논문은 CVPR 2018에서 발표되었던 LiDAR기반의 3D object detection 분야의 대표 논문 중 하나인 VoxelNet: End-to-end Learning for Point Cloud Based 3D Object Detection입니다. 글을 쓰는 시점(20/10/31)에 800회에 가까운 인용수를 기록하고 있을 정도로, 딥러닝 기반의 LiDAR 3D object detection 분야에서 milestone이 된 논문 중 하나입니다. 앞으로 LiDAR 기반의 3D object detection 분야에서 중요하다고 생각하는 논문들을 하나씩 정리해보고자 합니다. LiDAR 3D object detection 분야를 공부하고자 한다면 다음 github 저장소가 좋은 시작점이 될 것이라고 생각합니다. >https://github.com/open-mmlab/OpenPCDet PointRCNN, A^2-Net, PV-RCNN 등 3D object de

2020년 11월 2일
·
1개의 댓글
·
post-thumbnail

[Paper Review] PointPainting: Sequential Fusion for 3D Object Detection

오늘 소개할 논문은 CVPR2020에 나온 "PointPainting: Sequential Fusion for 3D Object Detection"입니다. image와 LiDAR를 함께 이용하는 sensor fusion 기반의 3D object detection에 관한 논문인데요, object detection을 위한 딥러닝 아키텍처 전체가 아닌, 기존의 모든 LiDAR 기반 3D object detection 아키텍처에 붙일 수 있는 PointPainting이라는 모듈을 제안한 논문입니다. 컨셉은 정말 간단합니다. 다음 논문 그림을 함께 보시죠. image에 대해서 먼저 semantic segmentation을 수행합니다. LiDAR를 image에 pro

2020년 7월 27일
·
2개의 댓글
·