Introduction Transformer Self-Attention 기반의 구조를 가진 Transformer는 NLP 태스크에서 성공적인 성능을 발휘한 모델이다. Transformer는 다음과 같은 특징을 가지고 있다. * 높은 연산 효율성(Computatio
https://arxiv.org/abs/2006.11239기존의 Diffusion 모델들은 뛰어난 성능을 지녔지만, foward process중 분산을 설정하거나 reverse process중 가우시안 분포의 여러 매개변수들을 설정해줘야 한다는 단점이 존재하였
Introduction NeRF 모델은 정말 간단하게 설명하면 2D Image를 통해 3D Real world 형태로 rendering을 진행한 모델이다. 이해를 돕기 위해 사진을 확인해 보자. Untitled 이렇게 다양한 각도에서 찍은 2D Image를 통해
GAN 모델은 이미지를 생성해 내는 모델로써 2014년에 등장했다. 이후 현재까지 GAN을 기반으로한 수많은 발전된 모델들이 파생되었다. 이미지 생성이란, 기존의 있던 데이터를 기반으로 그럴싸한 이미지를 생성해 낸다는 뜻이다. 즉, 주어진 이미지 데이터 내에서 특정한
최근 3차원의 공간을 인식하는 분야가 최근 컴퓨터 비전과 로보틱스 분야에서 각광을 받고 있다. 전통적인 카메라로 3차원 공간을 인식하는 방법은 좋은 결과를 보여주었지만, 좁은 범위만을 알 수 밖에 없다는 한계가 존재한다. 따라서 최근 지도 투영 방법 중 하나인 equi
Retinaface란 singleshot, multi-level face localization을 고안한 방법으로 point regression을 이용하여 face box prediction, 2D facial landmark localization, 3D vertic
기존의 Monocular video로부터 3D human pose estimation을 얻는 모델들은 모호성과 self-occlusion 문제를 갖는다는 한계점이 존재한다. 이러한 문제를 해결하기 위해서 시간적 공간적 관계를 파악하려는 연구들이 많았다. 하지만 이 또
컴퓨터 그래픽스에서 어떤 3차원 물체를 표현하는 기본적인 방법은, 그 물체 고유의 3차원 좌표계(frame)를 정하고, 해당 물체의 형태는 그 고유의 좌표계 안에서 표현을 하는 것이다. 이렇게 표현하게 되면 물체를 평행이동 하거나 회전을 시킬 때 해당 좌표계를 이동하거