https://github.com/dangdang2222/ReadWithMe캡스톤 디자인I에서 진행했던 프로젝트 중 내가 맡았던 Gaze Estimation 파트에 대해 간단히 기록 남기려고 한다코드는 위 git 링크에 올려놨으나 readme 부분을 살짝 덜
야외에서의 시선 추정은 눈의 외형의 독특성, 조명 조건의 다양성, 머리의 자세 및 시선 방향의 다양성 등으로 인해 어려운 문제이다.본 연구는 unconstrained 환경에서 시선을 예측하기 위한 CNN 기반 모델을 제안한다. 각 시선 각도를 개별적으로 회귀시켜 각각의
목표 : 단일 이미지에서 3D Dog Reconstruction개의 형태와 자세 매개변수를 추정하는 3D 관절 형태 모델을 기반으로 한 모델링 방법을 채택문제점 양한 형태와 외모로 이루어짐기존의 SMAL 모델은 다양한 개 종류를 표현하기에 충분한 표현력이 없음super
Latent variable z 의 분포를 추정하고 이를 통해 원래 데이터의 분포를 예측하는 확률 모델(probability model)기존의 Variational Bayes 의 mean field 접근 방식의 intractability 문제를 개선한 SGVB(Stoc
생성 모델을 훈련하기 위해 적대적인 과정을 사용하는 새로운 프레임워크를 제안한다. 생성 모델 G와 판별 모델 D 두 개를 동시에 훈련시킨다. G : 데이터 분포를 잡아내는 생성 모델D : 샘플이 G가 아닌 훈련 데이터에서 나왔을 확률을 추정하는 판별 모델G의 훈련은 D
0. Abstract stochastic variational 추론 및 학습 알고리즘을 소개한다. Variational lower bound 의 reparametrization 을 통해 SGVB라는 새로운 estimator를 제안하였고, 이를 이용해 AEVB라는 최
DACON 링크LG Aimers 2기 Phase1 수료 후 진행했던 Phase 2 온라인 해커톤에서 Public 10위, Private 1위를 달성했다. 당시 제출했던 PPT 자료와 함께 간단하게 정리하고자 한다.먼저 프로젝트 주제는 스마트 공장 제품 품질 상태 분류
0. Abstract 2D 이미지에서만 아바타를 학습하는 것이 목표다. mplicit functions는 머리카락과 옷같은 세부 사항을 포착할 수 있으나 현재 방법은 다양한 포즈에 적합하지 않으며 팔다리가 부러지거나 분리된 3D surface, 누락된 세부 정보, 인간
0. Abstract PIFu(Pixel-aligned Implicit Function)은 2D 이미지 픽셀을 각각의 3D 객체와 일치시켜서 global context를 제공하는 implicit representation이다. 기존의 방법들과 달리 unseen 영역을
매 frame마다 단일 image에서의 3D human pose estiamtor를 inference?motion blur가 심할때는 어려움단일 image에서는 주변 frame의 정보를 활용할 수 없음 (depth ambiguity, motion blur 등)⇒ tem
HPE(human pose estimation)은 딥러닝에 의해 크게 발전되었으며 ‘in the wild’ 작업이 소개되고 있다. 동시에 네트워크 구조와 실험들 역시 복잡해지고 있다. 이에 대해 ‘how good could a simple nethod be?’라는 질문
Multi Person으로 확장해보자Top-down 접근법 : Human detection + single person pose estimationHuman detector : Object detector(mask R-CNN ,YOLO)Human detector로 bo
입력 이미지로부터 사람의 관절을 3D 공간에 위치3D human pose란?3D 관절 좌표 혹은 3D 관절 회전2d와 유사함 ( 가려짐, 복잡한 자세, 작은 해상도, 모션 블러, 잘림)3d만의 문제점depth ambiguity 입력이 2d인데 아웃풋은 3d
: 입력 이미지로부터 사람의 관절을 2D 공간에 위치화관절은 dataset마다 정의가 되어있음ex) MSCOCO사람마다 각 관절에 대한 augmentation이 있음H, W는 이미지의 height, widthN, J는 사람 명 수와 관절 개수 ( N는 이미지마다 다를
인간은 일상에서 중심이 되는 object따라서 '인간'을 이해하기 위해서 현대의 방법으로Human-Interacting Machines with Visual Intelligencemotion captureAR/VR공공장소 감시 (돌발상황을 사전방지 → 화재, 사고, 범
원문세계 좌표의 3D body pose에서 joint angle을 계산하는 전략한 벡터를 다른 벡터로 회전시키는 rotation matrixrotation matrix를 major axes(축)에 따라 rotation sequence로 분해 (ex ZXY, XYZ ro
골프 스윙의 주요 이벤트를 감지하고 골프 스윙 분석을 용이하게 하기 위한 골프 스윙 시퀀싱 개념1400개의 고품질 골프 스윙 동영상으로 구성된 벤치마크 데이터세트 GolfDB. 각 영상은 event frames, bounding box, player name, sex,
논문자동화된 골프 스윙 분석을 위해 GolfPose라는 lightweight temporal-based 2D human pose estimation(HPE) 방법을 제안한다. 기존의 image-based 방법과 달리, temporal based 방법은 추정 정확도와 빠
블로그에 포스팅하는 내용들은 강의 전체 내용이 아닌 내 기준, 나한테 필요한 내용들 기억하고 싶은 내용들 위주입니다해당 내용의 출처는 LG Aimers(https://www.lgaimers.ai)에 있습니다합성곱 신경망 : Convolutoin 연산을 통해 이
_블로그에 포스팅하는 내용들은 강의 전체 내용이 아닌 내 기준, 나한테 필요한 내용들 기억하고 싶은 내용들 위주입니다 해당 내용의 출처는 LG Aimers(https://www.lgaimers.ai)에 있습니다_ Part 1. 순환 신경망 기반의 시계열 데이터 회귀