투빅스 14기 서아라
Pose estimtation: 사람의 관절 위치를 찾는 task
7 layer generic convolution DNN model
이미지에 대한 초기 자세를 추정한 후, 고해상도의 부분 이미지를 이용하여 joint 예측치를 정제하는 DNN기반의 regressor를 학습함.
입력 이미지를 CNN에 통과시키면 k개의 관절에 대한 예측값을 냄
y_i의 좌표는 아래와 같이 normalize하여 사용
b는 bounding box를 의미
동일한 정규화 과정을 Pose Vector 인자 모두에 적용하여 normalized pose vector를 얻음.
원본 이미지 x를 Pose Vector y로 회귀하는 함수 ψ(x;θ)∈𝑅^2𝑘 를 학습 (k : 관절 수)
원본 이미지 x 중의 관절위치 y*를 예측한다는 것은 이미지를 ψ에 넣어 Normalized Pose Vector를 얻어 이를 원래 이미지의 좌표계로 다시 변환하다는 것
y*는 아래 식과 같이 변환을 통해 절대 좌표 값으로 변환이 가능
Dataset
Frames Labeled In Cinema(FLIC)
Leeds Sports Dataset(LSP)
Metric
Pose estimation task에 처음으로 심층 신경망(DNN)을 적용한 연구
전체적인 방식(holistic manner)으로 포즈에 대한 context 를 캡처하고 자세에 대한 추론에 있어서 강한 모델을 제시
주로 classification 문제에 이용되었는 CNN이 localization task에서도 좋은 성능을 보여준다는 것을 알 수 있었음.
14기 장혜림
DeepPose
Pose estimation의 초기 모델인 DeepPose의 구조와 아이디어에 대해 알 수 있었던 시간이었습니다. 유익한 강의 감사합니다!
투빅스 14기 김민경
이번 리뷰를 통해 딥러닝 기반 pose estimation의 시작이 된 아이디어를 공부할 수 있었습니다. 유익한 강의 감사합니다:)
14기 김상현
이번 강의는 pose estimation DeepPose 논문 리뷰로 서아라님께서 진행해주셨습니다.
DeepPose에 대해 상세하게 이해할 수 있었습니다.
유익한 강의 감사합니다!