비전 쪽에 관심이 생기기도 했고, 학회 스터디의 일환으로 드디어 논문 첫 리뷰를 시작하게 되었습니다. Scene text detection은 굉장히 많은 쓰임새로 인해서 CV 분야에서 굉장히 큰 관심을 받아왔습니다. 특히 text detection 분야의 이 deep
이번 논문은 YOLO v2라고도 불리우는 YOLO9000입니다. 논문 구성이 기존에 읽어왔던 논문들과는 다르게 Introduction 이후에, 제목 그대로 Better/Faster/Stronger에 대한 내용을 다루고 있습니다. 우선 이번 글에서는 Better만 다뤄보
연구실 인턴하면서 필요할 것 같기도하고 굉장히 유명한 GAN 논문 중 하나인 Style GAN을 Review 해보았습니다.아직 학생이기도하고 영어가 미숙하다보니 본 리뷰에 오류가 있을 수도 있습니다. 이 점 감안해주시고 혹시나 찾으신다면 피드백 감사히 받겠습니다. 지금
아직 학생이기도하고 영어가 미숙하다보니 본 리뷰에 오류가 있을 수도 있습니다. 이 점 감안해주시고 혹시나 찾으신다면 피드백 감사히 받겠습니다. Introduction 최근 몇 년간, real-time 기반의 markerless한 얼굴 표정 인식 기술에 대한 여러 발
Introduction View syntheis에 대한 수많은 연구들이 있어왔지만, 해당 연구에서 연구진은 5D scene representation를 기반으로 parameter들을 직접적으로 조절하는 방식으로 View synthesis 문제를 해결했습니다. 연
기말고사 시즌과 새로운 방학을 맞이해 여차저차 바쁘게 사느라 되게 오랜만에 논문 리뷰를 올립니다. 방학에는 아마 NeRF 시리즈와 평소 관심있게 본 BNN 그리고 ViT, MLP Mixer 등 새로운 Vision 분야에 대해서 글을 올릴 것 같습니다. 우선 그 시작은
아직 학생이기도하고 영어가 미숙하다보니 본 리뷰에 오류가 있을 수도 있습니다. 이 점 감안해주시고 혹시나 찾으신다면 피드백 감사히 받겠습니다.오늘 리뷰해 볼 논문은 MLP-Mixer입니다. 사실 ViT를 먼저 리뷰해보고 싶었지만, Transformer 자체도 아직 이해
아직 학생이기도하고 영어가 미숙하다보니 본 리뷰에 오류가 있을 수도 있습니다. 이 점 감안해주시고 혹시나 찾으신다면 피드백 감사히 받겠습니다. 아직 많은 논문을 읽어보지는 않았지만, 3D와 관련된 Implicit neural representation 논문에는 NeR
아직 학생이기도하고 영어가 미숙하다보니 본 리뷰에 오류가 있을 수도 있습니다. 이 점 감안해주시고 혹시나 찾으신다면 피드백 감사히 받겠습니다.
SAGAN review
아직 학생이기도하고 영어가 미숙하다보니 본 리뷰에 오류가 있을 수도 있습니다. 이 점 감안해주시고 혹시나 찾으신다면 피드백 감사히 받겠습니다. Introduction 3D Information에 대해서 표현하는 다양한 방식 중, NeRF는 5D input$(x,y,
Negative Data Augmentation으로 OOD의 prior를 적용한 이미지를 생성해서 이를 기반으로 모델에게 가지말아야할 곳에 대한 방향성을 제시하는 모델... 여기는 가면 안돼!