sequence data - 연속적인 데이터 ex) speech reconition , Music generation , sentiment classification,Machine translation, Video activity recognitionSequence d
Activation Function [1] ReLU non-saturating , nonlinearity Gradient Vanishing 해결 연산량이 적음 dying ReLU problem : weight 가 특정 뉴런이 activate되지 않도록 바뀌면, 해당 뉴런을 지나는 gradient도 0이 된다. -> 이를 막기 위해서 learning rat...
MultiModal프로젝트를 진행하면서 동향 발표를 진행하였고Multimodal model로 VATT를 사용하고자 했는데 왜 사용하는지에 대해 강조하고자 하였다. 거기서 MultiModal representation Learning 에 대해 맡아서 공부했던 부분이다.
Preview 3가지 기법을 제안 local patch stacking global average
bottleneck에 해당하던 Region proposal 작업을 GPU 장치에서 수행(RPN적용)end-to-end 학습 VGG16 으로 image의 특징을 추출 하고 Region Proposal Network(RPN)은 물체가 있을 법한 위치를 찾아 classifi
In this, we seek to learn a multimodal versatile network, defined as a network that has the following four properties: (i) 세 가지 모달리티 중 어느 하나라도 입력으로 취할
이미지 내에서 사물 인식하는 방법에는 다양한 유형이 존재한다. classification classification + Localization : 하나의 물체 위치를 찾는 문제 Object Detection : 다수의 사물의 위치와 클래스를 바운딩박스로 분류하는 문제
Preview 2-stage Selective Search 를 이용해 2,000개의 Region Proposal 을 생성 각 Region Proposal 을 동일한 크기의 이미지로 warping warping image를 일일이 CNN 에 넣어서 foward 결과를 계
Title > Abstract > Conclusion > Results & discussion (data) > Introduction > Results & discussion (detail) 1.Abstract 120만개의 high-resolution image를 1