(3 X 3)매우 작은 컨볼루션 필터를 가지고 depth를 16 - 19 가중치 레이어까지 밀어내면서 점점 증가시켰더니 기존보다 성능이 증가하였다.목적 : 네트워크 깊이가 대규모 이미지 인식 정확도에 어떤 영향을 받는지ConvNets가 컴퓨터 비전 분야에서 의미가 커지
Link : https://arxiv.org/pdf/1512.03385.pdf깊은 뉴럴 네트워크를 residual 프레임워크로 더 쉽게 학습시키는 것을 보여준다.이 residual 네트워크들이 최적화하기 쉬우며 깊이가 증가해도 정확성이 있다는 것을 보여준다.
link : https://arxiv.org/pdf/1704.04861.pdf이전 연구들은 대부분 네트워크를 작게 만드는 것을 위주로 연구를 하였다. 이 논문은 efiiciency 관점에서 연구하였다.이 논문에서는 효과적인 네트워크 구조와 2개의 하이퍼파라미터
이 논문은 2021년에 나온 Transformer를 action segmentation task에 맞게 변형시킨 모델에 대해 나와있다.NLP의 Transformer가 CV에서도 활용되어 여러 논문들이 나왔다고 들었는데 action segmentation task에도 나
Submitted date: July 14, 2020Summary: ASRFType: PaperASRF - Action Segment Ref
Author: Google AI Language, Jacob DevlinLink: https://arxiv.org/pdf/1810.04805.pdfReading date: March 13, 2022 12:44 PMStatus: ReadingType: Paper
Author: Alec Radford, OpenAIReading date: March 20, 2022 11:50 AMSubmitted date: 2018Summary: GPT-1Type: Paperunlabeled 텍스트 corpus들은 많은 반면에 특정 task들에
이번 DALL-E 논문은 MultiModal task에 관심이 많아져서 읽고 싶었던 논문이다.이미지 생성 모델답게 어려운 수식들이 있었지만 저걸 어떻게 하지?로 시작해서 어떤 아이디어로 이 모델이 학습되었구나를 알아가는 과정을 즐길 수 있었다.이전에는 논문 형식을 지키