profile
나는야 호기심 많은 느림보🤖
post-thumbnail

DALL-E 논문 정리

이번 DALL-E 논문은 MultiModal task에 관심이 많아져서 읽고 싶었던 논문이다.이미지 생성 모델답게 어려운 수식들이 있었지만 저걸 어떻게 하지?로 시작해서 어떤 아이디어로 이 모델이 학습되었구나를 알아가는 과정을 즐길 수 있었다.이전에는 논문 형식을 지키

2022년 4월 29일
·
0개의 댓글
·
post-thumbnail

Improving Language Understanding by Generative Pre-training | GPT-1 | 논문 정리

Author: Alec Radford, OpenAIReading date: March 20, 2022 11:50 AMSubmitted date: 2018Summary: GPT-1Type: Paperunlabeled 텍스트 corpus들은 많은 반면에 특정 task들에

2022년 3월 20일
·
0개의 댓글
·
post-thumbnail

BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding | 논문 정리

Author: Google AI Language, Jacob DevlinLink: https://arxiv.org/pdf/1810.04805.pdfReading date: March 13, 2022 12:44 PMStatus: ReadingType: Paper

2022년 3월 14일
·
0개의 댓글
·
post-thumbnail

Alleviating Over-segmentation Errors by Detecting Action Boundaries | ASRF | 논문 정리 | Action Segmentation

Submitted date: July 14, 2020Summary: ASRFType: PaperASRF - Action Segment Ref

2022년 3월 4일
·
0개의 댓글
·
post-thumbnail

ASFormer 논문 정리 | Action Segmentation

이 논문은 2021년에 나온 Transformer를 action segmentation task에 맞게 변형시킨 모델에 대해 나와있다.NLP의 Transformer가 CV에서도 활용되어 여러 논문들이 나왔다고 들었는데 action segmentation task에도 나

2022년 2월 26일
·
1개의 댓글
·

MobileNet 논문요약

link : https://arxiv.org/pdf/1704.04861.pdf이전 연구들은 대부분 네트워크를 작게 만드는 것을 위주로 연구를 하였다. 이 논문은 efiiciency 관점에서 연구하였다.이 논문에서는 효과적인 네트워크 구조와 2개의 하이퍼파라미터

2022년 1월 19일
·
0개의 댓글
·

Resent 논문요약

Link : https://arxiv.org/pdf/1512.03385.pdf깊은 뉴럴 네트워크를 residual 프레임워크로 더 쉽게 학습시키는 것을 보여준다.이 residual 네트워크들이 최적화하기 쉬우며 깊이가 증가해도 정확성이 있다는 것을 보여준다.

2022년 1월 19일
·
0개의 댓글
·

VGGNet 논문요약

(3 X 3)매우 작은 컨볼루션 필터를 가지고 depth를 16 - 19 가중치 레이어까지 밀어내면서 점점 증가시켰더니 기존보다 성능이 증가하였다.목적 : 네트워크 깊이가 대규모 이미지 인식 정확도에 어떤 영향을 받는지ConvNets가 컴퓨터 비전 분야에서 의미가 커지

2022년 1월 19일
·
0개의 댓글
·