시리즈

paper

1.[논문리뷰 및 구현] Deep Residual Learning for Image Recognition

resnet을 다룬 논문리뷰 및 코드 구현

2024년 5월 24일

2.[논문 리뷰 및 구현]Identity Mappings in Deep Residual Networks

resnet의 skip connection을 분석한 논문 리뷰 및 코드

2024년 5월 25일

3.[논문 리뷰 및 구현]Aggregated Residual Transformations for Deep Neural Networks

resnext 모델을 소개한 논문 리뷰 및 구현

2024년 6월 6일

4.[논문 리뷰 및 구현] Attention is all you need

transformer 모델을 처음 제시한 논문

2024년 6월 24일

5.[논문 리뷰 및 구현] AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

ViT 즉 이미지에 transformer 모델의 encoder을 사용한 논문

2024년 6월 25일

6.[논문 리뷰 및 구현] A ConvNet for the 2020s

CNN을 transformer 모델의 구조와 비슷하게 만들어서 CNN의 성능을 최대한 이끌어낸 모델

2024년 7월 3일

7.[논문 리뷰] TabTransformer: Tabular Data Modeling Using Contextual Embeddings

Transformer layer를 tabular 분야에 접목한 모델을 제시한 논문

2024년 7월 7일

8.[논문 리뷰 및 구현] MLP-Mixer: An all-MLP Architecture for Vision

MLP만으로 vision 분야에서 유의미한 성능을 보여준 MLP-Mixer 구조를 제시한 논문을 리뷰하였다.

2024년 7월 8일

9.[논문 리뷰] SAINT: Improved Neural Networks for Tabular Data via Row Attention and Contrastive Pre-Training

transformer를 tabular 도메인에 적용한 모델

2024년 7월 12일

10.[논문리뷰 및 구현] Patches Are All You Need?

patch embedding과 convolution Mixer 구조를 이용한 ConvMixer 구조 논문

2024년 7월 16일

11.[논문리뷰] Unsupervised Visual Representation Learning by Context Prediction

이미지 분야에서 image의 spatial context를 활용한 self-supervised learning 방법론을 제시

2024년 7월 18일

12.[논문리뷰] TransTab: Learning Transferable Tabular Transformers Across Tables

variable size tabular data를 학습가능한 TransTab을 제시한 논문

2024년 7월 19일

13.[논문리뷰]Unsupervised Learning of Visual Representations by Solving Jigsaw Puzzles

직쏘 퍼즐을 활용한 image self-supervised learning

2024년 7월 21일

14.[논문 리뷰] Colorization as a proxy task for visual understanding

colorization을 이용한 pretrain

2024년 7월 22일

15.[논문 리뷰 및 구현] UNSUPERVISED REPRESENTATION LEARNING BY PREDICTING IMAGE ROTATIONS

이미지를 회전하는 간단한 방법으로 pre-train의 sota를 달성한 논문

2024년 7월 24일

16.[논문 리뷰] A Simple Framework for Contrastive Learning of Visual Representations

SimCLR 논문으로 대조 학습의 방법을 깔끔하게 정리한 논문

2024년 7월 28일

17.[논문 리뷰 및 구현] Momentum Contrast for Unsupervised Visual Representation Learning

MoCo로 일컬어지는 방법론을 제시한 논문

2024년 7월 30일

18.[논문 리뷰 및 구현] Improved Baselines with Momentum Contrastive Learning

MoCo에 SimCLR의 장점을 결합한 실험 논문

2024년 7월 31일

19.[논문 리뷰] Representation Learning with Contrastive Predictive Coding

contrastive learning을 제기한 초창기 논문

2024년 8월 4일

20.[논문 리뷰] Contrastive Multiview Coding

여러개의 view를 활용한 contrastive learning을 제시

2024년 8월 5일

21.[논문 리뷰] What Makes for Good Views for Contrastive Learning?

contrastive learning의 view에 대한 고찰과 semi-supervised lenaring을 통한 view generator 학습 방법 제시

2024년 8월 15일

22.[논문 리뷰 및 구현] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning

BYOL, positive sample 만으로 contrastive learning을 진행할 수 있음을 보여준 논문

2024년 8월 16일

23.[논문 리뷰 및 구현]Exploring Simple Siamese Representation Learning

매우 간단하면서 좋은 성능을 내는 Simsiam 구조를 제시한 논문

2024년 8월 18일

24.[논문 리뷰및 구현] Playing Atari with Deep Reinforcement Learning

DQN으로 아타리 게임을 학습한 논문

2024년 8월 19일

25.[논문 리뷰]i-MIX: A DOMAIN-AGNOSTIC STRATEGY FOR CONTRASTIVE REPRESENTATION LEARNING - ICLR 2021

i-Mix virtual label을 섞어서 mixup을 contrastive lenaring에 적용한 논문 iclr2021

2024년 8월 22일

26.[논문 리뷰] Masked Autoencoders Are Scalable Vision Learners

ViT 구조를 통한 Masked AutoEncoder (MAE)를 제시한 논문

2024년 8월 23일

27.[논문 리뷰] SELF-SUPERVISED REPRESENTATION LEARNING FROM RANDOM DATA PROJECTORS - ICLR 2024

domain에 영향을 받지 않고 self-supervised learn을 진행하는 방법을 소개

2024년 8월 25일

28.[논문 리뷰]Asynchronous Methods for Deep Reinforcement Learning

A3C 등 비동기 강화학습을 제시한 논문

2024년 8월 25일

29.[논문 리뷰] Deep Clustering for Unsupervised Learning of Visual Features

DeepCluster 논문

2024년 9월 3일

30. [논문 리뷰] World Models

world model에 대해서 다룬 논문

2024년 9월 15일

31.[논문 리뷰] Unsupervised Learning of Visual Features by Contrasting Cluster Assignments

SwAV 논문

2024년 9월 20일

32.[논문 리뷰]BEiT: BERT Pre-Training of Image Transformers

ViT + vision tokenizer을 활용한 pretraining 방법 BEiT를 소개한다.

2024년 9월 21일

33.[논문 리뷰] IBOT : IMAGE BERT PRE-TRAINING WITH ONLINE TOKENIZER

online tokenizer를 이용한 distillation과 masking을 결합한 학습 방법 iBOT을 제시한다.

2024년 9월 22일

34.[논문 리뷰]SubTab: Subsetting Features of Tabular Data for Self-Supervised Representation Learning

Tabular data의 feature을 subset으로 나눠서 학습하는 방법론

2024년 9월 24일

35.[논문 리뷰 및 구현]Learning Latent Dynamics for Planning from Pixels

PlaNet과 Recurrent state-space model(RSSM), Latent Overshooting을 제시

2024년 9월 28일

36.[논문 리뷰] DREAM TO CONTROL: LEARNING BEHAVIORS BY LATENT IMAGINATION

Dreamer를 제시한 논문

2024년 9월 29일

37.[논문 리뷰 및 구현] MASTERING ATARI WITH DISCRETE WORLD MODELS

Dreamer를 개선한 Dreamer V2를 제시한 논문

2024년 10월 6일

38.[논문 리뷰] Mastering Diverse Domains through World Models

dreamer를 개선한 dreamer V3를 통해 다양한 domain의 문제를 해결함

2024년 10월 9일

39.[논문 리뷰] DIFFERENTIAL TRANSFORMER

transformer를 개선한 DIFF Transformer를 제시한 최신 논문

2024년 10월 9일

40.[논문 리뷰] TransDreamer: Reinforcement Learning with Transformer World Models

Dreamer에 Transformer의 장점을 최대한 살려서 넣는 방법과 long-term dependency task를 제시한 논문

2024년 10월 23일

41.[논문 리뷰] TabNet: Attentive Interpretable Tabular Learning

Tabular에 decision tree의 장점을 차용한 architecuture인 TabNet 논문

2024년 10월 27일

42.[논문 리뷰]Discovering and Achieving Goals via World Models

LEXA를 다룬 논문

2024년 11월 1일

43.[논문 리뷰]PERCEIVER IO: A GENERAL ARCHITECTURE FOR STRUCTURED INPUTS & OUTPUTS

Perceiver IO를 제시한 논문 attention을 특이한 방법으로 처리함.

2024년 11월 2일

44.[논문 리뷰 및 구현]Denoising Diffusion Probabilistic Models

DDPM을 제시한 논문이다.

2024년 11월 20일

45.[논문 리뷰]Trust Region Policy Optimization

PPO의 전신인 TRPO를 제시한 논문

2024년 12월 1일

46.[논문 리뷰]UNITABE: A UNIVERSAL PRETRAINING PROTOCOL FOR TABULAR FOUNDATION MODEL IN DATA SCIENCE - ICLR 2024

tabular domain의 foundation 모델 UniTabE를 제시한 논문

2024년 12월 2일

47.[논문 리뷰]XTab: Cross-table Pretraining for Tabular Transformers - ICML 2023

cross table pretraining framework XTab을 제시한 논문

2024년 12월 3일

48.[논문 리뷰]Proximal Policy Optimization Algorithms

TRPO를 실용적이게 개선한 PPO 논문

2024년 12월 7일

49.[논문 리뷰]Mastering the Game of Go with Deep Neural Networks and Tree Search

알파고 논문

2024년 12월 19일

50.[논문 리뷰]Mastering the Game of Go without Human Knowledge

사람의 지식 없이 학습하는 알파고 제로를 제시한 논문

2024년 12월 19일

51.[논문 리뷰]Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model

AlphaZero를 model을 이용하여 학습하는 MuZero를 제시한 논문

2024년 12월 21일

52.[논문 리뷰]Planning with Diffusion for Flexible Behavior Synthesis

Diffusion을 이용한 planning Diffuser을 제시한 논문

2024년 12월 22일

53.[논문 리뷰]Neural Discrete Representation Learning

VQ-VAE를 제시한 논문

2024년 12월 27일

54.[논문 리뷰]DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

강화학습으로 o1과 비슷한 성능을 보인 deepseek r1 모델 리포트

2025년 1월 26일

55.[논문 리뷰]Probabilistic Inference in Language Models via Twisted Sequential Monte Carlo

sequential monte carlo를 이용하여 target distribution에서 sample을 뽑는 방법을 설명한 논문

2025년 2월 8일

56.[논문 리뷰]Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach

recurrent layer를 통한 train, test time computation

2025년 2월 11일

57.[논문 리뷰 및 구현]CONDITIONAL POSITIONAL ENCODINGS FOR VISION TRANSFORMERS

positional embedding generator(PEG)를 제시한 논문

2025년 3월 3일

58.[논문 리뷰] Monte Carlo Tree Diffusion for System 2 Planning

diffusion에 efficient하게 MCTS를 적용한 논문

2025년 3월 25일

59.[논문 리뷰]Offline Reinforcement Learning with Discrete Diffusion Skills

discrete skillset을 활용해서 offline RL을 진행하는 논문

2025년 3월 31일

60.[논문 리뷰]d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning

discrete diffusion의 강화학습을 소개한 논문

2025년 4월 20일

61.[논문 리뷰] Beyond Masked and Unmasked: Discrete Diffusion Models via Partial Masking

Masked diffusion language model을 더 잘게 bit 단위로 쪼개서 복구하는 논문

2025년 8월 1일

62.[논문 리뷰] Mixture-of-Recursions: Learning Dynamic Recursive Depths for Adaptive Token-Level Computation

efficient한 구조로 transformer와 비슷한 성능을 보임

2025년 8월 20일

63.[논문 리뷰] Thinking Augmented Pre-training

스스로 data augmentation을 하는 것에 대한 논문

2025년 9월 29일

64.[논문 리뷰] Reinforcement Learning via Self-Distillation

error message를 context를 준 Teacher model을 이용한 Self-distillation을 통해 reinforcement를 진행하는 논문

2026년 2월 8일

65.[논문 리뷰] Unified Latents (UL): How to train your latents

stable diffusion의 prior를 diffusion으로 modeling

2026년 5월 17일