
FTIC (ICLR 2024)ICLR 2024 논문으로 딥러닝을 이용한 이미지 압축 논문이다. (코드 O)인코더, 디코더 내에 Swin transformer의 4가지 형태로 윈도우 설정인코더 디코더 FFN 부분에 주파수 변환 -> linear -> 역변환 수행Entro
H.264 논문주로 보던 딥러닝 논문과는 다르게 엄청 자세한 알고리즘까진 언급이 안되어 있다. 아마 기존 고전 코덱들에서 쌓아 올려온 기술이기에 그런듯 하다. 인코더: Prediction -> transformation(ex. DCT) -> encoding(to bit

해당 논문 이전의 Entropy model들은 모두 CNN 기반의 구조여서 local한 redundancy만 고려하고, global redundancy를 고려하지 못한다는 문제의식에서 시작한다.CNN 구조였던 Entropy model에 global 처리를 추가하는 첫

이 논문 역시 transformer 구조를 활용한 entropy model이다. 구조 자체는 hyperprior 기반의 autoregressive entropy model 과 동일하게, 인코더로 얻은 latent y 중 이미 전송한 $\\hat{y}$과 hyper e

논문 링크: https://arxiv.org/abs/2507.19125코드 링크: https://github.com/lyq133/LIC-HPCM/tree/masterDCVC-TCM을 쓴 Microsoft 팀에 계시던 저자분 두분이 학교에서 지도하신 논