Skip Connection으로 degradation 문제를 해결하며, 초심층 CNN 학습을 가능하게 만든 모델
DeepSeek-OCR
오늘날 llm의 기준이 되는 트랜스포머에 대해 알아보자.
class imbalance 환경에서 기존 방법 대비 더 나은 균형 성능을 제공하는 GLA와 GCA에 대해 알아보자!