
현재 작성중인 PSPN(Pyramid Scene Parsing Network)논문 리뷰에 앞서, 함께 설명할 dilation, linear-interpolation 그리고 Bilinear upsampling에 대해서 간략하게 설명하고자 한다.먼저 dilation에 대해

이번에는 ViT를 PyTorch로 구현해보고자 한다.2021년 이후 Computer Vision의 Foundation Model로 빼먹을 수 없는 ViT.. 간단한 Image Classification Dataset을 사용하여 Image Classification을 위

이런 식으로 사진이 지직 거리는 느낌의 이미지를 본 적 있을 것이다. 이런 잡음을 가우시안 노이즈라고 한다. 이름처럼 가우스 함수에 따른 분포를 따르고 있기 때문에 가우시안 노이즈라고 이름이 붙여졌다. 가우시안 노이즈는 보통 이미지의 압축, 전송 등의 과정에서 발
많은 현재 NLP 시스템이 단어를 ‘원자 단위 (Atomic Units)’로 취급한다. 해당 취급 과정은 단어 간의 유사성 개념이 없고 어휘를 그저 인덱스로 표현할 뿐이다. → 그냥 의미가 따로 없는 단어들을 인덱싱 하는 것이 방식은 단어 간 유사성 (Similarit

RNN, LSTM, 특히 GRU, LSTM은 언어모델링이나 기계 번역과 같은 시퀸스 처리 (Sequence modeling) 문제에서 ‘최고 수준(state-of-the-art)’ 기술로 자리 잡았었다. 📌 RNN은 문장처럼 순서가 있는 데이터를 처리하는 데 특화된
지금까지의 object detection 모델들은 bounding box로 나누어서 bounding box마다 이미지를 분류하는 방식이었다. YOLO는 그 둘을 하나의 회귀 문제로 엮고 객체 탐지의 모든 요소를 단일 신경망. single nueral network 로

` ImageNet Classification with Deep Convolutional Neural Networks (2012) ` 논문을 읽고. . 이 논문에서는 AlexNet이라는 이름이 직접적으로 등장하지는 않지만, 이 논문이 말하고자 하는 모델이 AlexNe
지도학습, 비지도학습, 준지도학습은 들어봤지만 필자에게 연합학습은 생소하다. 연합학습이 무엇인지, 어떻게 사용되는지 알아보자. 연합학습의 등장 배경 AI 모델은 방대한 양의 데이터를 필요로 한다. 이러한 데이터 세트는 일반적으로 모델 훈련을 위해 하나의 위치에 중앙집중화 되어 있으며, 이로 인해 데이터 전송 또는 저장 중에 개인 식별 가능 정보 (PII)...

사람은 거리에 상관 없이 같은 물체는 같다고 인식한다. 단지 세세한 내용을 인식할 수 있는 정도에 차이가 있을 뿐이다. 컴퓨터 비전이 물체의 스케일에 대처하는 인간의 이런 능력을 갖출 수 있을까? 스케일 공간 이론은 스케일 불변의 가능성을 열어준다. 스케일 공간(Sc