2024년 2월 2일 세미나 발표 내용Compute high-fidelity backpropagation saliency maps without requiring any external priors and preserving the map sanityClass inse
2024년 2월 24일 세미나 내용Researching the impact of self-supervised pretraining on ViT features1\. Transformers have recently emerged as an alternative to co
Producing ‘visual explanations’ for decisions from CNN-based models without decreasing performance of the modelHaving ability to explain why they pred
Exploring the potential to learn general-purpose visual features of self-supervised learning if pretrained on a large quantity of curated dataSuccessi
• Provide fully unsupervised learning method that learn class-agnostic instance segmentation• Instance Segmentation requires costly annotations and se
Exemplar-FreeSOLO to enhance unsupervised instance segmentation by exploiting a limited number of unannotated and unsegmented exemplarsNew exemplar em
Contextrast, contrastive learning-based semantic segmentation method that allows to capture local/global contexts and comprehend their relationshipsCo
2024년 5월 3일 세미나 내용Revisit the use of gradient information in GradCAM and discuss our concerns of why gradients may not be an optimal solution to gener
2024년 3월 29일 세미나 내용Overcoming the difficulties of porting Transformer to various dense prediction tasksObject detection and segmentationOutput feature
PowDew droplet motion의 wettability and porosity 분석POWERED FOOD의 경우 영양적인 가치를 지니기도 하지만, 유아 건강에 악영향을 미칠 수 있는 상품들도 존재Commodity smartphone으로 이러한 부분에 대한 sol
주요 요점DNN(Deep Neural Network)를 Mobile에서 구현하는 경우 사생활 보호와 인프라 독립적인 장점.그러나, Nontrivial Solution으로 취급되어 왔고, Memory Blowup 등의 문제점. Sage로 해결 제안소개Additional
chest X-rays에서 방사선사 수준으로 폐렴을 탐지할 수 있는 알고리즘을 개발하였다.CheXNet 알고리즘에서는 121-layer convolutional neural network를 사용(ChestX-ray 14 데이터셋 이용, 현존하는 가장 큰 chest X-
3개의 인코더를 이용하여 large-scale Transformer multimodal Model을 고안.image-sentence의 많은 양의 pair를 통해 사전 학습을 진행함.(masked language modeling, masked object predicti
end-to-end train 비용때문에 vision-language pre-training의 cost는 매우 높다.BLIP-2의 경우에는 vision-language task에서 이상적인 퍼포먼스를 보여준다.예를 들어, zero-shot VQAv2의 경우에는 Flam
DL에 기반한 바이오메트릭 모델은 한정된 메모리 자원과 컴퓨팅 자원위에서 배포되어야 한다.이전의 모델들은 feature map 중복성 문제를 해결하지 못하였음.Ghost module은 이 분야에서 큰 혁신을 이루었다.컴퓨팅적으로 비싸지 않은 linear transfor