Computer Vision?

처음에 CV라는 단어를 들었을 때 컴퓨터가 어떤 방식으로 진행하는지 궁금했습니다. 아무래도 1과 0으로 인식하는 컴퓨터의 특징이 가장 큰 문제점이 되지 않을까 생각했습니다. 이는 수업 첫날에

CV Basic, Advanced

Basic에서는 CV의 기본 구조와 CNN(Convolutional Neural Network)에 대해 배우는 시간이었습니다. AlexNet, VGG, ResNet, EfficientNet 등 다양한 모델을 배우고 실습하는 시간이었습니다.
Advanced에서는 Transformer를 배우며 vit모델, Sematic Sementation을 배우고 SegFormer를 배우는 시간이 되었습니다. CV모델의 최근 동향과 CV 모델의 성능향상에 필요한 것을 배웠습니다.

대회를 진행하다

CV를 2주간 수업을 듣고 대회를 진행했습니다. 문서 이미지 분류 대회를 2주 간 진행하게 되었고 총 5명이 한팀이 되어 대회를 진행했습니다. 이번 대회에서 저는 다양한 모델을 테스트하여 대회에 맞는 모델을 찾는 데 집중했습니다. 대회 측에서 주어지는 GPU를 최대한 활용하여 다양한 모델을 테스트했고 테스트 데이터에 큰 수정 없이 모델 만으로 0.9를 넘는 모델을 탐색하는데 성공했습니다. 인강에서 들은 모델과 인터넷 검색으로 모델을 탐색하여 테스트하기에 많은 엉뚱한 모델을 테스트하기도 했지만 다양한 모델을 알게 되는 계기가 되었습니다.

생성 모델

대회가 마무리 된 후 Generation을 1주일간 배우게 되었습니다. 특히 GANs의 판별자와 생성자가 서로 대립하면서 발전하는 형태가 인상적이었습니다.

0개의 댓글