[부스트 캠프 Pstage-2] - Semantic Segmentation >Public LB Score 0.7207 Private LB Score 0.7059 (5등) [나의 목표] 적어도 사용한 모델에 대해서는 알아보자 Semantic Segmentation
EAST 는 기존 Text Detection 과는 달리 2단계의 단순한 프로세스로 당시 SOTA를 달성.화소 단위정보를 출력하는 FCN (1 Step) 과 이를 후처리 (2 Step) 하여 Predict 함. 2가지의 정보를 Pixel-wise (화소마다) 로 출력Pi
Public LB Score 0.7207Private LB Score 0.7059 (5등)적어도 사용한 모델에 대해서는 알아보자Cascade R-CNN, Centernet2, ATSS, HTC, YOLO 등 최대한 많은 모델 사용 시도Object Detection T
Fully Connected 는 이전 Layer 의 모든 뉴런이 다음 Layer 의 모든 뉴런과 연결된 상태를 뜻한다.FC 는 Flatten 된 1차원 배열을 통해 이미지를 Classification 하는데 사용된다.Gray Scale 이미지의 경우 Channel =
Overfitting 은 Model 학습데이터를 과도하게 학습하게 되어, 학습데이터 이외의 새로운 데이터에 대해 예측을 하지 못하는 현상이다.Underfitting 은 Model 이 학습을 제대로 하지못하여, 어떠한 데이터도 예측 하지 못하는 현상이다.더 많은 Data
1. Training 세트와 Test 세트를 분리하는 이유는? 2. Validation 세트가 따로 있는 이유는? 3. Test 세트가 오염되었다는 말의 뜻은? Training Set 이란? >* 이름 그대로 Train(학습) 을 위해 사용되는 데이터이다. > > >
Multi-modal 은 여러 가지 형태와 의미로 컴퓨터와 대화하는 환경을 뜻한다.따라서, Multi-modal Learning 은 다양한 형태의 데이터를 입력 데이터로 사용한다는 의미이다.1\. Different representations between modali
정방행렬 A를 선형 변환으로 보고, 선형 변환 A에 의한 결과가 자기 자신의 상수 배가 되는 0이 아닌 벡터를 고유벡터(eigenvector)라고 하고, 해당 상수 배 값을 고유값(eigenvalue) 라 합니다. 고유값과 고유벡터는 SVD(특이값분해), Pesudo-
Instance Segmentation 은 Object 를 Class 별로 구분 할 뿐 만 아니라, 같은 Class 내에서 서로 다른 Instance 까지 구분 하는 것을 뜻한다.기존 Faster R-CNN RPN의 RoI 에 대해 Classfication 과 BBR
Selective Search 알고리즘은 Segmentation 분야에 주로 사용 되는 알고리즘이다.Over-Segmentation 을 통해 Random 한 bounding box 들을 생성하고, 객체와 주변간의 색감(Color), 질감(Texture) 등의 차이를 통
Image Classification 은 하나의 이미지 전체에 대해 Classify 를 하는 것이며, Semantic Segmentation 은 각 Pixel 마다 Classify 하는 것이다.Semantic Segmentation 시, 같은 Category의 Inst
Classifier 는 Image를 하나의 Category 로 Mapping 하는 f() 역할이다.데이터가 존재한다면, 모든 Classificaiton 문제는 K-NN 으로 해결가능하다.→ But, real world의 모든 데이터 저장은 불가능 !Single Full
Private LB Score 0.7270Resnet152, Swin-Transformer, NFnet, Efficientnet 등 여러 가지 모델을 사용 해보았지만, 모델 변경을 통한 성능 향상을 기대하기는 어려웠음적은 Data 때문이라 생각하여, 이후 실험들에서는
Warp up Report 1. Data Labeling 2. Modeling 1. DataLabeling Data Info Basic Train Data Folder StructureZ Target Train Data Folder Structure Gene
Model 은 객체, 사람 또는 시스템에 대한 정보의 표현이며, 모형이라고도 부를 수 있다.Pytorch 는 Low-level, Pythonic, Flexibility 의 특징을 가진다.Pytorch의 Model의 모든 Layer는 nn.Module Class를 상속
오늘 학습 내용 1. Docker 2. MLflow 1. Docker 가상화란 개발을 진행 한 후 배포하는 단계에 있어, 동일한 실행 환경을 보장하기 위해서 사용하는 개념이다. 주로 호스트 머신위에 OS를 포함한 가상화 소프트웨어를 두는 VM(Virtual Ma
오늘 학습 내용 1. Linux 2. Shell Command 1. Linux 개인 PC 보다는 서버에서 자주 사용하는 OS 이다. 무료 오픈소스이며, 여러가지 버전이 존재한다. CLI(Command Line Interface)는 Terminal 상에서 작업하
오늘 학습 내용 1. VIT (Vision Transformer) 1. VIT (Vision Transformer) NLP 분야에 있어서 새로운 기준이 되어왔던 Transformer의 Self-Attention을 CV에 적용시키려는 시도에서 시작되었다. 구글에서
AutoEncoder 는 입력을 낮은 차원의 Latent Vector(잠재벡터)로 변환시킨 뒤 원래 차원으로 복원 시키는 과정을 반복 함으로써 학습하는 방법을 뜻한다.이렇게 하여 학습된 Encoder는 Input Data로 부터 특정한 Feature를 추출 할 수 있다
Sequential Data는 아래와 같이 순서의 변형에 취약해 학습시키기 어렵다.Transformer 는 Sequence Data to Sequence Data 의 구조이며, NLP 분야뿐만이 아닌 여러 분야에서 사용이 가능하다.Input 과 Output Data의