데이콘 VISOL 합성데이터 기반 객체 탐지 AI 경진대회

미남홀란드·2023년 7월 5일

경진대회

목록 보기

1/2

🎊 대회결과

상위 10% 달성 총 1461팀 참가 public 55등 , private 54등

Private

💁‍♂️ 대회소개

[배경]

비솔(VISOL)은 영상분야 AI 학습용 합성데이터(Synthetic Data) 공급 사업을 준비하고 있습니다.

합성데이터란 실제 환경에서 수집되거나 측정되는 것이 아니라 디지털 환경에서 생성되는 데이터셋으로,

최근 방대한 양질의 데이터셋이 필요해짐에 따라 그 중요성이 대두되고 있습니다.

합성 데이터는 데이터 라벨링 작업을 위한 2배 이상의 시간 절약과 10배 가까운 비용을 절감하게 하고, 자동화를 바탕으로 정확한 라벨링의 데이터 그리고 정확한 AI 모델 개발을 위한 데이터의 다양화를 가능하게 합니다.

본 경진대회는 실사와 같은 객체와 배경을 비솔의 3D Rendering과 VFX 기술로 생성된 AI 학습용 고품질 합성데이터를 바탕으로 진행됩니다.

대회규칙

일정

📂 데이터설명

Dataset Info.

train [폴더]

합성 이미지로 구성된 학습 데이터
이미지는 png파일로 주어지며, 동일한 파일명으로 매핑되는 txt파일에 annotation 정보가 제공됨
annotation 정보
class_id
LabelMe 형식의 Bounding Box 좌표
(객체의 4개 꼭지점(x, y) 좌표 정보)

test [폴더]

실제 이미지로 구성된 평가 데이터
이미지는 png파일로 주어짐

classes.txt [파일]

class_id, class_name 존재
총 34개의 자동차 세부 종류 Class

sample_submission.csv [파일]

test 파일 하나에 복수의 객체 기록 가능
최대 30,000줄까지 기록 가능 (중요)
file_name : test 파일 이름
class_id : 검출한 객체 id
confidence : 검출한 객체의 정확도(0~1)
point1_x : 검출한 객체 좌상단 x좌표
point1_y : 검출한 객체 좌상단 y좌표
point2_x : 검출한 객체 우상단 x좌표
point2_y : 검출한 객체 우상단 y좌표
point3_x : 검출한 객체 우하단 x좌표
point3_y : 검출한 객체 우하단 y좌표
point4_x : 검출한 객체 좌하단 x좌표
point4_y : 검출한 객체 좌하단 y좌표

📄 Code

Upload files · jh941213/yolov8-visol

🏆 대회 전략

모델 핸들링

🚴‍♂️ Model Selection

객체탐지 Detection 성능 우수 모델 YOLOv8 활용

✔️ 이전 대회 및 프로젝트에서 우수한 성능을 보였던 v8모델 선택

✔️ mmDetection 을 고려하였으나 실무보단 성능 및 점수개선이 목적

✔️ BaseLine Label Me yolo데이터로 코드 변환 분석

🧚‍♀️ Image Size

순차적으로 이미지 사이지를 크게 늘려보았다. 이전 택배 실무 프로젝트에서도 mAP 자체가 크게 올랐던

경험이 있었기 때문에 img size를 키웠고 , synetic 데이터 특징상 mAP 0.995 거의 일치를 하였으나 아마

라벨의 좌표에 따라 점수 성능이 갈렸던 것 같다.

640 → 1280 → 1920

데이터 핸들링

👀 합성데이터

👉 Label Me

YOLOv5 Label me 베이스라인 및 레퍼런스 코드 참조
기존 일반이미지의 좌표를 yolo dataset 구성하여 모델 학습 준비
roboflow에 라벨 작업한 결과물을 업로드 하였으나 잦은 오류로 코드로 변경

👉 어그먼테이션 진행

같은 데이터라도 Aug 기법을 활용하여, 성능개선을 위한 데이터증강
이미지의 회전, 각도 수정은 한 방향의 사진이기 때문에 의미 없어서 데이터 증강 X
GrayScale, Hue 등 색깔에 관련된 어그먼테이션 시도

🙇‍♂️ Positive & Negative

🙆 Positive

모델을 쓰기 위한 데이터 인풋 형식을 그에 맞는 코드로 변환 레퍼런스 참조

🙅 Negative

GPU 자원의 한계점

🎥 대회를 마치며

이번 대회에는 기존 부트캠프 팀원과 이전 깃수의 수료생과 한팀을 merge 하여 진행하였다. 뭔가 처음과 달리 열정이 조금 부족했던거 같고, 조금 아쉬운건 역시나 GPU 자원문제이다 개개인이 하기에는 학부, 대학원, 자원이 많은 사람을 이길수가 없었다. 코드 솔루션을 보니 imgsize 를 3000때로 키워서 yolo를 학습시키고 있었다.

결국 나도 사람의 자원문제는 어쩔수 없어서 GPU Local 4090을 맞추었다. 다음 vision 대회를 이 꽉깨물고 기다려서 꼭 좋은 결과를 내보고싶다.

미남홀란드

AI engineer

다음 포스트