[BDA] 딥러닝 mini project (1)

김지호·2023년 5월 24일
0

BDA-Easy Study

목록 보기
4/5

Intro

BDA 학회에서 딥러닝 mini project를 진행하게 되었다.
우리 팀이 선정한 주제는 "YOLOv5을 활용한 쓰레기 분류 시스템"이다.
이 글에서 진행 과정을 이야기 하도록 하겠다.

Dataset 수집

운 좋게도 케글에 paper, cardboard, glass, plastic, metal, trash 6종류로 깔끔하게 나뉘어져 있는 데이터셋을 발견하였다.
나중에는 크롤링해서 이미지를 구해봐야지...
Kaggle Datasets-Garbage Classification

다운로드를 받은 후 working directory에 dataset이라는 파일로 저장하였다.

데이터 전처리

  1. 이미지 jpg 형식으로 변경
  2. 이미지 증강: imgaug 라이브러리 활용

우리가 케글에서 받은 데이터셋은 이미 jpg 형식이고, 약 2467장에 달하는 파일이기 때문에 데이터 전처리 과정은 생략하였다.

데이터 라벨링

이미지 라벨링 툴 labelImg를 이용해서 이미지 라벨링을 수행할 수 있다. 아래 깃허브 참고하여 Anaconda Prompt에서 진행하였다.

labelImg - Github

모두 다운 받은 뒤 working directory/labelImg-master/data 경로로 가면 predefined_classes.txt라는 파일이 있다. 여기를 클릭해서 이미지 클래스를 적어두자. 내 경우에는 다음과 같다.

이제 라벨링 툴을 다운받은 디렉토리로 이동 후 python labelImg.py [데이터셋 경로][predefined_classes 경로]를 실행하여 열심히 ! 라벨링! 노가다를 ! 뛰면 된다.

라벨링 과정은 아래 블로그를 참고하였다. (정말 감사합니다..)
YOLO 이미지 라벨링을 위한 labelImg 사용법

🍯직접 하며 터득한 나만의 라벨링 꿀팁(?)🍯
1. View --> Auto Save Mode 선택!
2. 이미지 데이터셋을 미리 분류를 해서 폴더마다 구분해놓자! 다음에, 화면 오른쪽에 "Use Default Label" 박스에 체크 표시한 채로 라벨링하자. 그럼 Bounding Box 하나하나 클래스지정 + Ctrl S 할 필요 없음!

profile
험난한 길을 택해버린 비전공자 데이터 분석가

0개의 댓글