🔴 공부할 영상 및 링크주소
- 🟠 DNN, CNN, YOLO, ResNET
https://www.youtube.com/watch?v=HAhMy6St7oc- 🟡 YOLO ver_4 인공지능 주차장 차단기 만들기 + 번호판 인식
https://www.youtube.com/watch?v=mmFrZV1iH0c- 🟢 YOLO ver_5 학습 튜토리얼
https://www.youtube.com/watch?v=T0DO1C8uYP8- 🔵 YOLO ver_7 딥러닝 영상분류/영상인식
https://www.youtube.com/watch?v=c18ILApJ1OU- 🟣 YOLO ver_7 상위버전
https://github.com/WongKinYiu/yolov7
🔵 YOLO 사용한 영상인식 이해 및 실습 (1)
◾ YOLO3 정의/특징
- You Only Look Once/1회를 강조한 이름
- 영역 탐지와 분류를 동시에 실행
- 장점 : 빠르다
- 정확도 : 다소 떨어진다
- 성능
: inference time(ms)는 결과가 나올 때까지 걸리는 시간
: YOLO 기준점은 0이 아닌, 그보다 높다
: mPM은 높을수록, 성능이 좋다는 의미인데, YOLO는 다른 것보다 더 성능과 정확도가 높다고 할 수 있다
🔵 YOLO 사용한 영상인식 이해 및 실습 (2)
◾ 탐지방식 (각 셀의 탐지)
- 각 셀별 2개의 박스를 탐지
- 셀에 중심을 두는 박스
- 각 박스 별로 분류
- 영역의 박스와 해당 박스의 분류를 동시에 복수개 출력하는 네트워크
- 모두 98개(7x7x2)가 제안되다
- 중복되지 않고 확신도가 높은 것만 추린다
🔵 YOLO 사용한 영상인식 이해 및 실습 (3)
◾ 구조
- GoogLeNet을 기반으로 한 CNN을 사용
- 입력은 일반 이미지를 입력으로 받는다
- 출력은 98개 상자에 대한 정보(위치, 폭과 높이)와 클래스와 확신도를 출력으로 한다
🔵 YOLO 사용한 영상인식 이해 및 실습 (4)
◾ VOC 데이터 포멧
- 루트 폴더 아래 2개의 폴더 + 1개 파일이 있다
: Annotations (레이블링 xml 파일)
: JPEGImages (이미지 파일)
: classes.txt- box 값에 대한 의미는 jpg 대신에 xml에 들어있다
dental_image_in_voc_format/ classes.txt Annotataions/ 301.xml 302.xml ... JPEGImages/ 301.jpg 302.jpg
- YOLO
레이블링
데이터 파일의 example
: Annotations/301.xml<annotation> <path>dental_image_in_voc_format/JPEGImages/301.jpg</path> # 이미지 이름 <object> <bndbox> <xmin>103</xmin> <ymin>33</ymin> <xmax>171</xmax> <ymax>100</ymax> </bndbox> </object> <object> <bndbox> <xmin>133</xmin> <ymin>109</ymin> <xmax>222</xmax> <ymax>181</ymax> </bndbox> </object> <annotation>
🔵 YOLO 사용한 영상인식 이해 및 실습 (5)
◾ darknet의 레이블링 데이터 포멧
- 2개의 파일과 1개의 폴더가 있다
: train_all.txt (레이블링 데이터가 담긴 파일로, 이름은 임의 가능)
: JPEGImage (이미지 파일이 있다)
: classes.txt (클래스의 이름이 담긴 파일)train_all.txt dental_image_in_voc_format/ classes.txt JPEGImages/ 301.jpg 302.jpg ...
🔵 YOLO 사용한 영상인식 이해 및 실습 (6)
◾ 레이블링 데이터 포멧
- 파일이름 + box 1정보 + box 2 정보 + ...
dental_image_in_voc_format/JPEGImages/301.jpg 103,33,171,100,2 133,109,222,181,2
◾ 설명 (위의 코드에 대한 설명)
- 이름 : dental_image_in_voc_format
- box1 정보 : box 좌상단 좌표 (103,33), box 우하단 좌표 (171,100), (클래스 인덱스) 2
- box2 정보 : box 좌상단 좌표 (133,109), box 우하단 좌표 (222,181), (클래스 인덱스) 2