인공지능06

서유리·2022년 8월 1일
0

AI_Study

목록 보기
6/25
post-thumbnail

🔴 공부할 영상 및 링크주소

🔵 YOLO 사용한 영상인식 이해 및 실습 (1)
◾ YOLO3 정의/특징

  • You Only Look Once/1회를 강조한 이름
  • 영역 탐지와 분류를 동시에 실행
  • 장점 : 빠르다
  • 정확도 : 다소 떨어진다
  • 성능
    : inference time(ms)는 결과가 나올 때까지 걸리는 시간
    : YOLO 기준점은 0이 아닌, 그보다 높다
    : mPM은 높을수록, 성능이 좋다는 의미인데, YOLO는 다른 것보다 더 성능과 정확도가 높다고 할 수 있다

🔵 YOLO 사용한 영상인식 이해 및 실습 (2)
◾ 탐지방식 (각 셀의 탐지)

  • 각 셀별 2개의 박스를 탐지
  • 셀에 중심을 두는 박스
  • 각 박스 별로 분류
  • 영역의 박스와 해당 박스의 분류를 동시에 복수개 출력하는 네트워크
  • 모두 98개(7x7x2)가 제안되다
  • 중복되지 않고 확신도가 높은 것만 추린다

🔵 YOLO 사용한 영상인식 이해 및 실습 (3)
◾ 구조

  • GoogLeNet을 기반으로 한 CNN을 사용
  • 입력은 일반 이미지를 입력으로 받는다
  • 출력은 98개 상자에 대한 정보(위치, 폭과 높이)와 클래스와 확신도를 출력으로 한다

🔵 YOLO 사용한 영상인식 이해 및 실습 (4)
◾ VOC 데이터 포멧

  • 루트 폴더 아래 2개의 폴더 + 1개 파일이 있다
    : Annotations (레이블링 xml 파일)
    : JPEGImages (이미지 파일)
    : classes.txt
  • box 값에 대한 의미는 jpg 대신에 xml에 들어있다
dental_image_in_voc_format/
	classes.txt
    Annotataions/
    	301.xml 
        302.xml
        ...
    JPEGImages/
    	301.jpg
        302.jpg
  • YOLO 레이블링 데이터 파일의 example
    : Annotations/301.xml
<annotation>
	<path>dental_image_in_voc_format/JPEGImages/301.jpg</path> # 이미지 이름
	<object>
    	<bndbox>
        	<xmin>103</xmin>
            <ymin>33</ymin>
            <xmax>171</xmax>
            <ymax>100</ymax>
         </bndbox>
     </object>
     <object>
     	<bndbox>
        	<xmin>133</xmin>
            <ymin>109</ymin>
            <xmax>222</xmax>
            <ymax>181</ymax>
         </bndbox>
     </object>
<annotation>

🔵 YOLO 사용한 영상인식 이해 및 실습 (5)
◾ darknet의 레이블링 데이터 포멧

  • 2개의 파일과 1개의 폴더가 있다
    : train_all.txt (레이블링 데이터가 담긴 파일로, 이름은 임의 가능)
    : JPEGImage (이미지 파일이 있다)
    : classes.txt (클래스의 이름이 담긴 파일)
train_all.txt
dental_image_in_voc_format/
	classes.txt
    JPEGImages/
    	301.jpg
        302.jpg
        ...

🔵 YOLO 사용한 영상인식 이해 및 실습 (6)
◾ 레이블링 데이터 포멧

  • 파일이름 + box 1정보 + box 2 정보 + ...
dental_image_in_voc_format/JPEGImages/301.jpg 103,33,171,100,2 133,109,222,181,2 

◾ 설명 (위의 코드에 대한 설명)

  • 이름 : dental_image_in_voc_format
  • box1 정보 : box 좌상단 좌표 (103,33), box 우하단 좌표 (171,100), (클래스 인덱스) 2
  • box2 정보 : box 좌상단 좌표 (133,109), box 우하단 좌표 (222,181), (클래스 인덱스) 2
profile
best of best

0개의 댓글