파이널_데이터수집_데이터 설명과 분석

Yul Yoon·2023년 2월 19일

데이터 소개 영상 요약

1. 데이터 출처

1.1 출처

1.1.1 주제

야생동물 활동 영상 데이터 -노아이에스앤씨-인공지능 학습용 데이터 교육 영상

1.1.2 주관-참여-후원

  • 주관 : NOAA SNC
  • 참여 : 에스제이엠앤씨(주), SDM ENC, 엠케이지, 구례군
  • 후원 : 과학기술정보통신부, NIA 한국지능정보사회지능원

2. 데이터 소개 (AI-Hub 동영상 요약자료)

2.1 야생동물활동영상 데이터 소개

2.1.1 사업목적

  • 야생동물 피해 방지 및 보전·관리를 위한 학습용 데이터 구축

2.1.2 사업목표

  • 인공지능 학습용 데이터 구축을 통한 야생동물 보전·관리 및 위험요소 신속대응

2.1.3 세부내용

가. 야생동물 활동 영상 데이터 구축

  • AI를 통한 야생동물 총분류를 신속하게 할 뿐 아니라 야생동물 활동을 분석하여 야생동물 모니터링에 활용하도록 데이터 구축
  • 야생동물 포유류 500시간 이상 데이터 구축
    나. 야생동물 식별 서비스
  • 야생동물에게 문제가 발생할 경우, 혹은 야생동물로 인한 문제 발생시 이를 인공지능 적으로 식별하여 신속한 대응을 할 수 있도록, 야생동물 식별 및 모니터링을 위한 학습용 데이터 구축
    다. 일자리 창출 및 타산업 활용
  • 야생동물 및 동물 산업에 활용되어 성과창출
  • 크라우드 소싱을 적극 활용한 데이터셋 구축으로 고용창출
  • 비대면 고용창출로 인한 장애인 등의 사회적 약자 고용창출

2.1.4 기대효과

가. 야생동물 보전관리 극대화 효과
나. 신속한 위험요소 관리대응으로 피해 최소화

  • 멧돼지 열화상 카메라 준비
    다. 야생동물 모니터링 등 유관산업 활용
  • 멧돼지 열화상 카메라 데이터의 경우 유래가 없는 케이스 (축산농가 등 활용 기대)

2.1.5 구축목적

가. 전염병 및 로드킬 등 안전사고 예방을 통한 야생동물 보전·관리
나. 야생동물 실태조사 분야 AI개발·응용기술 확대
다. 디지털 일자리 창출을 통한 경기회복 기여

2.1.6 구축데이터 종류 및 수량

  • 멧돼지의 경우 70시간 중에서 20시간을 열화상 데이터로 촬영, ASF전염병에 대한 이상판별 가능하게 함

2.1.7 데이터 수집방법

가. 개요

  • 영상 데이터 수집 후, 학습용 이미지 데이터 요건에 적합한 이미지를 선별함, 그 후 저작도구 서비스에 이미지들 연결 후 최종 관리자가 데이터를 검수함
    나. 장소
  • 서식지 촬영
  • 국립생태원 촬영
  • 테마파크/농장 촬영
  • 야생동물 보호센터 촬영
  • 국립공원공단 데이터 제공
  • 데이터 구매
  • 열화상 데이터
    국립생태원, 충남야생동물구조센터 제주시 노루생태관찰원 사단법인 한국야생동물보호협회

2.1.8 데이터 정제방법

  • 학습에 적합한 영상 추출 후 개인정보비식별화 등의 전처리

    영상데이터 검수 : 부적합의 경우 영상 데이터 재작업을 요청, 적합의 경우 이미지추출
    이미지 추출 : 민감정보영역 구별하고 확인시 비식별화 작업으로, 이미지 고유의 코드를 부여하기 위한 시리얼 번호를 입력
    분류검수 : 정제된 최종 이미지를 어노테이션 작업할 수 있도록 저작도구 서버에 업로드

2.1.9 데이터 가공방법

  • 인공지능 학습용 데이터는 데이터 수집, 레이블링, 활용 등 3단계 프로세스로 구축 및 가공됨
  • 바운딩박스 : 객체가 포함되도록 박싱, 해당종에 대해 라벨링 진행, rgb, ir, tic 등의 프로퍼티 값을 입력함으로서 주간과 야간, 열화상에 대한 구분을 할 수 있도록 어노테이션
  • 세그멘테이션 : 전체 분량 중 데이터 활용을 위한 10% 세그멘테이션 적용을 함

2.1.10 데이터 제공형식

  • 데이터는 이미지와 레이블링 파일(json형식) 쌍으로 원천이미지데이터와 제공하며, json파일은 정해진 룰(rule)에 따라 레이블링 결과를 반영

  • json파일의 메타데이터
    어노테이션정보를 비롯, 촬영일시, 촬영장소와 장비등 구축환경과 이미지 설명정보, 해당종의 설명이 포함되어있다.

  • json 스키마 항목의 상세내용은 AI HUB에 개시된 참고파일을 참고

2.2 저작도구 활용법

2.2.1 저작도구 설명

  • 야생동물 활동영상 데이터 구축에 맞춤형 저작도구 개발
    가. 가공 tool
    데이터 가공 작업자의 작업편의성을 높이고, 고품질의 데이터가 만들어 질 수 있도록 데이터 가공 툴 구현
    나. 검수 tool
    1차 작업자의 작업결과를 QA인력이 검수하는 과정에서 데이터 검증 결과의 피드백이 원활하도록 기능을 구현
    다. 뷰어
    이미지와 json 파일을 통해 어노테이션이 어떻게 되어있는지 확인할 수 있는 어노테이션 뷰어로 구성되어 있음

2.3 데이터 학습 방법 및 시연

2.3.1 검출모델

  • YOLO모델을 활용하여 학습진행하여 객체탐지 모델 개발

가. 데이터 준비 및 전처리
: 데이터 전수검사 진행 후, 전처리하여 데이터 폼 유지
나. 학습 알고리즘
: YOLO버전 하이퍼 알고리즘을 통해 작성된 모델로 학습시작
다. 데이터 학습 진행
: 배치, epoch 등의 학습파라미터 설정하여 다양한 매개변수로 시나리오 학습 진행
라. 학습결과 확인
: 결과기록

2.4 학습된 모델 결과 확인방법 및 시연

2.4.1 검출모델 학습 진행


학습 진행시 미리 지정된 16장의 이미지를 한번에 합성하여 학습진행
좌 : 미리 라벨링 된 데이터
우 : 실제 학습중인 모습 및 신뢰도 볼 수 있음

  • 학습진행시 : 수십시간 소요...
  • 학습과정의 지표 확인가능
    업로드중..

2.4.2 검출모델 적용 예제

2.5 활용서비스 예시(서비스 개발 시 학습된 모델 활용방법)

2.5.1 야생동물 생태 파악을 위한 종 모니터링시스템

  • 전국 CCTV 녹화된 영상에서 파악이 필요한 종을 인공지능 모델이 자동판별
    녹화된 영상 중 파악이 필요한 종을 자동으로 판별하여 종별 출현 횟수를 집계
  • 야생동물 연구 활용
    지역별 센서 카메라에 해당 종의 출현을 감지하여 카메라의 위치정보, 종의 정보를 수집한 후 생태연구에 활용

2.5.2 야생동물 보호를 위한 경고시스템

업로드중..

profile
We will find a way. We always have. When you eat together, you stick together.

0개의 댓글