파이널 프로젝트 주제 선정

융·2023년 8월 10일

1. 실시간 이상행동 감지 및 경고 시스템 개발

딥 러닝 모델을 활용하여 주어진 이상행동을 실시간으로 감지하고, 주변 사람들에게 경고를 보내는 시스템을 구축

프로젝트 동기

최근 불특정 다수를 향한 '묻지마' 흉기 난동이 연쇄적으로 발생하고 있다.
신림역 칼부림 사건을 시작으로 서현역 칼부림 사건, 대전 교사 칼부림 사건을 포함해 지난 보름간 사상자가 발생한 칼부림 사건은 총 8건이다. 이 외에도 2건 이상의 칼부림 미수 사건, 27건 이상의 테러 예고가 발생했다. 출처

흉기 소지 의심자 또는 이상행동자를 미리 알 수 있다면 범죄율을 줄 일 수 있을 것이다. 그래서 이상행동 CCTV 영상을 분석해 이상행동자를 판별하는 프로젝트를 수행하면 좋을것 같다는 생각을 했다.

데이터

이상행동 CCTV 영상 : Ai허브
데이터 내용
- 12가지의 이상행동(폭행, 싸움, 절도, 기물파손, 실신, 배회, 침입, 투기, 강도, 데이트폭력 및 추행, 납치, 주취행동), 총 717시간(8436컷) 이상행동 영상 데이터셋 촬영 및 구축

관련 논문

인공지능 기반의 CCTV에 의한 범죄예측 시스템 도입에 따른 법적 과제와 활용 방안
딥 러닝 기반의 CCTV를 활용한 이상 행동 감지 시스템 설계
DenseNet-121 기반의 전이학습을 활용한 범죄 현장 인식 및 분류 네트워크

딥러닝 모델

C3D : C3D는, 3D Convolution Networks를 대량의 영상 데이터에 지도학습 방식으로 훈련한 모델이다.

참조 : https://aimb.tistory.com/204

3D Resnet : 3D 컨볼루션을 활용하는 비디오 모델의 한 종류입니다. 이 모델 집합은 두 가지 주요 변형으로 구성됩니다.
YOLO

경고 시스템

외부 TTS API 사용: 다양한 음성 합성 API가 제공되고 있습니다. 이 중에서 Google Text-to-Speech, Amazon Polly, Microsoft Azure Text-to-Speech 등을 활용하여 텍스트를 음성으로 변환하고, 변환된 음성 파일을 재생하는 방식으로 음성 알림을 구현할 수 있습니다. 이러한 API는 다양한 음성 스타일과 언어를 지원하며, 품질이 좋습니다.
오픈 소스 TTS 엔진 사용: Festival, eSpeak 등과 같은 오픈 소스 TTS 엔진을 활용하여 텍스트를 음성으로 변환할 수 있습니다. 이 엔진들은 커스터마이징이 가능하며, 자신의 프로젝트에 맞게 설정할 수 있습니다.
딥 러닝 기반 TTS 모델 사용: 딥 러닝을 활용한 TTS 모델인 Tacotron, WaveGAN, Transformer TTS 등을 사용하여 텍스트를 음성으로 변환할 수 있습니다. 이러한 모델은 높은 음성 품질과 자연스러운 음성을 생성할 수 있습니다.

2. 교통약자 영상 데이터 분석을 통한 도시 계획 개선 제안

지하철 내 CCTV 데이터 (도시철도 역사를 이용하는 교통약자 데이터 )

프로젝트 동기

하루에 9~10만 명의 교통약자들이 이용하는 만큼, 모두가 편리하고 안전하게 이용할 수 있는 지하철 환경이 필수적이다. 출처

우리나라 전체 인구가 감소하고 있는 반면, 고령자 등 '교통약자'는 증가하고 있어 이들의 이동 지원을 위한 정책 개선이 필요한 것으로 나타났다.

데이터

도시철도 역사를 이용하는 교통약자 추적 데이터

데이터 셋의 구성
• 타겟 객체 6종(휠체어, 시각장애인, 유모차, 잡상인, 아동)에 대해 약 580시간(5분 길이의 클립
약 7,000개)
• 기 보유 영상 화질 기준은 1920*1080, 시나리오 촬영 기반 화질 기준 4k, 30fps
• 클립 별 어노테이션 json(xml) 파일 1종
• 각 클립에 대하여, 타겟 객체가 존재하는 구간에 대해 초당 1 ~ 2 frame의 이미지 추출하여 라벨링 수행.
• 최소 25만장 이상의 프레임, 100만개 이상의 객체 추적 라벨링 수행