Raspberry Pi 4와 JetsonNano4gb 추론속도 비교

BERT·2023년 4월 12일
0

Segmentation

목록 보기
2/10

Raspberry Pi 4 HQ 카메라 테스트

카메라 탑재 여부 확인

vcgencmd get_camera

테스트 이미지 한장

import cv2

cap = cv2.VideoCapture(0)

while cv2.waitKey(33) != ord('q'):
    sucess, img = cap.read()
    cv2.imwrite("test.png", img)
    break

MobileNetV2 실시간 영상 추론 fps


실시간 추론 속도 확인

DEEPLABV3

RaspberryPi

파이토치 설치

pip install torch==1.10.2 torchvision==0.11.3 torchaudio==0.10.2
pip install opencv-python
pip install numpy --upgrade

추론 결과

추론 속도(평균 97초)

JetsonNano4gb

추론 결과

import os
os.environ['CUDA_LAUNCH_BLOCKING'] = "1"

미적용 시
추론 속도(평균 0.05초)는 빠른 대신 CUDA 연산이 제한 시간(timeout)을 초과

적용 시
추론 속도(평균 4.7초)

torch.cuda.set_device(0)
torch.backends.cuda.reserved_memory = 1024*1024*1024 # optional
torch.cuda.synchronize()
torch.cuda.keternel_launch_timeout = 30

CUDA 커널 실행 제한 시간을 늘려서 CUDA 연산이 제한 시간 내에 완료되도록 할 수도 있음
추론 속도 0.05초로 나옴

결과 이미지

위 RaspberryPi 아래 JetsonNano4gb

DEEPLABV3 대표이미지

kitti datasets

000000_10

000001_10

000002_10

000003_10

000004_10

사용 제품

NVIDIA Jetson Nano Development Kit-B01
Raspberry Pi 4 Model B
Raspberry Pi High Quality Camera
6mm Wide Angle Lens for Raspberry Pi High Quality Camera
화소가 조금 낮더라도 더 넓은 화각을 가짐
16mm Telephoto Lens for Raspberry Pi High Quality Camera
먼 거리의 좁은 구역을 촬영하기 적합

참조

RASPBERRY PI 4 에서 실시간 추론(INFERENCE)

안드로이드에서의 이미지 분할 DEEPLAPV3

DEEPLABV3

kitti datasets

0개의 댓글