😃 딥러닝 Computer Vison 기술의 핵심
Object Detection과 Segmentation
- 지능형 영상 정보 인식
- AI 비전 검사 스마트 팩토리
- 의료 이미지 자동 진단
- 로보틱스
- 자율주행 자동차
😃 실습 도구
최신의 뛰어난 성능을 가진 구현 패키지
- MMDetection
- Ultralytics YOLO V3
- AutoML EfficientDet
범용 인터페이스 API
- OpenCV DNN
- TensorFlow Hub
실습 환경(커널)
😃 사전 지식
- Transfer Learning
- 이전에 사용되었던 모델의 정보를 입력받아 새로운 모델 학습
- 새로운 모델을 만들 때, 기존의 Feature를 그대로 사용하면 학습 시간 감소
pre-training
: 사전에 학습되는 모델
Fine_tuning
: pre-training을 활용하여 새로운 모델을 학습하는 과정
- Convolution 연산
- 합성곱 신경망
- 이미지의 특정한 패턴의 특징을 발견 >> 이미지 분류 >> 정확도 향상 >> 분류의 기준
- 행렬 곱셈을 통한 연산
- filter를 왼쪽에서 오른쪽으로, 위에서 아래로 점곱
- Kernel 사이즈
- filter(Weight)의 사이즈
- 이미지로부터 원하는 정보(특징)만을 추출
- mask
- Max pooling
- 하나의 레이어를 분리하여 샘플링한 후, 다음 단계로 넘기는 것
- 서브 샘플링(sub sampling): 특징 수 줄이는 것
- 전체 특징 수를 줄여 파워 절약, 오버피팅 방지
- Feature Map
- 모델이 학습하기 위해 만든 이미지의 특징(feature)을 담은 맵
- VGG
- 합성곱 계층과 풀링 계층으로 구성되는 기본적인 CNN
- 합성곱 계층, 완전 연결 계층 모두 16층(VGG16) 혹은 19층(VGG19)으로 심화
3*3
의 작은 필터를 사용한 합성곱 계층을 연속으로 거침
- 합성곱 계층을 2~4회 연속으로 풀링 계층을 두어 크기를 절반으로 줄이는 처리 반복
- 완전 연결 계층을 통과시켜 결과 출력
- ResNet
- MS사에서 개발한 네트워크
- 층을 보다 더 깊게 할 수 있는 특별한 장치
- VGG 신경망 기반
- 깊은 층: 네트워크 성능 향상에 중요
- 지나치게 깊으면 학습 및 성능 감소
- Skip Connection을 통한 문제 해결
- 입력 데이터를 합성곱 계층을 건너뛰어 출력에 바로 더하는 구조
😃 실습 환경 구축하기
Colab Kernel
- Google 제공
- GPU: T4 or P100 할당
- 필요한 소프트웨어가 이미 설치되어 편리하게 사용 가능
- 파일 브라우저 기능 탑재
- 문제
- 일반 colab의 경우, GPU를 자주 사용하게 되면 할당을 받지 못하는 경우 발생
- 수행 시, 입력 반응이 20~30분 동안 없을 시, 자동으로 커널 연결 끊어짐
- Colab
- Jupyter Notebook과 유사
- Google Drive와 연동 가능
- 런타임 다시 시작
- 메모리 로딩(Jupyter Notebook) 부분 사라짐
- 런타임 초기화
Kaggle Kernel
- GPU P100 할당
- 필요한 소프트웨어가 이미 설치되어 편리하게 사용 가능
- 자동 커널 끊김이 colab보다 약간 길다
- 파일 브라우저 기능 탑재 but 동작 이슈
- GPU 할당 받지 못하는 경우 거의 없음
- GPU(Accelerator) 할당 시, 계정 인증
- Restart & Clear cell outputs
- Stop Session
* 출처: 인프런 '딥러닝 컴퓨터 비전 완벽 가이드'