Open Dataset

haeryong·2023년 1월 30일
0

MLops Pipeline
1. 데이터 가져오기.
2. 데이터 탐색.(EDA)
- 클래스 분포, scale, 환경 등..

  1. 데이터 가공.(pre process)

    • 노이즈 제거, augmentation...
  2. 데이터 검증.

  3. 데이터 나누기.

  4. 학습방법 결정.

  5. 모델 결정.

  6. 모델 검증.

  7. 대규모 학습.
    ...

1. KITTI Dataset

kitti dataset website

Setup

1 Inertial Navigation System (GPS/IMU): OXTS RT 3003
1 Laserscanner: Velodyne HDL-64E
2 Grayscale cameras, 1.4 Megapixels: Point Grey Flea 2 (FL2-14S3M-C)
2 Color cameras, 1.4 Megapixels: Point Grey Flea 2 (FL2-14S3C-C)
4 Varifocal lenses, 4-8 mm: Edmund Optics NT59-917


Object Detection dataset

세 종류의 Object Detection Dadaset을 제공한다.

2D Object Detection

  • Left, Right image.
  • Lidar data.
  • Calibration 정보.
  • labeling data

2D Object Detection Labeling Format

  • object development kit을 다운로드 받아 내부의 readme.txt 파일에서 확인.
  • 실제 labeling data 확인.

2. BDD100K Dataset

BDD100K dataset website

  • 다양한 도시, 다양한 날씨, 시간을 고려한 자율주행을 위한 데이터셋.

BDD100K dataset Download

Object Detection Dataset

100K Images 다운로드.

Detection 2020 Labels를 다운로드.

labeling data는 json 파일로 되어있다.

JSON(JavaScript Object Notation)

  • {}를 기준으로 블록을 분할.
  • "name" : value 형식으로 지정.
  • 블록 단위로 들여쓰기.
  • []은 배열을 의미.
  • ,는 end line을 의미함.
  • C++의 경우 rapidjson 라이브러리를 이용해서 파싱.
  • python의 경우 import json.
import json

with open('sample.json', 'r', encoding='UTF-8') as json_file:
	sample = json.load(json_file)

3. Cityscape Dataset

sementic segmentation : 동일 클래스의 개체를 구분하지 않음.
instance segmentation : 동일 클래스의 개체를 구분함.

Segmentation Dataset

gtFine_trainvaltest.zip (241MB) 다운로드.
leftImg8bit_trainvaltest.zip (11GB) 다운로드.

Segmentation Labeling Format
하나의 image에 대해 4개의 labeling data가 존재한다.

  • leftImg8bit

    • train
      • aachen(도시명)
        • aachen_000000_000019_leftImg8bit.png
  • gtFine

    • train
      • aachen(도시명)
        • aachen_000000_000019_gtFine_color.png
        • aachen_000000_000019_gtFine_instanceIds.png
        • aachen_000000_000019_gtFine_labelIds.png
        • aachen_000000_000019_gtFine_polygons.json

leftImg8bit.png

color.png
객체를 클래스별로 고유한 색상으로 표현.

instanceIds.png
각 객체를 개별적인 ID로 구분.

labelIds.png
각 객체를 동일한 클래스로 구분한 이미지.

polygons.json

Segmentation Training

사용 모델 git repository


How to find Open datasets

Scale Open Datasets

How to find models

Papers With Code

0개의 댓글