[데이터 캠프] 데이터 이론

dia·2023년 7월 10일

단편

목록 보기
3/4

데이터 종류

  • 정형 데이터 (구조)
  • 반정형 데이터
  • 비정형 데이터 (비구조)

비정형 데이터의 종류

  • 문서, 텍스트
  • 이미지
  • 음성
  • 영상
  • 3D
  • 공간, 위치, 좌표

- 종류가 다른 이유
전송 등 상황에 맞는 용량 설정


메타데이터

데이터의 표지, 파일 안에 어떤 내용이 있는지 알려주는 것
메타데이터가 없다면 파일 안의 내용을 일일이 뜯어봐야 함

데이터 종류(비정형/정형) 관계없이 메타데이터 존재
데이터 종류마다 필요한 메타데이터 속성이 있음

메타데이터 속성

  • 문서 메타데이터
    포맷, 용량, 생성일자, 주제 등
  • 이미지 메타데이터
    포맷, 용량, 너비, 높이 등
  • 음성 메타데이터
    포맷, 용량, 재생시간, 주파수, 비트수 등
  • 영상 메타데이터
    포맷, 용량, 영상길이, 가로, 세로 등
  • 3D 메타데이터
    포맷, 개체분류, 개체명, 공간해상도, 생성일자
  • 공간 메타데이터
    좌표계, 포맷, 공간정보분류 등

메타데이터 표준

  • DCAT
    웹 데이터 카탈로그의 메타데이터 표준
    Data Catalog Vocabulary

    데이터 카탈로그
    정보탐색에 용이한 데이터 자산 목록

  • Schema.org
    구글에서 정한 웹 표준
    구조화된 데이터 스키마


클라우드

광대한 네트워크를 통하여 접근할 수 있는 가상화된 서버와 서버에서 작동하는 프로그램과 데이터베이스를 제공하는 IT 환경

분산 클라우드

규정 준수 및 성능과 관련된 요구 사항을 충족하거나 엣지 컴퓨팅을 지원하기 위해 여러 클라우드를 사용하는 아키텍처
기존의 중앙 집중된 클라우드를 각 사용자에게 가깝도록 분산한 형태
지연 시간 단축, 빠른 속도

엣지 컴퓨팅

사용자 또는 데이터 소스의 물리적인 위치나 그 근처에서 컴퓨팅을 수행하는 것
중앙이 아닌 각 사용자 주변에서 서비스를 처리하는 방식

profile
CS 메모장

0개의 댓글