[TIL-DAY23] 데이터의 유형과 특징

김유란·2025년 1월 27일

1. 정형 데이터 (Structured Data)

  : 미리 정해놓은 규칙과 구조에 저장되는 데이터

  • 테이블 형식으로 저장 (예: 데이터베이스 테이블, 스프레드시트)
  • 각 데이터 항목은 정해진 필드를 가짐
  • SQL과 같은 쿼리 언어를 사용하여 쉽게 검색 및 분석 가능
  • 일관성이 높고 처리 용이

  ex)

  • RDBMS(관계형 데이터베이스): MySQL, PostgreSQL, Oracle 등

  • 스프레드시트(Excel, Google Sheets 등)

  • CSV 파일


2. 반정형 데이터 (Semi-structured Data)

  : 데이터의 형식과 구조가 변경될 수 있는 데이터

  • 태그나 키-값 쌍으로 데이터를 저장 (예: XML, JSON)
  • 데이터의 구조는 있지만 엄격한 스키마는 없음
  • 유연성이 높고, 동적 구조를 가짐
  • 검색과 분석이 가능하지만, 정형 데이터보다는 복잡함

  ex)

  • JSON (JavaScript Object Notation)

  • XML (Extensible Markup Language)

  • YAML (YAML Ain't Markup Language)

  • 로그 파일 (예: 웹 서버 로그)


3. 비정형 데이터 (Unstructured Data)

  : 정해진 구조가 없는 데이터

  • 형식이 없거나 비표준인 데이터
  • 텍스트, 이미지, 비디오, 오디오 등 다양한 형식이 포함됨
  • 검색 및 분석이 어렵고, 별도의 데이터 처리 기술이 필요함
  • 빅 데이터의 대부분은 비정형 데이터로 존재

  ex)

  • 텍스트 파일 (예: 이메일, 문서)
  • 이미지, 비디오, 오디오
  • 소셜 미디어 데이터
  • 웹페이지 (HTML은 반정형 데이터일 수 있지만, 페이지의 내용은 비정형 데이터)

0개의 댓글