정형 데이터와 비정형 데이터(feat. 반정형 데이터)

윤원영·2023년 12월 15일

데이터는 어떻게 저장되는지에 따라 정형(구조화된, structured) 데이터와 비정형(Unstructured) 데이터로 나뉜다.

정형 데이터

  • 정형(구조화된) 데이터는 열과 행으로 표시되는 테이블 형식 데이터이다.
  • SQL 기반 관계형 데이터베이스가 사용된다.
  • 데이터 모델이 사전에 정의되고 일부 데이터가 저장 된 후에는 모델을 변경하기 어렵다.
  • 제한된 수의 데이터 포맷을 사용할 수 있다.

비정형 데이터

  • 비정형 데이터는 사전 정의된 방식으로 구성되지 않거나 사전 정의된 모델이 없는 데이터다.
  • 특정 스키마가 없는 NoSQL 데이터베이스가 사용된다.
  • 스키마가 포함되지 않아서 모델이 굉장히 유연하다.
  • 정해진 규칙이 없어서 값의 의미를 쉽게 파악하기 힘들다.

반정형 데이터

  • 반정형 데이터는 정형과 비정형의 중간격인 데이터이다.
  • 어느 정도 구조를 가지고는 있지만 관계형 데이터베이스가 사용되지 않는다.
  • 주로 JSON, HTML, XML형식으로 보관된 문서로 구성된다.
profile
반갑습니다

0개의 댓글