데이터는 어떻게 저장되는지에 따라 정형(구조화된, structured) 데이터와 비정형(Unstructured) 데이터로 나뉜다.
정형 데이터
- 정형(구조화된) 데이터는 열과 행으로 표시되는 테이블 형식 데이터이다.
- SQL 기반 관계형 데이터베이스가 사용된다.
- 데이터 모델이 사전에 정의되고 일부 데이터가 저장 된 후에는 모델을 변경하기 어렵다.
- 제한된 수의 데이터 포맷을 사용할 수 있다.
비정형 데이터
- 비정형 데이터는 사전 정의된 방식으로 구성되지 않거나 사전 정의된 모델이 없는 데이터다.
- 특정 스키마가 없는 NoSQL 데이터베이스가 사용된다.
- 스키마가 포함되지 않아서 모델이 굉장히 유연하다.
- 정해진 규칙이 없어서 값의 의미를 쉽게 파악하기 힘들다.
반정형 데이터
- 반정형 데이터는 정형과 비정형의 중간격인 데이터이다.
- 어느 정도 구조를 가지고는 있지만 관계형 데이터베이스가 사용되지 않는다.
- 주로 JSON, HTML, XML형식으로 보관된 문서로 구성된다.