우리가 지금까지 사용해왔고, 앞으로도 사용 할 "데이터" 란 무엇일까?
즉, 어떤 작업에 대한 원천 이라 볼 수 있는 것이다.
그리고 해당 데이터들을 저장하는 저장소가 데이터베이스(Data base) 이다.
데이터가 어떻게 저장되는지에 따라 데이터의 종류가 나눠지게 되는데, 아래 글에서 데이터의 종류와 특성에 대해 학습해 보자.
즉, 구조화 된 데이터구조이기 때문에 값의 의미를 파악하기 쉽다.
하지만 데이터베이스에 들어간 데이터라고 말하는 오류를 범하는데,
데이터베이스는 모든 데이터가 들어갈 수 있기 때문에 해당 정의는 틀렸다 볼 수 있다.
정형데이터) 관계형 데이터베이스, CSV
즉, 관계형 데이터 저장소와 같은 행 및 열의 테이블 형식 스키마가 없는 데이터베이스이다.
그리고 구조화 된 데이터구조가 아니기에 값의 의미를 쉽게 파악하기 힘들다.
그리고 대용량에 속한 비정형데이터의 의미를 분석했기 때문에
비정형 데이터는 빅데이터의 탄생에 큰 역할을 했다.
하지만 빅데이터에는 정형데이터와 반정형 데이터도 포함되기 때문에
비정형 데이터만 분석한다는 것은 아니다.
비정형 데이터) 비관계형 데이터베이스(No SQL)
즉, 정형 데이터와 같이 구조화되어 있지는 않으나, 스키마 및 메타데이터 특성을 가지고 있다.
결국 다른것은 데이터 베이스는 데이터를 저장하는 장소와 스키마가 분리되어 테이블을 생성하고 데이터를 저장하지만,
반정형 데이터는 스키마는 있지만 구조되지는 않았다는 것이다.
참고 : https://modulabs.co.kr/blog/bigdata-type/