"데이터랑 정보가 다른 거야?" 처음 이 질문이 떠올랐을 때 그냥 같은 말 아닌가 싶었다. 그런데 이 둘의 차이가 생각보다 중요하고, 거기서 한 발 더 나아가면 우리가 데이터를 왜 다루는지까지 이어진다.
데이터는 가공되지 않은 원재료다. 숫자, 문자, 날짜처럼 의미가 부여되지 않은 상태의 값이다.
25, "김민수", "2024-03-15", 180
이 값들만 보면 뭘 나타내는지 알 수 없다. 나이인지, 점수인지, 날짜인지, 키인지 — 맥락 없이는 그냥 숫자와 글자일 뿐이다.
정보는 데이터에 의미와 맥락이 붙은 것이다.
이름: 김민수
나이: 25
가입일: 2024-03-15
키: 180cm
같은 값이지만 이제 각각이 무엇을 뜻하는지 알 수 있다. 데이터가 정보가 된 것이다.

데이터와 정보에서 한 단계 더 나아가면 DIKW 피라미드라는 개념이 나온다. 데이터가 어떻게 통찰로 이어지는지를 4단계로 표현한 모델이다.

가공 전 원재료. 그 자체로는 의미가 없다.
18, 22, 31, 19, 25, 30, 21
데이터에 맥락이 붙은 것.
이번 달 신규 가입자 나이: 18, 22, 31, 19, 25, 30, 21
정보를 해석해서 얻은 패턴이나 규칙이다. "이 정보가 무엇을 의미하는가"에 대한 답이다.
신규 가입자 대부분이 20대 초반에 몰려 있다.
평균 연령은 23.7세다.
지식을 바탕으로 판단하고 결정을 내리는 단계다. "그래서 어떻게 할 것인가"에 대한 답이다.
20대 초반 사용자를 타깃으로 UI와 콘텐츠 방향을 잡는다.
데이터베이스를 배우는 이유가 단순히 데이터를 저장하기 위해서가 아니다. 데이터를 잘 쌓고 꺼낼 수 있어야 정보가 되고, 그 정보를 분석해야 지식이 되고, 그 지식으로 판단을 내릴 수 있다.
DIKW 피라미드에서 모든 것의 출발점은 데이터다. 데이터가 엉망이면 그 위에 쌓이는 정보도, 지식도, 통찰도 전부 흔들린다. 데이터를 잘 관리해야 하는 이유가 여기에 있다.