데이터 모델링은 현실세계에서 조직의 정보 수집과 관리 시스템을 정의하는 시각적 표현 또는 청사진을 생성하는 프로세스를 말한다. 이 청사진 또는 데이터 모델은 다양한 이해관계자들이 조직의 데이터에 대한 통일된 개념을 생성할 수 있게 돕는다. 예를 들어, 데이터 모델은 마케팅 팀, 재무 팀, IT 부서 등 다양한 이해관계자들이 회사의 고객 데이터를 동일한 시각으로 이해하고 활용할 수 있게 돕는 것을 들 수 있다. 또한, 이 모델은 해당 비즈니스가 수집하는 데이터, 서로 다른 데이터 세트 사이의 관계, 데이터를 저장하고 분석하는 데 사용되는 방식을 설명한다.
데이터 모델링의 목적은 시스템 내에서 사용되고 저장되는 데이터의 유형, 이 데이터 유형 간의 관계, 데이터를 그룹화하고 조직화하는 방식, 그 형식과 특성을 나타내는 것이다. 또한, 데이터 모델링을 하는 주요한 이유는 업무정보를 구성하는 기초가 되는 정보들을 일정한 표기법에 의해 표현함으로써 정보시스템 구축의 대상이 되는 업무 내용을 정확하게 분석하는 것이며, 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터관리에 사용하기 위한 것이기도 하다. 따라서 데이터 모델링 자체로서 업무를 설명하고 분석하는 부분에도 매우 중요한 의미를 가지고 있다.
오늘날 조직은 다양한 소스에서 많은 양의 데이터를 수집한다. 이를 원시 데이터라고 하는데 이만으로는 충분하지 않다. 수익성 있는 비즈니스 결정을 내리는 데 도움이 되기 위해 데이터 분석하는 과정이 필요하다. 그러므로 정확한 데이터 분석을 위해서는 효율적인 데이터 수집, 저장 및 처리가 필요하다. 데이터 모델링은 데이터를 이해하고 이 데이터를 저장 및 관리하기 위한 올바른 기술 선택을 할 수 있는 기회를 제공한다. 이것이 데이터 모델링이 중요한 이유이다.
데이터 모델링을 하면 데이터베이스 소프트웨어 개발 오류를 감소시키고, 데이터베이스 설계 및 생성 속도와 효율성을 촉진할 수 있다. 예를 들어, 명확한 데이터 모델을 통해 개발자들은 데이터 구조를 더 잘 이해하여 오류를 줄일 수 있다. 또한, 조직 전체에서 데이터 문서화 및 시스템 설계의 일관성을 조성할 수 있으며, 이를 통해 데이터 엔지니어와 비즈니스 인텔리전스 팀 간의 커뮤니케이션이 원활해진다. 예를 들어, 정교한 데이터 모델을 공유함으로써 두 팀 간의 이해와 협력이 증진되는 것을 들 수 있다.
참고 문헌:
1. https://aws.amazon.com/ko/what-is/data-modeling/
2. https://www.ibm.com/kr-ko/topics/data-modeling
3. https://dataonair.or.kr/db-tech-reference/d-guide/sql/?mod=document&uid=330
4. SQL 개발자 이론서 + 기출 문제 기본서, 임호진 외 2, p.56