데이터 모델링이란 정보시스템 구축의 대상이 되는 업무 내용을 분석하여 이해하고 약속된 표기법에 의해 표현하는걸 의미한다.
그리고 이렇게 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터 관리에 사용되는, 데이터베이스 설계의 핵심 과정이기도 하다.
특히 데이터를 추상화한 데이터 모델은 데이터베이스의 골격을 이해하고 그 이해를 바탕으로 SQL문장을 기능과 성능적인 측면에서 효율적으로 작성하기 위해 꼭 알아야 한다.
- 업무 파악
- 개념적 데이터 모델링
- 논리적 데이터 모델링
- 물리적 데이터 모델링
업무파악을 제대로 하지 못했는데, 정확한 모델링을 할 수 없을 것이다.
업무파악은 어떠한 업무를 시작하기 전에, 해당하는 업무에 대해서 파악하는 단계 이다.
업무파악을 하기 좋은 방법으로는 UI를 의뢰인과 함께 확인해 나아가는 는 것이다. 그리고 궁극적으로 만들어야 하는 것이 무엇인지 심도있게 알아보아야 한다.
개념적 데이터 모델링은, 내가 하고자 하는 일에 데이터 간의 관계를 구상하는 단계 이다.
개념적 데이터 모델은 추상화 수준이 높고 업무중심적이고 포괄적인 수준의 모델링을 수행한다.
주요 활동으로는 핵심 엔터티와 그들간의 관계를 발견하고, 그것을 표현하기 위해서 엔터티-관계 다이어그램(ER 다이어그램)을 생성하는 것이다.
데이터베이스 ERD 다이어그램 테이블 표를 그리기전에 간단하게 도형으로 만들어보는 작업이 개념적 데이터 모델링이라고 이해하면 된다.
그리는 방법은 어렵지 않다. 도형이 의미하는 바를 알고 화살표를 통해 관계를 표현하기만 하면 된다.
다음은 게시판 데이터베이스 구상을 개념적 데이터 모델링으로 구현해본 것이다.
대표적으로 게시판 이용자의 회원 정보, 로그인 정보 그리고 게시판의 게시글, 댓글이 있다.
상위 수준의 엔터티 중심 모델이 완성되면,
구체화된 업무중심의 데이터 모델을 만들어 내는데 이것을 논리적인 데이터 모델링이라고한다.
이 단계에서 업무에 대한 Key, 속성, 관계등을 표시하며, 정규화 활동을 수행한다.
정규화는 데이터 모델의 일관성을 확보하고 중복을 제거하여 신뢰성있는 데이터 구조를 얻는데 목적이 있다.
위에서 구현한 개념적 ER 다이어그램을 테이블 형태로 재구성 한다.
이 단계에선 단순히 추상적인 데이터에서 보다 구체화적인 데이터로 작성한다.
예를 들어 회원정보의 아이디, 비밀번호에 각 데이터 타입을 명시해 주고 각 데이터간의 관계를 정밀하게 맺어주며 테이블의 키(key)를 지정해준다.
물리적 데이터 모델링은 최종적으로 데이터를 관리할 데이터 베이스를 선택하고, 선택한 데이터 베이스에 실제 테이블을 만드는 작업 을 말한다.
시각적인 구조를 만들었으면 그것을 실제로 SQL 쿼리를 통해 완성하는 단계라고 보면 된다.
지금까지 알아보았던 절차를 간단하게 요약 정리하자면 다음과 같다.