[DASP] 데이터 표준화

이선아·2021년 12월 11일
2

🔹 데이터 표준화 개요

🔸 데이터 표준화 필요성

  • 데이터 표준화의 기대효과
  1. 명칭의 통일로 인한 명확한 의사소통의 증대
  2. 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
  3. 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
  4. 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소

🔸 데이터 표준화 개념

  • 데이터 정의 기술 시 고려사항 4가지
    데이터 명칭, 데이터 정의, 데이터 형식, 데이터 규칙

  • 발생 가능한 값을 사전에 정의하는 데이터 규칙을 적용함으로써 얻을 수 있는 효과
    데이터 규칙은 발생 가능한 데이터 값을 사전에 정의함으로써 데이터의 입력 오류와 통제 위험을 최소화하는 역할을 한다. 데이터 규칙을 통해 데이터의 정합성 및 완전성을 향상할 수 있다.

  • 데이터 표준화 구성요소 3가지
    데이터 표준, 데이터 표준 관리 조직, 데이터 표준화 절차

  • 데이터 표준을 정의해야 할 요소 4가지
    표준 용어, 표준 단어, 표준 도메인, 표준 코드

  • 표준 도메인이란?
    표준 도메인은 칼럼에 대한 성질을 그룹핑한 개념이다. 도메인은 크게는 문자형, 숫자형, 일자형, 시간형으로 분류할 수 있고, 더 세부적으로는 명, 주소, ID(이상 문자형), 금액, 율, 수량(이상 숫자형) 등으로 분류할 수 있다.
    도메인에 대한 표준을 정의함으로써 동일한 성질을 가진 칼럼의 데이터 타입 및 데이터 길이를 일관되게 관리할 수 있으며, 향후 칼럼 값에 대해 공통적인 데이터 검증 규칙의 적용이 가능하다. 표준 도메인을 칼럼에 적용함으로써 칼럼의 데이터 타입 및 데이터 길이를 일관되게 정의할 수 있다.

  • 데이터 관리자(DA)의 주요 역할
    데이터 관리자는 하나의 기업 또는 조직 내에서 데이터에 대하나 정의, 체계화, 감독 및 보안 업무를 담당하는 관리자를 의미한다. 이러한 데이터 관리자는 기업 또는 조직 전반에 걸쳐 존재하는 데이터에 대한 관리를 총괄하고 정보 활용에 대한 중앙 집중적인 계획 수립 및 통제를 수행한다.
    데이터 관리자의 주요 역할로는 데이터에 대한 정책과 표준 정의, 부서 간 데이터 구조 조율, 데이터 보안 관리, 데이터 모델 관리, 데이터의 효율적인 활용 방안 계획이 있다.

  • DA와 DBA의 역할을 비교

    구분데이터 관리자(DA)데이터베이스 관리자(DBA)
    관리 대상데이터 요구 사항을 반영한 데이터 모델 및 각종 표준데이터 모델을 특정 데이터 베이스 제품의 특성에 맞추어 구축한 데이터베이스
    주업무업무에 필요한 데이터의 메타 데이터를 정의하고 신규 또는 변경된 요구 사항을 신속하게 데이터 모델에 반영요구되는 성능 수준을 발휘하면서 안정적으로 운영되도록 데이터베이스를 관리
    품질 수준 확보데이터 표준의 관리 및 적용을 통해 품질 수준을 확보데이터의 정합성 관리를 통해 데이터 품질 수준을 확보
    전문 기술담당 업무 분야에 대한 업무 지식과 데이터 모델링에 대한 전문성이 필요데이터 모델에 대한 해독 능력 및 특정 데이터베이스 제품에 대한 전문 지식이 필요
  • 4단계 데이터 표준화 절차
    데이터 표준화 요구 사항 수집 - 데이터 표준 정의 - 데이터 표준 확정 - 데이터 표준 관리

🔸 데이터 표준 관리 도구

  • 데이터 표준 관리 시스템의 3가지 기능
    데이터 표준 관리, 데이터 구조 관리, 프로세스 관리의 기능

  • 데이터 표준 관리 시스템 도입 시 고려 사항
    확장성, 유연성, 편의성

🔹 데이터 표준 수립

🔸 데이터 표준 정의

  • 표준 단어 사전 관리 기준 3가지
    표준성, 일반성, 대표성

  • 표준 단어 정의 시 접두어, 점미어 처리기법 중 개별 단어 방식의 장단점
    장점 : 단어 사전의 단어 개수가 많지 않다. 일관된 단어 사전의 모습을 가진다.
    단점 : 물리 DB제약 자릿 수를 넘는 경우가 발생할 가능성이 높다. 처리할 수 없는 경우가 발생한다.

  • 표준 단어 정의 시 접두어, 점미어 처리기법 중 합성 단어 방식의 장단점
    장점 : 물리 DB제약 자릿 수를 넘는 경우가 발생할 가능성이 낮다. 사용자 편의성이 높다.
    단점 : 단어 사전의 단어 개수가 많다. 단어의 다용도 사용으로 일관성이 떨어진다.

  • 표준 도메인 관리 기준 3가지
    표준성, 유일성, 업무 지향성

  • 표준 코드 관리 기준 3가지
    재사용성, 일관성, 정보 분석성

  • 표준 용어 사전 관리 기준 3가지
    표준성, 일반성, 업무 지향성

🔸 데이터 표준 확정

  • 데이터 표준에 대한 중요 검토 포인트 4가지
    유일성, 완전성, 정확성, 범용성

🔹 데이터 표준 관리

🔸 데이터 표준 관리 프로세스

  • 데이터 표준 관리 프로세스
    전사적 차원에서의 일관된 데이터 형식 및 규칙의 적용으로 데이터 품질을 향상시키고, 데이터 표준에 대한 관리 프로세스를 제대로 정의함으로써 데이터 표준을 지속적으로 유지할 수 있다.

  • 데이터 표준을 관리하기 위한 구성요소 4가지
    프로세스, 태스크, 역할과 담당 업무

profile
깃허브 놀러오세용 -> Tistory로 블로그 이전합니다.

0개의 댓글