93. 오류 데이터 측정 및 정제

alpaka·2024년 1월 29일
0

정보처리기사

목록 보기
97/161
post-thumbnail

오류 데이터 측정 및 정제의 개요

  • 오류 데이터 측정 및 정제는 고품질의 데이터를 운영 및 관리하기 위해 수행한다.
  • 오류 데이터 측정 및 정제는 '데이터 품질 분석 → 오류 데이터 측정→ 오류 데이터 정제' 순으로 진행한다.

데이터 품질 분석

  • 데이터 품질 분석은 오류 데이터를 찾기 위해 원천 및 목적 시스템 데이터의 정합성 여부를 확인하는 작업이다.
  • 대표적인 원천 시스템 데이터의 정합성 항목
    • 필수항목에 해당하는 데이터가 모두 있는가?
    • 문자형, 숫자형, 날짜형 등 데이터의 유형은 올바르게 관리되는가?
    • 날짜는 유효한 날짜형태인가?
    • 금액은 유효한 값의 범위인가?
    • 계좌번호 또는 코드값은 정해진 규칙에 맞는 번호인가?
    • 영업점은 실제 존재하는가?
    • 업무규칙에 위배되는 잘못된 정보는 없는가?
    • 보고서값과 실제 데이터값이 일치하는가?
    • 잔액은 회계 정보와 일치하는가?
  • 대표적인 목적 시스템 데이터의 정합성 항목
    • 과목별 좌수 및 잔액
    • 특정 기준으로 분류된 좌수 및 잔액
    • 보고서 항목 또는 통계 수치
    • 계좌 및 고객을 샘플링하여 해당사항 확인
    • 특수 관계의 고객에 대한 데이터 확인

오류 데이터 측정

  • 오류 데이터 측정은 데이터 품질 분석을 기반으로 정상 데이터와 오류 데이터의 수를 측정하여 오류 관리 목록을 작성하는 것이다.
  • 정상 데이터는 전환 대상 범위의 데이터를 업무 영역별, 테이블별로 구분하여 수량을 측정 및 기재한다.
  • 오류 데이터는 업무별로 오류 위치 및 유형을 확인하여 수량을 측정 및 기재한다.

오류 데이터 정제

  • 오류 데이터 정제는 오류 관리 목록의 각 항목을 분석하여 원천 데이터를 정제하거나 전환 프로그램을 수정하는 것이다.
  • 오류 데이터 분석
    • 오류 관리 목록의 오류 데이터를 분석하여 오류 상태, 심각도, 해결 방안을 확인 및 기재한다.
    • 상태
      • Open: 오류가 보고만되고 분석되지 않은 상태
      • Assigned: 오류의 영향 분석 및 수정을 위해 개발자에게 오류를 전달한 상태
      • Fixed: 개발자가 오류를 수정한 상태
      • Closed: 수정된 오류에 대해 테스트를 다시 했을 때 오류가 발견되지 않은 상태
      • Deferred: 오류 수정을 연기한 상태
      • Classified: 보고된 오류관련자들이 확인했을 때 오류가 아니라고 확인된 상태
    • 심각도
      • 상: 데이터 전환을 수행할 수 없는 오류
      • 중: 데이터 전환 전반에 영향을 미치는 오류
      • 하: 데이터 전환에 직접적인 영향을 미치지는 않으나 상황에 맞지 않는 용도 및 배치오류
    • 해결 방안: 수정 가능한 오류의 경우 오류의 해결 방안을, 수정 불가능한 오류의 경우 고객과 협의하여 협의 결과를 기재한다.
  • 오류 데이터 정제
    • 확인된 오류 데이터 분석을 통해 원천 데이터를 정제하거나 전환 프로그램을 수정한다.
profile
alpaka의 자격증 공부장

0개의 댓글

관련 채용 정보