![post-thumbnail](https://velog.velcdn.com/images/alpaka206/post/a12d17fb-d289-490e-ab19-0884816d2ca4/image.png)
오류 데이터 측정 및 정제의 개요
- 오류 데이터 측정 및 정제는 고품질의 데이터를 운영 및 관리하기 위해 수행한다.
- 오류 데이터 측정 및 정제는 '데이터 품질 분석 → 오류 데이터 측정→ 오류 데이터 정제' 순으로 진행한다.
데이터 품질 분석
- 데이터 품질 분석은 오류 데이터를 찾기 위해 원천 및 목적 시스템 데이터의 정합성 여부를 확인하는 작업이다.
- 대표적인 원천 시스템 데이터의 정합성 항목
- 필수항목에 해당하는 데이터가 모두 있는가?
- 문자형, 숫자형, 날짜형 등 데이터의 유형은 올바르게 관리되는가?
- 날짜는 유효한 날짜형태인가?
- 금액은 유효한 값의 범위인가?
- 계좌번호 또는 코드값은 정해진 규칙에 맞는 번호인가?
- 영업점은 실제 존재하는가?
- 업무규칙에 위배되는 잘못된 정보는 없는가?
- 보고서값과 실제 데이터값이 일치하는가?
- 잔액은 회계 정보와 일치하는가?
- 대표적인 목적 시스템 데이터의 정합성 항목
- 과목별 좌수 및 잔액
- 특정 기준으로 분류된 좌수 및 잔액
- 보고서 항목 또는 통계 수치
- 계좌 및 고객을 샘플링하여 해당사항 확인
- 특수 관계의 고객에 대한 데이터 확인
오류 데이터 측정
- 오류 데이터 측정은 데이터 품질 분석을 기반으로 정상 데이터와 오류 데이터의 수를 측정하여 오류 관리 목록을 작성하는 것이다.
- 정상 데이터는 전환 대상 범위의 데이터를 업무 영역별, 테이블별로 구분하여 수량을 측정 및 기재한다.
- 오류 데이터는 업무별로 오류 위치 및 유형을 확인하여 수량을 측정 및 기재한다.
오류 데이터 정제
- 오류 데이터 정제는 오류 관리 목록의 각 항목을 분석하여 원천 데이터를 정제하거나 전환 프로그램을 수정하는 것이다.
- 오류 데이터 분석
- 오류 관리 목록의 오류 데이터를 분석하여 오류 상태, 심각도, 해결 방안을 확인 및 기재한다.
- 상태
- Open: 오류가 보고만되고 분석되지 않은 상태
- Assigned: 오류의 영향 분석 및 수정을 위해 개발자에게 오류를 전달한 상태
- Fixed: 개발자가 오류를 수정한 상태
- Closed: 수정된 오류에 대해 테스트를 다시 했을 때 오류가 발견되지 않은 상태
- Deferred: 오류 수정을 연기한 상태
- Classified: 보고된 오류관련자들이 확인했을 때 오류가 아니라고 확인된 상태
- 심각도
- 상: 데이터 전환을 수행할 수 없는 오류
- 중: 데이터 전환 전반에 영향을 미치는 오류
- 하: 데이터 전환에 직접적인 영향을 미치지는 않으나 상황에 맞지 않는 용도 및 배치오류
- 해결 방안: 수정 가능한 오류의 경우 오류의 해결 방안을, 수정 불가능한 오류의 경우 고객과 협의하여 협의 결과를 기재한다.
- 오류 데이터 정제
- 확인된 오류 데이터 분석을 통해 원천 데이터를 정제하거나 전환 프로그램을 수정한다.
![](https://velog.velcdn.com/images/alpaka206/post/050a3a26-0936-4ca8-ba08-e3492b708bff/image.png)