오늘은 위키북스의 "2023 ADsP 데이터분석 준전문가 (전용문, 박현민 지음)" 의 p114~139을 공부했다. 2과목의 마지막 부분이다.
(참고 : 내가 기억하고 싶은것을 적어두었다.)
[과목 #2] 2장 분석 마스터플랜
02 분석 거버넌스 체계 수립
1. 거버넌스 체계 개요
[1] 분석 거버넌스 체계 개요
- 거버넌스(governance) = '통칭'
- 기업에서 의사결정을 위한 데이터의 분석과 활용을 위한 체계적이 관리를 의미
[2] 분석 거버넌스 체계 구성요소
- 5가지 :
- 조직(organization)
- 과제 기획 및 운영 프로세스(process)
- 분석 관련 시스템(system)
- 데이터(data)
- 분석 관련 교육 및 마인드 육성 체계(human resource)
2. 데이터 분석 성숙도 모델 및 수준 진단
[1] 분석 수준 진단 프레임 워크
- 분석 준비도와 분석 성숙도를 통하여 데이터 분석 수준을 진단
- 이후 무엇을 준비/보완해야 하는지 등 분석의 유형 및 방향성을 결정 할 수 있을 것
[2] 분석 준비도
- 기업의 데이터 분석 도입의 수준을 파악하기 위한 진단 방법
- 6가지 영역을 대상으로 수준 파악 : 분석 문화, 분석 데이터, 분석 인프라, 분석 기법, 분석 업무, 분석 인력 및 조직
[3] 분석 성숙도
- CMMI (Capability Maturity Model Integration) 모델 활용하여 조직의 성숙도 평가
- 3가지 부문을 대상으로 수준 구분 : 비즈니스, 조직/역량, IT
[4] 분석 수준 진단 결과
- 분석 수준 진단 결과를 4가지 유형으로 구분 : 정착형, 확산형, 준비형, 도입형
3. 분석 지원 인프라 방안 수립
[1] 플랫폼으로 인프라 구축
- 플랫폼 : 서비스를 위한 응용프로그램이 실행될 수 있는 기초를 이루는 컴퓨터 시스템을 의미, HW에 탑재되어 데이터 분석에 필요한 프로그래밍 환경과 실행 및 서비스 환경을 제공
4. 데이터 거버넌스 체계 수립
[1] 데이터 거버넌스 구성요소
(1) 개요
- 데이터 거버넌스 : 전사 차원의 모든 데이터에 대해 정책 및 지침, 표준화, 운영 조직 및 책임 등의 표준화된 관리 체계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축하는 것
(2) 데이터 거버넌스 구성요소
- 원칙(Principle) : 데이터를 유지 관리하기 위한 지침과 가이드
- 조직(Organization) : 데이터를 관리할 조직의 역할과 책임
- 프로세스(Process) : 데이터 관리를 위한 활동과 체계
[2] 데이터 거버넌스 체계
(1) 데이터 표준화
- 데이터 표준 용어 설정, 명명 규칙(Name Rule) 수립, 메타데이터(Metadata) 구축, 데이터 사전(Data Dictionary) 구축 등
- 데이터 표준 용어 : 표준 단어 사전, 표준 도메인 사전, 표준 코드 등으로 구성됨
(2) 데이터 관리 체계
- 표준 데이터를 포함한 메타데이터와 데이터 사전의 관리원칙을 수립
- 항목별 상세 프로세스를 만들고 관리와 운영을 위한 담당자 및 조직별 역할과 책임을 상세하게 준비
- 특히 빅데이터의 경우 Data Life Cycle Management(데이터 생명 주기 관리 방안)가 중요함, 생명 주기를 정해 주기가 만료된 데이터는 폐기 (or 관리 비용이 데이터의 가치보다 커질 수 있음)
(3) 데이터 저장소 관리(Repository)
- 메타데이터 및 표준 데이터를 관리하기 위한 전사 차원의 저장소 구성
- 데이터 구조 변경에 따른 사전 영향 평가도 수행해야 효율적 활용 가능
(4) 표준화 활동
- 표준 준수 여부 주기적으로 점검 및 모니터링, 지속적인 변화 관리 및 주기적인 교육 진행
5. 데이터 조직 및 인력방안 수립
[1] 데이터 분석 조직 및 인력방안 개요
(1) 데이터 분석 조직
- 분석 조직 : 기업 내 존재하는 빅데이터 속에서 가치를 찾아 전파하고 이를 행동화하는 역할을 함
(2) 조직 및 인력 구성 시 고려사항
[2] 데이터 분석 조직 유형
(1) 집중형 조직 구조
- 회사의 모든 분석 업무를 별도의 독립적인 전담 조직에서 담당
- 내부 전략적인 중요도에 따라 우선순위를 정해 추진 가능
(2) 기능 중심의 조직 구조
- 별도로 분석 조직을 구성하지 않고 각 해당 업무 부서에서 직접 분석하는 형태
- 전사적 관점에서 핵심 분석이 어려움, 특정 업무 부서에 국한된 분석을 수행 또는 일부 중복된 분석 업무를 수행할 수 있는 조직 구조
(3) 분산형 조직 구조
- 분석 조직의 인력을 현업 부서에 배치해 분석 업무를 수행
- 전사 차원에서 분석 과제의 우선순위 선정해 수행 가능, 분석 결과를 신속하게 실무에 적용 가능
- DSCoE: Data Science Center of Excellence
6. 분석 과제 관리 프로세스 수립
[1] 분석 과제 관리 프로세스 수립 개요
- 체계적인 분석 과제 관리 프로세스를 수행하여 기업 내 분석 문화를 내재화
[2] 분석 과제 관리 프로세스
- 과제 발굴 단계 : 개별 조직 혹은 개인이 과제를 발굴하고 이를 과제화하여 POOL(사용 가능한 데이터의 집합)로 관리하고 분석 과제 선정
- 과제 수행 단계 : 선정된 과제에 대하여 팀을 구성하고 분석 과제를 수행하면서 지속적인 모니터링 작업 병행, 결과 공유 및 개선하는 절차 수행
7. 분석 교육 및 변화관리
[1] 분석 교육 및 변화관리의 개요
- 분석 조직 및 인력에 대한 지속적인 교육, 훈련 필요
- 경영층이 사실 기반의 의사결정을 할 수 있는 문화를 정착시키려는 변화관리를 지속적으로 계획 및 수립 필요
[2] 분석 도입에 대한 문화적 대응
- 모든 구성원이 데이터를 분석하고 이를 업무에 즉시 활용할 수 있도록 분석 문화를 정착시키려는 움직임
- 분석 내재화 단계 : 준비기 >> 도입기 >> 안정 추진기
- 기존의 행태로 되돌아가려는 경향이 존재하기 때문에 관련 교육 및 마인드 육성 필요
[3] 분석 교육
- 단순한 툴 교육이 아닌 분석 확보 및 강화에 초점을 맞추어야 함
- 분석 기획자 - 데이터 분석 큐레이션 교육
- 분석 실무자 - 데이터 분석 기법 및 도구에 대한 교육
- 업무 수행자 - 분석 기회 발굴 및 시나리오 작성법 등의 교육
[출처]
위키북스 2023 ADsP 데이터분석 준전문가 (전용문, 박현민)
데이터 분석전문가가이드 (한국데이터산업진흥원)
https://dataonair.or.kr/db-tech-reference/d-guide/data-practical/?uid=417&mod=document&pageid=1
https://velog.io/@zinu/ADsP-데이터-분석-기획-분석-거버넌스-체계
https://medium.com/data-science-at-microsoft/designing-a-data-science-organization-ab53a80b1d15