ADsP Part2. 데이터 분석 기획

시에나 Sienna·2024년 7월 8일
0

1. 데이터 분석 기획의 이해

어떤 목적(방향성) 으로 어떻게(방법론) 무엇을 분석과제(과제 발굴)로 삼고 관리 하는지 알아보자

1) 방향성

  • 분석 대상(What)과 방법(How)
    백곰it 스터디

  • 목표 시점별 분석 기획 방안
    나의 첫 기술 블로그 함께 기록해요

  • 고려사항

    • 가용 데이터
      • 데이터 확보
      • 데이터 유형에 따른 솔루션/분석방법
    • 적절한 활용 방안과 유즈케이스
    • 장애 요소들에 대한 사전 계획 수립

2) 방법론

  1. 폭포수 모델(Waterfall Model)
    • 하향식접근 방식, 단순 순차적
  2. 프로토타입 모델(Prototype Model)
    • 고객의 요구에 맞춰 결과 값을 반복적으로 개선
  3. 나선형 모델(Spire Model)
    • 반복을 통해 위험요소 제거
  4. 계층적 프로세스 모델(Hierarchical Process Model)
    • Phase > Task > Step 형태로 구성
    • 전통적 분석 방법론 ex) KDD, CRISP-DM 등
      • KDD(Knowledge Discovery in Databases)
        투이컨설팅 전통적 데이터분석 방법론: KDD, CRISP-DM
      • CRISP-DM(Cross Industry Standard Process for Data Mining)
        • 업무이해 > 데이터 이해 > 데이터 준비 > 모델링 > 평가 > 전개
        • 모델링 : 모델 평가 등
        • 평가 : 모델 적용성 평가 등
        투이컨설팅 전통적 데이터분석 방법론: KDD, CRISP-DM
    • 빅데이터 분석 방법론
      • 위험 대응 계획 수립 : 회피(Avoid), 전이(Transfer), 완화(Mitigate), 수용(Accept)

3) 과제 발굴

(1) 하향식 접근법(Top-Dwon Approach)

  1. 문제 발견(Problem Discovery)
    • 비즈니스 모델 캔버스(기업 내부)
    • 분석 기회 발굴의 범위 확장(기업 내외부)
    • 분석 유즈 케이스(Anylytics Use Case)
  2. 문제 정의(Problem Definition)
    • 비즈니스 문제를 데이처 문제로 변환
  3. 해결 방안 탐색(Solution Search)
  4. 타당성 검토(Feasibility Study)
    • 경제적 타당성 : 비용 대비 편익
    • 데이터 및 기술적 타당성 : 인력과 시스템적으로 해결 가능 여부

(2) 상향식 접근법(Bottom-Up Approach)

  • 비지도 학습
    • 종속변수 X
    • 군집분석, 연관분석
  • 지도 학습
    • 종속변수 O
    • 회귀분석, 분류분석
  • 프로토타입핑 접근법 : 반복적 개선
  • 프로세스 분석을 통한 절차
    • 프로세스 분류 → 프로세스 흐름 분석 → 분석 요건 식별 → 분석 요건 정의

4) 과제 관리

  • 정확도 뿐만아니라 모두가 이해되도록 구축하고 지속적인 모델 개선을 수행
  • 분석과제관리
    https://oncologymedicalphysics.com/https://oncologymedicalphysics.com/
  • KS A ISO 21500:2013(프로젝트관리 지침의 프로젝트 관리 체계)
  • 분석 프로젝트의 영역별 주요 관리 항목
    • 범위(Scope), 시간(Time), 원가(Cost), 품질(Quality), 통합(Intergration), 조달(Procurement), 자원(Resource), 리스크(Risk), 의사소통(Communication), 이해관계자(Stakeholder)

Time Boxing : 프로토타입 모델에서 목표에 도달핮 못하더라도 시간이 초과할 경우 다음 작업 수행

2. 분석 마스터 플랜

마스터 플랜을 수립하기 위하여 프레임워크(구조화)를 구성할 때 우선순위 선정 방법과 그를 통한 거버넌스(규제) 체계를 수립하는 과정을 알아보자

1) 마스터 플랜 수립 프레임 워크

  • 우선 순위 설정시 고려요소

  • 우선순위 설정 절차

    • 분석과제 도출 → 우선순위 평가 → 우선순위 정련의 순서로 분석과제가 확정이 된다.
  • 과제 우선순위 평가기준

    • 시급성 기준 : Ⅲ → Ⅳ → Ⅱ 영역순
    • 난이도 기준 : Ⅲ → Ⅰ → Ⅱ 영역순
  • 우선순위를 결정하고 로드맵을 수립하고 세부 이행 계획을 수립한다.

    • 기존 분석 체제에서는 폭포수 방식도 있었으나 최근에는 혼합형 방식으로 사용한다.
      • 데이터 수집 및 확보와 데이터 분석 준비 ⇒ 순차적
      • 모델링 단계 ⇒ 반복적

2) 분석 거버넌스 체계 수립

  • 분석 거버넌스 체계 구성요소
    • Process : 과제 기획 및 운영 프로세스
    • System : 분석관련 시스템
    • Data : 데이터
    • Human Resource : 분석교육/마인드 육성체계
    • Organization : 분석기획 및 관리 수행 조직
  • 데이터 분석 수준 진단
  • 데이터분석 거버넌스 체계 수립
    • 데이터에 관한 관리 체계(정책, 지침, 표준화 등)를 수립하고, 운영을 위한 프레임 워크(저장소) 구축하는 단계
    • 구성요소 : 원칙, 조직, 프로세스
    • 체계 : 데이터 표준화 ↔ 데이터 관리 체계 ↔ 데이터 저장소 관리(Repository) ↔ 표준화 활동
      • 데이터 표준화 : 표준 용어 설정, 명명 구칙(Name Rule) 수립, 데이터 사전(Data Dictionary) 구축
      • 데이처 관리 처계 : Data 생명 주기 관리
      • 데이터 저장소 관리 : 사전 영향 평가도 수행
      • 표준화 할동 : 계속 변화 관리 및 주기적인 교육 진행
  • 분석을 위한 3가지 조직 구조
집중구조기능구조분산구조
특징- 전략적 중요도에 따라 분석 진행가능
- 이중화/이원화 가능
- 일반적인 분석 수행구조
- 전사적 핵심 분석 어려움
- 분석결과에 따른 빠른 Action
- 역할 분담이 명확해야 함

  • 분석과제 관리 프로세스 수립
  • 지속적인 변화에 따른 교육
    • 분석 기획자 : 분석 큐레이션(분석 사례) 교육
    • 분석 실무자 : 데이터 분석 기법 및 툴에 대한 교육
    • 업무 수행자 : 분석기회 발굴, 구체화, 시나리오 작성법 등

과제 발굴을 위해서 방향성과 그에 따른 적절한 방법론을 사용하여 관리 초점이 무엇인지 알아보고 이를 구조화하기 위해 분석 우선순위를 평가하여 조직적으로 어떻게 인력을 배치하고 변화에 따라 교육까지 중장기 적인 플랜을 짤 수 있도록 알아보는 과정이었다. 그냥 책으로만 보면 이게 왜 나오는지 흐름을 보기 힘들었는데 한번 정리하니 그래도 좀 멀리 볼수 있게 되었다. 좀더 정리해서 한눈에 흐름이 보이도록 해봐야겠다.

0개의 댓글