Chapter2. 데이터 분석 계획[1] - 분석방안 수립

Lim SeJin·2024년 8월 25일
0
post-custom-banner

데이터 분석기획

데이터 분석기획 특징

1) 분석 대상과 방법에 따른 분류

What?
KnownUnKnown
How?KnownOptimizationInsight
UnKnownSolutionDiscovery

2) 목표 시점에 따른 분류

  • 단기적 접근방식 ⇒ 과제를 빠르게 해결, 명확한 해결 Quick-Win
  • 중장기적 접근방식 ⇒ 지속적인 분석 문화 도입, 전사적으로 과제 도출
  • 혼합 방식 ⇒ 분석 기획 시 적합, 분석의 가치를 증명하고 이해관계자를 동의시키는 목적

분석 기획

필요 역량 : 3가지 - 수학&통계학 / 정보기술 / 도메인지식

분석유형 :

설명분석기본 집계, 설명, 있는 사실 분석
예측분석미래의 불확실한 사실 및 기능성을 파악하기 위한 분석
진단분석인과/상관관계를 파악하여 원인을 밝히고자 하는 분석
처방 분석대안도출 / 의사결정 진행 분석방법

분석 마스터 플랜 & 로드맵

마스터 플랜

ISP ( 정보전략 계획, Information Strategy Planning )
⇒ 정보기술/시스템을 전략적으로 활용하기 위한 중장기 마스터 플랜 수립 절차. 충분한 조직 내-외부 환경 분석 및 사용자의 요구사항을 바탕으로 시스템 구축 우선순위를 결정

우선순위 평가 기준

  1. 전략적 중요도
    1. 전략적 필요성 : 위험성, 손실 파악, 업무에 얼마나 밀접한가?
    2. 시급성 : 업무능률 향상을 위한 시급성.
  2. 실행 용이성
    1. 투자 용이성 : 인력 투입대비 효율, 투자 가능성
    2. 기술 용이성 : 과제의 안정성 검증 정도. 하드웨어의 정도
🥐 ROI(Return Of Investment) - 투자수익률 고려

1) 투자비용요소

  • Volume, Variety, Velocity

2) 비즈니스 효과

  • Value

시급성 또는 난이도를 기준으로 과제 우선순위 평가를 하며, 시급성의 대표적인 평가요소는 KPI가 있다.
시급성 - 비즈니스효과 / 난이도 - 투자비용요소와 관련있다.

포트폴리오 4분면

NowFuture
Hard1 사분면2 사분면
Easy3 사분면4 사분면

[급한것부터 - 시급성]
3 > 4 > 1 > 2

[쉬운것부터 - 난이도]
3 > 1 > 4 > 2

⭐ 분석 마스터 플랜(큰 기본계획) ⇒ 분석 로드맵 설정 (상세 설계 / 작은 기본계획)

분석문제정의

과제도출방식

1) Top - Down

기본적으로 분석의 대상(What)이 알려진 상태에서 많이 시도하는 방식으로, 하향식 접근 방식이며 수렴(Converge)의 형태를 따른다.

  • 비즈니스 모델 캔버스를 통해 과제를 발굴한다. 이 때 비즈니스 모델 캔버스는
    9가지 블록( 핵심 파트너십, 핵심활동, 핵심자원, 가치제안, 고객관계, 채널, 고객군집, 비용구조, 수익원)
    ⇒ 5개 : 3개 문제발굴 - 업무, 제품, 고객 + 2개 관리 - 규제&감사, 자원인프라

분석 기회의 관점

거시적 관점 : 사회, 기술, 경제, 환경, 정치 (STEEP)

경쟁자 확대 관점 : 대체재, 경쟁자, 신규 진입자 (SCN)

시장 니즈탐색 관점 : 고객, 채널, 영향자 (CCI)

역량의 재해석 관점 : 내부 역량, 파트너&네트워크 (CP)

2) Bottom - Up

반대로 What이 알려지지 않은 상태에서 기초부터 접근하는 방식으로 상향식 접근방식이며 발산(Diverge)의 형태를 따른다.

👉 디자인 사고 접근법을 통해 전통적 분석 사고를 극복할 수 있다.

🎨 디자인 사고

  • 현장 관찰, 감정이입, 대상 관점으로의 전환을 수행한다. 사물을 있는 그대로 인식하여 불편한 점을 찾아내는 방법 (Why를 강조하며 What관점으로 진입)

인과 관계 ⇒ 상관관계로 이동한 빅데이터 환경에서의 분석이 이루어진다.
표본 ⇒ 전수조사

🛡️ 상향식 접근방법 해결방법 - 프로토타이핑 접근법 : 주제가애매(문제인식 수준), 데이터 존재여부의 불확실성, 사용목적의 가변성을 고려하여 해당 접근법을 사용 ⇒ agile하게 데모 만들어서 피드백 하는방법

분석 방안

분석방법론

요건 : 상세한 절차(Procedures), 방법(Methods), 도구 기법(Tool&Tech), 템플릿과 산출물(Temp & Output), 지식만 있으면 활용 가능할 정도의 난이도.

선순환과정 : 형식화, 체계화, 내재화

암묵지 ⇒ 형식지 : 형식화
방법론 ⇒ 암묵지 : 내재화
형식지 ⇒ 방법론 : 체계화

계층 프로세스 모델 구성

Phase(1단계, 최상위) → Task(2단계, 중간) → Step(3단계, 최하위)

  • Phase : 버전관리, 산출물

  • Task : 물리/논리단위 품질검토, 단계를 구성하는 단위 활동

  • Step : WBS의 워크패키지, 단위프로세스

    *소프트웨어개발생명주기(SDLC)
    ⇒ 계획 → 요구분석 → 설계 → 구현 → 시험 → 유지보수


분석 모형

폭포수 모형

  • 하향식 접근 방법, 단계적, 순차적, 체계적
  • 후반부가서 구체화 되는 결과물, 문제점이 뒤늦게 발견됨

프로토타입 모형

  • 애자일하게 빨리빨리 실험적/진화적으로 시스템의 일부분을 구축해보며 나가는 모형
  • 사용자의 오해 생김 / 폐기되는 프로토타입 존재

나선형 모형

  • 계획수립 → 위험분석 → 개발 → 고객평가 → 계획수립(반복) …
  • Agile방법론과 가장 유사.
  • 위험감소, 유지보수 용이, But, 개발시간 오래걸림

반복적모형

1) 증분형 모형 : 일부분 개발 후 점차 확대

2) 진화형 모형 : 핵심요소 개발 후 지속발전

분석 방법론

1) KDD 분석방법론 [5단계!]

분석절차 : Selection > Preprocessing > Transformation > Mining > Interpretation/Evaluation
(여기는 뭐 그냥 특징 거의 없음)

2) CRSIP-DM [4계층, 6단계]

  • 4계층 모델, 최상위 레벨(Phase가 여럿). Task ( Generic - Specialized ). 프로세스실행(Process Instances)
  • Business Understanding > Data Understanding >Data Preparation > Modeling > Evaluation > Deployment (엄청 이해를 많이 한다.)

3) SEMMA ( Sample Explore Modify Model Access ) [5단계]

  • 기술/통계중심의 데이터 마이닝 프로세스, SAS Institute의 데이터 마이닝 도구와 쉽게 접목
  • Sample(추출) > Explore(탐색) > 수정(Modify) > Model(모델링) > Access(평가)
  • Modify는 뭘까? > 수량화, 표준화, 변환, 그룹화 (전처리)

4) 빅데이터 분석 방법론 (PPADD)

분석기획(Planning) > 데이터 준비(Preparation) > 데이터분석(Analysis) > 시스템구현(Developing) > 평가 및 전개(Deployment)

  1. 분석 기획(Planning)
    • 비즈니스 이해 및 범위 설정
    • 프로젝트 정의 및 계획 수립(KPI, WBS)
    • 프로젝트 위험계획 수립(Risk)
  2. 데이터 준비(Preparing)
    • 필요 데이터 정의
    • 데이터 스토어 설계
    • 데이터 수집 및 정합성 점검
  3. 데이터 분석(Analyzing)
    • 분석용 데이터 준비
    • 텍스트 분석
    • 탐색적 분석
    • 모델링 (Pseudo code)
    • 모델 평가 및 검증
  4. 시스템 구현(Developing)
    • 설계 및 구현
    • 시스템 테스트 및 운영
  5. 평가 및 전개 (Deploying)
    • 모델 발전계획 수립
    • 프로젝트 평가 및 보고

데이터 분석 거버넌스

구성요소 : Organization, Process, System ,Data, Human Resource

다시보고 가는 분석 조직구조 : 집중형, 기능형, 분산형

데이터 분석 플랫폼 - 개별 시스템 / 플랫폼 구조(중앙집중)

데이터 분석 플랫폼 구성요소 :

분석 서비스 제공엔진, 분석 어플리케이션, 분석 서비스 제공 API, 데이터 처리 Framework, 분석 엔진, 분석 라이브러리, 운영체제, 하드웨어

⇒ 이때 이거 는 협의의 분석 플랫폼이며, 전부 합쳐서 광의의 분석 플랫폼이라고 한다.

데이터 거버넌스

데이터 거버넌스 : 전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직, 책임 등 표준화된 관리체계를 수립하고 운영하기 위한 프레임워크와 저장소를 구축

주요 관리 대상 : Master Data, Meta Data(다른 데이터를 설명하기 위한 데이터), Data Dictionary

데이터 거버넌스 특징 : 가용성, 유용성, 통합성, 보안성, 안정성

데이터 거버넌스 구성요소 : Principle(원칙), Organization(조직), Process(프로세스)

데이터 거버넌스 체계 : 데이터 표준화 > 데이터 관리체계 > 데이터 저장소 관리 > 표준화 활동 > 데이터 표준화(반복)

  • 데이터 표준화 - 데이터 표준용어 / 명명 규칙 / 메타데이터 / 데이터 사전 구축
  • 데이터 관리체계 - 관리/운영을 위한 상세 프로세스를 수립, R&R명확히 함
  • 데이터 저장소 관리 : Workflow-Application 관리 지원, 전사차원의 Storage구성
  • 표준화 활동 : 표준 준수여부 주기 점검

분석 수준 진단

기업의 분석수준을 진단하기 위해서는 다음을 평가해야한다.

  • 6개 영역의 분석 준비도(Readiness)
  • 3개 영역의 분석 성숙도(Maturity)

분석 준비도(Readiness)

  1. 분석 업무 파악 : ~~ 분석 업무 자체가 존재하는지?, 분석업무 정기적 개선 등
  2. 인력 및 조직 : 분석 전문가 직무 존재, 교육훈련 프로그램, 관리자들의 능력, 조직
  3. 분석 기법 : 분석 업무 방법론, 라이브러리, 효과성 평가 , 개선
  4. 분석 데이터 : 데이터 충분성/신뢰성/적시성, 비구조적 데이터 관리, MDM(Master Data Management)
  5. 분석 문화 : 사실에 근거한 의사결정, 데이터 중시, 회의등의 데이터 활용, 공유 및 협업 문화
  6. IT인프라 : EAL, ETL, 빅데이터 분석 환경, 통계 분석 환경, 서버 및 스토리지

분석 성숙도(Maturity)

사분면 분석(Anlaysis Quadrant)

분석 관점에서 기업의 데이터 분석 수준진단 결과를 확인할 수 있다.

준비형정착형도입형확산형
준비도낮음낮음높음높음
성숙도낮음높음낮음높음
profile
INTJ, Interested in Computer Vision
post-custom-banner

0개의 댓글