1) 분석 대상과 방법에 따른 분류
What? | |||
---|---|---|---|
Known | UnKnown | ||
How? | Known | Optimization | Insight |
UnKnown | Solution | Discovery |
2) 목표 시점에 따른 분류
필요 역량 : 3가지 - 수학&통계학 / 정보기술 / 도메인지식
분석유형 :
설명분석 | 기본 집계, 설명, 있는 사실 분석 |
---|---|
예측분석 | 미래의 불확실한 사실 및 기능성을 파악하기 위한 분석 |
진단분석 | 인과/상관관계를 파악하여 원인을 밝히고자 하는 분석 |
처방 분석 | 대안도출 / 의사결정 진행 분석방법 |
ISP ( 정보전략 계획, Information Strategy Planning )
⇒ 정보기술/시스템을 전략적으로 활용하기 위한 중장기 마스터 플랜 수립 절차. 충분한 조직 내-외부 환경 분석 및 사용자의 요구사항을 바탕으로 시스템 구축 우선순위를 결정
1) 투자비용요소
2) 비즈니스 효과
시급성 또는 난이도를 기준으로 과제 우선순위 평가를 하며, 시급성의 대표적인 평가요소는 KPI가 있다.
시급성 - 비즈니스효과 / 난이도 - 투자비용요소와 관련있다.
Now | Future | |
---|---|---|
Hard | 1 사분면 | 2 사분면 |
Easy | 3 사분면 | 4 사분면 |
[급한것부터 - 시급성]
3 > 4 > 1 > 2
[쉬운것부터 - 난이도]
3 > 1 > 4 > 2
⭐ 분석 마스터 플랜(큰 기본계획) ⇒ 분석 로드맵 설정 (상세 설계 / 작은 기본계획)
과제도출방식
1) Top - Down
기본적으로 분석의 대상(What)이 알려진 상태에서 많이 시도하는 방식으로, 하향식 접근 방식이며 수렴(Converge)의 형태를 따른다.
분석 기회의 관점
거시적 관점 : 사회, 기술, 경제, 환경, 정치 (STEEP)
경쟁자 확대 관점 : 대체재, 경쟁자, 신규 진입자 (SCN)
시장 니즈탐색 관점 : 고객, 채널, 영향자 (CCI)
역량의 재해석 관점 : 내부 역량, 파트너&네트워크 (CP)
2) Bottom - Up
반대로 What이 알려지지 않은 상태에서 기초부터 접근하는 방식으로 상향식 접근방식이며 발산(Diverge)의 형태를 따른다.
👉 디자인 사고 접근법을 통해 전통적 분석 사고를 극복할 수 있다.
인과 관계 ⇒ 상관관계로 이동한 빅데이터 환경에서의 분석이 이루어진다.
표본 ⇒ 전수조사
🛡️ 상향식 접근방법 해결방법 - 프로토타이핑 접근법 : 주제가애매(문제인식 수준), 데이터 존재여부의 불확실성, 사용목적의 가변성을 고려하여 해당 접근법을 사용 ⇒ agile하게 데모 만들어서 피드백 하는방법
요건 : 상세한 절차(Procedures), 방법(Methods), 도구 기법(Tool&Tech), 템플릿과 산출물(Temp & Output), 지식만 있으면 활용 가능할 정도의 난이도.
선순환과정 : 형식화, 체계화, 내재화
암묵지 ⇒ 형식지 : 형식화
방법론 ⇒ 암묵지 : 내재화
형식지 ⇒ 방법론 : 체계화
Phase(1단계, 최상위) → Task(2단계, 중간) → Step(3단계, 최하위)
Phase : 버전관리, 산출물
Task : 물리/논리단위 품질검토, 단계를 구성하는 단위 활동
Step : WBS의 워크패키지, 단위프로세스
*소프트웨어개발생명주기(SDLC)
⇒ 계획 → 요구분석 → 설계 → 구현 → 시험 → 유지보수
1) 증분형 모형 : 일부분 개발 후 점차 확대
2) 진화형 모형 : 핵심요소 개발 후 지속발전
1) KDD 분석방법론 [5단계!]
분석절차 : Selection > Preprocessing > Transformation > Mining > Interpretation/Evaluation
(여기는 뭐 그냥 특징 거의 없음)
2) CRSIP-DM [4계층, 6단계]
3) SEMMA ( Sample Explore Modify Model Access ) [5단계]
4) 빅데이터 분석 방법론 (PPADD)
분석기획(Planning) > 데이터 준비(Preparation) > 데이터분석(Analysis) > 시스템구현(Developing) > 평가 및 전개(Deployment)
구성요소 : Organization, Process, System ,Data, Human Resource
다시보고 가는 분석 조직구조 : 집중형, 기능형, 분산형
데이터 분석 플랫폼 - 개별 시스템 / 플랫폼 구조(중앙집중)
데이터 분석 플랫폼 구성요소 :
분석 서비스 제공엔진, 분석 어플리케이션, 분석 서비스 제공 API, 데이터 처리 Framework
, 분석 엔진
, 분석 라이브러리
, 운영체제, 하드웨어
⇒ 이때 이거
는 협의의 분석 플랫폼이며, 전부 합쳐서 광의의 분석 플랫폼이라고 한다.
데이터 거버넌스 : 전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직, 책임 등 표준화된 관리체계를 수립하고 운영하기 위한 프레임워크와 저장소를 구축
주요 관리 대상 : Master Data, Meta Data(다른 데이터를 설명하기 위한 데이터), Data Dictionary
데이터 거버넌스 특징 : 가용성, 유용성, 통합성, 보안성, 안정성
데이터 거버넌스 구성요소 : Principle(원칙), Organization(조직), Process(프로세스)
데이터 거버넌스 체계 : 데이터 표준화 > 데이터 관리체계 > 데이터 저장소 관리 > 표준화 활동 > 데이터 표준화(반복)
기업의 분석수준을 진단하기 위해서는 다음을 평가해야한다.
분석 관점에서 기업의 데이터 분석 수준진단 결과를 확인할 수 있다.
준비형 | 정착형 | 도입형 | 확산형 | |
---|---|---|---|---|
준비도 | 낮음 | 낮음 | 높음 | 높음 |
성숙도 | 낮음 | 높음 | 낮음 | 높음 |