태블로
status별로 성별/학력/대륙/연령별로 묶어서 비교해보는데
count로 나타냈던 그래프를 비율로 나타내는게 분석에 효율적이다.
그룹간 전환경향을 비교하기엔 비율로 나타내면 규모차이가 얼마나 나는지 알 수 있다.
ADSP
분석 기획 방향성 도출
- 분석 대상과 방법
문제 알 / 못
최적화, 통찰
솔루션, 발견
방법 알 / 못
분석 방법론
KDD 분석 방법론
Knowledge Discovery in Databases
데이터베이스로부터 지식(Insight)을 발견하는 과정
그냥 “데이터 분석 과정”을 정형화한 초기 프레임워크
crisp-DM
업데데이트모델평가전
업무 이해 - 데이터 이해 - 데이터 준비 - 모델링(테스트 계획 설계, 모델 작성 및 평가) - 평가(분석결과, 모델링과정, 모델 적용성) - 위대한실패 - 전개
빅데이터 분석 방법론
- PPADD(분석기획 - 데이터준비 - 데이터 분석 - 시스템 구현 - 평가및 전개)
- 분석기획에서 SOW(프로젝트 범위 정의서, 프로젝트에 참여하는 관계자들의 이해를 일치, 핵심목표 정의.), 위험계획 수립 : 회전완수
회피, 전이, 완화, 수용
범위설정 - 프로젝트 정의/계획 수립 - 위험계획 수립
분석 과제 발굴
하향식
문제 주어지고 해답찾기.
문제탐색- 문제정의 - 해결방안 - 타당성 검토
- 문제탐색 - 비즈니스 모델 캔버스 단순화
지원인프라 업무 중에 고객이 제품을 규제와 감사 했다
- 해결방안: 기존 시스템 활용, 시스템 고도화(분석역량확보), 전문업체 아웃소싱, 교육 및 채용을 통한 전문 인력
- 관점: 거시적, 경쟁자, 시장 니즈
상향식
문제 정의가 어려울때 사물 인식(what 관점)
프로포타이핑
비지도 학습
지도 vs 비지도
- 지도(하향): 분류, 회귀, 의사결정트리, KNN(K-Nearest Neighbors, 클래스 예측), SVM(Support Vector Machine, 분리하는 초평면 찾기)
- 비지도(상향):군집, 차원축소, 연관규칙
분석프로젝트 관리 방안
-
분석과제 고려 5요소
데이터크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도/정밀도
-
프로젝트 관리지식 10
이범통이 의자에서 시원한 조리품을 먹었다.
이해관계자, 범위, 통합, 의사소통, 인적자원, 시간, 원가, 조달(아웃소싱), 리스크, 품질
분석 마스터 플랜
마스터 플랜 수립
- 프로젝트 우선순위(ROI, 과제에 들어가는 비용 대비, 얼마나 가치(수익, 효율성, 성과 등)를 창출할 수 있는가)
- 시급성: 비즈니스 효과 - value, 전략적 중요도 + 목표가치
- 난이도(데이터, 분석): 투자비용 요소 - volume(양), variety(다양성), velocity(속도)/ 데이터 획득/저장/가공 비용, 분석 적용 비용, 분석 수준
현재쉬움 - 난이도면 현재어려움 / 시급이면 미래쉬움 - 미래 어려움
분석 거버넌스 체계 수립
데이터에 대한 통제 권한과 책임을 정하고, 이를 체계적으로 관리하는 활동
우리 조직의 데이터를 누가, 언제, 어떻게, 왜 관리하고 사용하는지 정하는 룰과 시스템
-
구성요소
시조프로마인드데
시스템, 조직, 프로세스, 마인드, 데이터
-
분석 성숙도(CMMI, Capability Maturity Model Integration)모델 기반
도활확최: 도입 - 활용 - 확산(전사 차원 관리, 공유) - 최적화
최적화: 분석을 진화시키고 혁신 및 성과향상에 기여
- 광의의 분석: 분석관련 서비스 제공엔진, 어플리케이션, api, 하드웨어
- 협의의 분석: 데이터 처리 프레임워크, 분석엔진, 분석 라이브러리
- 구성요소: 원조프
원칙, 조직, 프로세스
- 거버넌스 체계: 데이터 표준화, 관리체계(효율성), 저장소, 표준화 활동(모니터링, 표준개선)
- 집중: 독립적인 전담조직, 중복업무 가능성
- 기능: 해당 부서에서 직접 분석
- 분산: 분석 조직 인력 현업부서에 배치
1과목
DIKW 피라미드
예시도 알기!!
- data, information, knowledge, wisdom
빅데이터 위기요인과 그에 따른 통제방안
정형/반정형/비정형
- 정형: 표
- 반정형: html, json..
- 비정형: SNS, 유튜브, 이미지, 텍스트
패지요
메타데이터 Vs 스키마
SCM 3p
anffb, dbxhddjqcpdml guqfurdmf qkxkddmfh
데이터의 가치측정
인공지능과는 상관없다