adsp정리

AnalytiCode·2025년 5월 16일

1과목

데이터와 정보

데이터의 유형

  • 정형 데이터 :엑셀, 관계형db, csv
  • 반정형 데이터 : 메타데이터, html, xml, json
  • 비정형 데이터 : 형태x, sns/유튜브/음원

정형/반정형/비정형
정형: 표
반정형: html, json..
비정형: SNS, 유튜브, 이미지, 텍스트

DIKW 피라미드

data, information, knowledge, wisdom

데이터 단위

패지요

데이터 베이스의 정의와 특징

데이터베이스의 개념

  • DB
    메타데이터 Vs 스키마
    메타데이터: 다른 데이터를 설명하는 데이터

빅데이터 위기요인과 그에 따른 통제방안

SCM 3p
anffb, dbxhddjqcpdml guqfurdmf qkxkddmfh

데이터의 가치측정
인공지능과는 상관없다

2과목 - 데이터 분석 기획

데이터 분석 기획의 이해

분석 기획 방향성 도출

  • 분석 대상과 방법
    문제 알 / 못
    방법 알 / 못

최적화, 통찰
솔루션, 발견

분석 방법론

KDD 분석 방법론

Knowledge Discovery in Databases
데이터베이스로부터 지식(Insight)을 발견하는 과정
그냥 “데이터 분석 과정”을 정형화한 초기 프레임워크

crisp-DM

업데데이트모델평가전
업무 이해 - 데이터 이해 - 데이터 준비 - 모델링(테스트 계획 설계, 모델 작성 및 평가) - 평가(분석결과, 모델링과정, 모델 적용성) - 위대한실패 - 전개

빅데이터 분석 방법론

PPADD (분석기획 - 데이터준비 - 데이터 분석 - 시스템 구현 - 평가및 전개)
1. 분석기획

  • 비즈니스 범위 설정: SOW(프로젝트 범위 정의서, 프로젝트에 참여하는 관계자들의 이해를 일치, 핵심목표 정의.)
    범위설정 - 프로젝트 정의/계획 수립 - 위험계획 수립
  • 위험 대응 계획 수립
    회전완수
    회피, 전이, 완화, 수용

위험계획 수립 : 회전완수
회피, 전이, 완화, 수용

분석 과제 발굴

하향식

문제 주어지고 해답찾기.
문제탐색- 문제정의 - 해결방안 - 타당성 검토

  • 문제탐색 - 비즈니스 모델 캔버스 단순화
  1. 문제탐색
    지원인프라 업무 중에 고객이 제품을 규제와 감사 했다
    관점: 거시적, 경쟁자, 시장 니즈

  2. 해결방안
    기존 시스템 활용, 시스템 고도화(분석역량확보), 전문업체 아웃소싱, 교육 및 채용을 통한 전문 인력

상향식

문제 정의가 어려울때 사물 인식(what 관점)
프로포타이핑
비지도 학습

지도 vs 비지도

  • 지도(하향): 분류, 회귀, 의사결정트리, KNN(K-Nearest Neighbors, 클래스 예측), SVM(Support Vector Machine, 분리하는 초평면 찾기)

  • 비지도(상향):군집, 차원축소, 연관규칙

분석프로젝트 관리 방안

분석과제 고려 5요소

데이터크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도/정밀도

프로젝트 관리지식체계 10

이범통이 의자에서 시원한 조리품을 먹었다.
이해관계자, 범위, 통합, 의사소통, 인적자원, 시간, 원가, 조달(아웃소싱), 리스크, 품질

분석 마스터 플랜

마스터 플랜 수립

  • 프로젝트 우선순위
    (ROI, 과제에 들어가는 비용 대비, 얼마나 가치(수익, 효율성, 성과 등)를 창출할 수 있는가)
  1. 시급성: 비즈니스 효과 - value, 전략적 중요도 + 목표가치
  2. 난이도(데이터, 분석): 투자비용 요소 - volume(양), variety(다양성), velocity(속도)/ 데이터 획득/저장/가공 비용, 분석 적용 비용, 분석 수준
    현재쉬움 - 난이도면 현재어려움 / 시급이면 미래쉬움 - 미래 어려움

분석 거버넌스 체계 수립

데이터에 대한 통제 권한과 책임을 정하고, 이를 체계적으로 관리하는 활동
우리 조직의 데이터를 누가, 언제, 어떻게, 왜 관리하고 사용하는지 정하는 룰과 시스템

구성요소

시조프로마인드데
시스템, 조직, 프로세스, 마인드, 데이터

분석 수준 진단

  • 분석 성숙도(CMMI, Capability Maturity Model Integration)모델 기반
    도활확최: 도입 - 활용 - 확산(전사 차원 관리, 공유) - 최적화

최적화: 분석을 진화시키고 혁신 및 성과향상에 기여

  • 데이터 분석 성숙도 모델(성숙도/준비도)
    도준정확
    도입형 준비형 정착형 확산형

분석 지원 인프라 방안

확장성을 고려한 플랫폼 구조(중앙집중적 관리)

  • 광의의 분석: 분석관련 서비스 제공엔진, 어플리케이션, api, 하드웨어
  • 협의의 분석: 데이터 처리 프레임워크, 분석엔진, 분석 라이브러리

데이터 거버넌스

  1. 구성요소: 원조프
    원칙, 조직, 프로세스

데이터 거버넌스

구성요소 : 원조프
원칙, 조직, 프로세스

  1. 거버넌스 체계: 데이터 표준화, 관리체계(효율성), 저장소, 표준화 활동(모니터링, 표준개선)

조직 및 인력방안

집기분

  • 집중 구조 : 전담조직 + 중복업무
  • 기능 구조 : 직접 분석
  • 분산 구조 : 현업 부서에 배치
    전 사내에 별도의 분석조직 보유, 분석조직의 인력을 현업부서로 배치하여 분석업무 수행.

조직 및 인력방안 -> 집기분
집중: 독립적인 전담조직, 중복업무 가능성
기능: 해당 부서에서 직접 분석
분산: 분석 조직 인력 현업부서에 배치

분석 프로젝트 관리영역

분석 과제 관리 프로세스

3과목

0개의 댓글