TIL - 250514

AnalytiCode·2025년 5월 14일

태블로

status별로 성별/학력/대륙/연령별로 묶어서 비교해보는데
count로 나타냈던 그래프를 비율로 나타내는게 분석에 효율적이다.

그룹간 전환경향을 비교하기엔 비율로 나타내면 규모차이가 얼마나 나는지 알 수 있다.

ADSP

분석 기획 방향성 도출

  • 분석 대상과 방법
    문제 알 / 못
    최적화, 통찰
    솔루션, 발견

방법 알 / 못

분석 방법론

KDD 분석 방법론

Knowledge Discovery in Databases
데이터베이스로부터 지식(Insight)을 발견하는 과정
그냥 “데이터 분석 과정”을 정형화한 초기 프레임워크

crisp-DM

업데데이트모델평가전
업무 이해 - 데이터 이해 - 데이터 준비 - 모델링(테스트 계획 설계, 모델 작성 및 평가) - 평가(분석결과, 모델링과정, 모델 적용성) - 위대한실패 - 전개

빅데이터 분석 방법론

  • PPADD(분석기획 - 데이터준비 - 데이터 분석 - 시스템 구현 - 평가및 전개)
  • 분석기획에서 SOW(프로젝트 범위 정의서, 프로젝트에 참여하는 관계자들의 이해를 일치, 핵심목표 정의.), 위험계획 수립 : 회전완수
    회피, 전이, 완화, 수용
    범위설정 - 프로젝트 정의/계획 수립 - 위험계획 수립

분석 과제 발굴

하향식

문제 주어지고 해답찾기.
문제탐색- 문제정의 - 해결방안 - 타당성 검토

  • 문제탐색 - 비즈니스 모델 캔버스 단순화
    지원인프라 업무 중에 고객이 제품을 규제와 감사 했다
  • 해결방안: 기존 시스템 활용, 시스템 고도화(분석역량확보), 전문업체 아웃소싱, 교육 및 채용을 통한 전문 인력
  • 관점: 거시적, 경쟁자, 시장 니즈

상향식

문제 정의가 어려울때 사물 인식(what 관점)
프로포타이핑
비지도 학습

지도 vs 비지도

  • 지도(하향): 분류, 회귀, 의사결정트리, KNN(K-Nearest Neighbors, 클래스 예측), SVM(Support Vector Machine, 분리하는 초평면 찾기)
  • 비지도(상향):군집, 차원축소, 연관규칙

분석프로젝트 관리 방안

  • 분석과제 고려 5요소
    데이터크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도/정밀도

  • 프로젝트 관리지식 10
    이범통이 의자에서 시원한 조리품을 먹었다.
    이해관계자, 범위, 통합, 의사소통, 인적자원, 시간, 원가, 조달(아웃소싱), 리스크, 품질

분석 마스터 플랜

마스터 플랜 수립

  • 프로젝트 우선순위(ROI, 과제에 들어가는 비용 대비, 얼마나 가치(수익, 효율성, 성과 등)를 창출할 수 있는가)
  1. 시급성: 비즈니스 효과 - value, 전략적 중요도 + 목표가치
  2. 난이도(데이터, 분석): 투자비용 요소 - volume(양), variety(다양성), velocity(속도)/ 데이터 획득/저장/가공 비용, 분석 적용 비용, 분석 수준

현재쉬움 - 난이도면 현재어려움 / 시급이면 미래쉬움 - 미래 어려움

분석 거버넌스 체계 수립

데이터에 대한 통제 권한과 책임을 정하고, 이를 체계적으로 관리하는 활동
우리 조직의 데이터를 누가, 언제, 어떻게, 왜 관리하고 사용하는지 정하는 룰과 시스템

  • 구성요소
    시조프로마인드데
    시스템, 조직, 프로세스, 마인드, 데이터

  • 분석 성숙도(CMMI, Capability Maturity Model Integration)모델 기반
    도활확최: 도입 - 활용 - 확산(전사 차원 관리, 공유) - 최적화
    최적화: 분석을 진화시키고 혁신 및 성과향상에 기여

  • 데이터 분석 성숙도 모델(성숙도/준비도)
    도준정확
    도입형 준비형 정착형 확산형

  • 분석 지원 인프라 방안
    확장성을 고려한 플랫폼 구조(중앙집중적 관리)
    구성요소

  1. 광의의 분석: 분석관련 서비스 제공엔진, 어플리케이션, api, 하드웨어
  2. 협의의 분석: 데이터 처리 프레임워크, 분석엔진, 분석 라이브러리
  • 데이터 거버넌스
  1. 구성요소: 원조프
    원칙, 조직, 프로세스
  2. 거버넌스 체계: 데이터 표준화, 관리체계(효율성), 저장소, 표준화 활동(모니터링, 표준개선)
  • 조직 및 인력방안 -> 집기분
  1. 집중: 독립적인 전담조직, 중복업무 가능성
  2. 기능: 해당 부서에서 직접 분석
  3. 분산: 분석 조직 인력 현업부서에 배치

1과목

DIKW 피라미드

예시도 알기!!

  • data, information, knowledge, wisdom

빅데이터 위기요인과 그에 따른 통제방안

정형/반정형/비정형

  • 정형: 표
  • 반정형: html, json..
  • 비정형: SNS, 유튜브, 이미지, 텍스트

패지요

메타데이터 Vs 스키마

  • 메타데이터: 다른 데이터를 설명하는 데이터

SCM 3p

anffb, dbxhddjqcpdml guqfurdmf qkxkddmfh

데이터의 가치측정

인공지능과는 상관없다

0개의 댓글