내가 모르는거 위주로 정리함
암묵지, 형식지 간 상호작용
1) 공통화: 암묵지를 다른 사람에게 알려줌
2) 표출화: 암묵지 지식을 메뉴얼/문서로 전환
3) 연결화: 교재, 메뉴얼에 새로운 지식 추가
4) 내면화: 교재, 메뉴얼에서 다른 사람의 암묵지를 터득
기업 활용 데이터베이스
빅데이터 3V
주요 분석기법
위기 요인과 통제 방안
1) 사생활 침해 -> 제공자에서 사용자 책임으로 전환
2) 책임 원칙 훼손(범죄를 예측해서 체포) -> 결과에 대해서만 책임
3) 데이터의 오용 -> 알고리즈미스트 필요
데이터 사이언티스트의 필요 역량
1) 하드 스킬: 이론, 코오딩 등등..
2) 소프트 스킬: 스토리텔링, 리더십, 창의력, 호기심, 논리적 비판, 비주얼라이제이션, 커뮤니케이션 등등..
빅데이터 가치 패러다임의 변화
1) Digitalization(디지털화)
2) Connection(연결)
3) Agency(관리)
| 대상 O | 대상 X | |
|---|---|---|
| 방법 O | 최적화 | 통찰 |
| 방법 X | 솔루션 | 발견 |
빅데이터 분석 방법론
하향식 접근 방법
분석 과제에서 고려해야 할 5가지 요소
데이터 분석 프로젝트의 우선순위 선정 기준
데이터 분석 수준 진단
분석 준비도
분석 성숙도
| 단계 | 도입 | 활용 | 확산 | 최적화 |
|---|---|---|---|---|
| 비즈니스 부문 | - 실적 분석 및 통계 -정기 보고 수행 - 운영 데이터 기반 | -미래결과 예측 - 시뮬레이션 - 운영 데이터 기반 | - 전사성과 실시간 분석 - 프로세스 혁신 - 분석규칙/이벤트 관리 | - 외부환경 분석 활용 - 최적화 업무 적용 - 실시간 분석 - 비즈니스 모델 진화 |
| 조직 및 역량 부문 | - 일부 부서에서 수행 - 담당자 역량에 의존 | - 전문담당부서 수행 - 분석 기법 도입 - 관리자가 분석 수행 | - 전사 모든 부서 수행 - 분석 COE 운영 - 데이터사이언티스트 확보 | - 데이터 사이언스 그룹 - 경영진 분석 활용 - 전략 연계 |
| IT 부문 | - 데이터 웨어하우스 - 데이터 마트 - ETL/EAI - OLAP | - 실시간 대시보드 - 통계분석 환경 | - 빅데이터 관리 환경 - 시뮬레이션/최적화 - 비주얼 분석 - 분석 전용 서버 | - 분석 협업 환경 - 분석 샌드박스 - 프로세스 내재화 - 빅데이터 분석 |
확률적 표본 추출 방법
비확률적 표본 추출 방법
공분신과 독립성의 관계
왜도

가설검정
로지스틱 회귀
상관분석
시계열 분석
정상성
모형
1) 자기회귀AR(p)
분해시계열: 시계열에 영향을 주는 일반적 요인을 시계열에서 분리해 분석하는 방법
분류모델 평가지표

F-1 score