[고려대DSBA|Business Analytics]Introduction - Business Analytics

Joo·2024년 1월 11일
0

Data Analytics 101

목록 보기
1/15

Github : https://github.com/pilsung-kang/Business-Analytics-ITS504-
Youtube : https://www.youtube.com/watch?v=_ZQraxlhfNE&list=PLetSlH8YjIfXMOuS4piqzJRvSZorDnNUm


1. 빅데이터 분석 개요 및 주요 개념

  • 데이터 기반 의사결정의 정의

    • 세(네) 가지 유형의 Analytics : Descriptive + Diagnostic(뭐가 왜 발생했나?), Predictive(뭐가 발생할 것인가?), Prescriptive Analytics(그래서 뭘 하면 좋은가?)
    • 알고리즘도 중요하지만 그 전에 먼저 제대로 된 데이터를 수집하자.
  • 데이터 과학의 정의

    • 다양한 학제간 학문이 융합되어 데이터 기반 의사결정 및 문제 해결을 목적으로 하는 학문 (3요소 : CS/IT, 수학/통계학, 도메인 지식)
    • 데이터 과학은 귀납적이다.
  • 데이터 과학의 주요 개념들

    • 빅데이터 : 일반적인 데이터베이스 SW가 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 or 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 (4V - 방대한 양(volume), 빠른 데이터 생성 및 처리 속도(velocity), 다양한 형태(variety), 데이터에 내재된 잠재 가치(value))
    • 데이터 마이닝 : 대량의 데이터로부터 의미있는 규칙이나 패턴을 추출하는 일련의 활동
    • 기계 학습 : 특정한 과업을 달성하기 위해 경험이 축적될수록 과업 수행의 성능이 향상되는 컴퓨터 프로그램 또는 에이전트를 개발하는 것
    • 인공지능 : 환경을 인지하여 보상이 최대화되는 지능적인 행위를 할 수 있는 컴퓨터 소프트웨어

      AI(인공지능) > 기계학습(머신러닝) > 딥러닝

    • 사물 인터넷 : 센서 및 소프트웨어가 내장된 물리적 개체들이 연결되어 각 개체들간의 통신, 데이터 교환, 컨트롤 등을 지원하는 네트워크 체계. 4차 산업 혁명과 스마트 공장의 핵심 구성 요소

2. 데이터 과학 프로젝트 절차

3. 기계 학습 방법론

  • 구분 기준 1: 타겟(정답)의 유무에 따른 구분

    • 지도 학습 : 입출력 변수가 정해져 있고 둘 사이의 관계를 규명하는 것을 주목적으로 하는 학습
    • 비지도 학습 : 출력 변수가 없는 데이터의 특질이나 특성을 파악하는 것을 주목적으로 하는 학습
  • 구분 기준 2: 학습 목적에 따른 구분

    • 분류 : 명목형(범주형) 변수를 예측하는 방법론
    • 회귀 : 연속형 변수를 예측하는 방법론
    • 군집화 : 유사한 개체들의 집단을 판별하는 방법론 (예, K-means clustering, 계층적 군집화 등)
    • 이상치 탐지 : 대부분이 정상 데이터인 상황에서 매우 낮은 확률로 발생하는 이상치 데이터를 탐지하는 방법론
      • 일반화 : 주어진 데이터로부터 정상 범주의 개념을 확장해 가는 것
      • 특수화 : 주어진 데이터로부터 정상 범주의 개념을 좁혀가는 것
      • 일반화에 치중할 경우, 이상치 데이터 판별이 어렵게 되며, 특수화에 치중할 경우, 과적합의 위험(빈번한 false alarm)에 빠질 수 있음
  • 구분 기준 3: 사용 데이터에 따른 구분

    • 정형 데이터(Structured Data) : 기존 방식으로 테이블에 적재된 수치 데이터
    • 비정형 데이터(Unstructured Data) : 이미지, 음성, 텍스트 등 숫자가 아닌 형태의 정보가 구조화되지 않은 형태로 존재하는 데이터
  • 구분 기준 4: 학습 목적과 모델 업데이트 방식에 따른 구분

    • Static Learning
    • Incremental (online) Learning - ANN
    • Reinforcement Learning
profile
적당히 공부한 거 정리하는 곳

0개의 댓글