Github : https://github.com/pilsung-kang/Business-Analytics-ITS504-
Youtube : https://www.youtube.com/watch?v=_ZQraxlhfNE&list=PLetSlH8YjIfXMOuS4piqzJRvSZorDnNUm
1. 빅데이터 분석 개요 및 주요 개념
-
데이터 기반 의사결정의 정의
- 세(네) 가지 유형의 Analytics : Descriptive + Diagnostic(뭐가 왜 발생했나?), Predictive(뭐가 발생할 것인가?), Prescriptive Analytics(그래서 뭘 하면 좋은가?)
- 알고리즘도 중요하지만 그 전에 먼저 제대로 된 데이터를 수집하자.
-
데이터 과학의 정의
- 다양한 학제간 학문이 융합되어 데이터 기반 의사결정 및 문제 해결을 목적으로 하는 학문 (3요소 : CS/IT, 수학/통계학, 도메인 지식)
- 데이터 과학은 귀납적이다.
-
데이터 과학의 주요 개념들
- 빅데이터 : 일반적인 데이터베이스 SW가 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 or 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 (4V - 방대한 양(volume), 빠른 데이터 생성 및 처리 속도(velocity), 다양한 형태(variety), 데이터에 내재된 잠재 가치(value))
- 데이터 마이닝 : 대량의 데이터로부터 의미있는 규칙이나 패턴을 추출하는 일련의 활동
- 기계 학습 : 특정한 과업을 달성하기 위해 경험이 축적될수록 과업 수행의 성능이 향상되는 컴퓨터 프로그램 또는 에이전트를 개발하는 것
- 인공지능 : 환경을 인지하여 보상이 최대화되는 지능적인 행위를 할 수 있는 컴퓨터 소프트웨어
AI(인공지능) > 기계학습(머신러닝) > 딥러닝
- 사물 인터넷 : 센서 및 소프트웨어가 내장된 물리적 개체들이 연결되어 각 개체들간의 통신, 데이터 교환, 컨트롤 등을 지원하는 네트워크 체계. 4차 산업 혁명과 스마트 공장의 핵심 구성 요소
2. 데이터 과학 프로젝트 절차
3. 기계 학습 방법론