220617 AIPM과정 D068
대구 AI 스쿨 시작한지 68일차
분석 목표와 목적을 고려
데이터의 종류와 특성을 고려
데이터 분석의 목적
변수 속에서 관측치 간의 차이를 확인하는 것
변수 간의 관계를 확인하는 것
차이와 관계를 확인하고 설명하는 것
데이터 분석의 과정
숫자와 그래프로 차이를 확인
모형으로 차이를 설명
분석의 배경, 목적, 예상 결과를 명확히 규정
분석에 대한 가설을 구체적으로 서술
정의한 내용에 대해 이슈 관계자와 합의
내부데이터
사내 데이터 베이스, 기존 연구 데이터 등
직접 수집한 데이터
실험 결과, 설문/리서치 결과
외부데이터
정부 기관이 보유한 공공데이터
일부 업체가 공개한 민간데이터
부분 데이터 선택
결측값(Missing Value)의 처리
변수 결합, 분해 및 파생 변수 생성
미리 설정한 가설을 확인
추정과 검정
일반적인 연구의 데이터 분석 방법
변수와 변수간의 관계, 데이터 자체의 특성을 확인
간단한 시술 통계량 계산/다양한 그래프 활용
모든 데이터 분석의 시작단계에서 필수적 과정
log data 기반 데이터 정보를 인식 가능한 수준으로 요약
정해진 알고리즘/데이터 속 변수와 관측치 간의 관계 확인
가능성을 수치화한 확률
출처: 윤상혁 교수님 특강