이번엔 머신러닝 교육 주간이다
학부과정에서 수업을 듣긴 했지만 잊은 내용도 있을듯

우선 PTJ 워크플로우

1. 데이터 분석 문제 정의

머신러닝 문제 정의

직관적인 의미

  • 사람이 학습하는 방식과 비슷하게 예시들(데이터)를 통해서 패턴을 찾아내는 방법
  • 컴퓨터에게 데이터를 바라보는 방법(모델)과 예시(데이터)를 주면 판단을 내리는 기준을 찾는 방법
  • 컴퓨터는 숫자(0,1)밖에 이해하비 못하므로, 모든 것은 수학적인 기준에 의해 판단

Problem Definition

Data Preparation

Training + Predict

Regression

회귀의 직관적인 의미

  • 주어진 데이터(X)와 원하는 값(y) 사이의 관계를 찾는 방법 <- 통계
  • 주어진 데이터(X)를 통해서 원하는 값(y = target value)을 예측하는 방법 <- ML
    ex) 부동산 매물 관련된 여러 가지 데이터(X)가 주어졌을 때, 집 값(y)를 예측하는 방법

Classification

분류의 직관적인 의미

  • 주어진 데이터(X)를 원하는 분류 기준(y)대로 나누는 방법
  • 주어진 데이터(X)를 원하는 분류 기준(y = label)을 붙이는 방법
  • 비슷한 특징을 가지는 데이터들을 같은 분류로 나누는 방법
    ex) 강아지 사진 1000장, 고양이 사진 1000장이 주어졌을 때(X), 강아지(=0)/고양이(=1)로(y) 나누는 방법

2. 데이터 수집 및 정제

3. 탐색적 데이터 분석

4. 피쳐 엔지니어링

5. 예측 모델 개발 및 적용

0개의 댓글

관련 채용 정보