[AI] MACHINE LEARNING

Ik·2022년 7월 18일
0

Data

목록 보기
2/34

MACHINE LEARNING

  • 간단한 패턴의 알고리즘을 시작으로 데이터를 이용해 계속해서 학습하면서 데이터의 규칙을 설명할 수 있는 적절한 모델을 만드는 것
  • 데이터의 패턴(input, output의 관계성)을 정의할 수 있는 함수를 만드는 것
  • Data와 Model로 구성되어 있다

Model

  • 데이터의 패턴을 수식화 한 함수
    • 초기에는 방대한 데이터의 패턴을 알 수 없기 때문에 데이터의 패턴을 가정한 함수를 정한 뒤 데이터를 학습시켜 데이터 패턴을 잘 표현하는 함수를 만듬
  • 알고리즘, 모형이라고도 부름

모델을 만드는 과정(간략)

  1. 모델을 정하여 수식화
  2. Train, fit
    • 데이터를 이용해 모델을 학습하며 데이터의 패턴(input, output data의 관계성)에 맞춤
  3. Test
    • 학습된 모델이 데이터 패턴을 표현하는 정도 평가

결과적으로 input, output data의 관계성을 정의할 수 있는 함수(=모델)를 만드는 것이 최종 목표

==> Data의 패턴을 잘 표현할 수 있을수록 좋은 모델



Data

Feature

  • input으로 추론하기 위한 근거가 되는 값(데이터의 특성, 속성값)들

Label

  • output으로 예측하거나 분류해야하는 값
    • Class : Label이 범주형일 경우 그 구성 고유값들 지칭
  • Data point
    - 개별 데이터를 표현하는 용어



학습 종류

Supervised Learning : 지도학습

  • 모델에게 데이터의 Feature와 Label을 알려주어 학습
  • 종류
  • Classification : 분류
    • 2개 이상의 클래스에서 선택을 묻는 지도 학습방법(2중 or 다중분류)
  • Regression : 회귀
    • 연속된 값을 예측하는 지도학습

Unsupervised Learning : 비지도학습

  • 정답이 없어 데이터의 특징만 학습하여 데이터간의 관계를 찾는 학습방법
  • 군집(Clustering)
    • 비슷한 유형의 데이터의 그룹을 찾아 경향성을 파악
  • 차원축소(Dimensionality Reduction)
    • 예측에 영향을 주지 않으면서 Feature를 축소
    • 고차원 데이터를 저차원 데이터로 변환

강화학습

  • 학습하는 시스템이 행동을 실행하고 그 결과에 따른 보상이나 벌점을 받는 방식으로 학습. 학습이 계속되면서 가장 큰 보상을 얻기 위한 최상의 전략을 스스로 학습
  • ex) Alphago



Machine Learning Process

  1. Business Understanding
    • 개발을 통해 얻고자 하는 것 파악
  2. Data Understanding
    • 데이터 수집 및 탐색
  3. Data Preparation
    • 데이터 전처리
  4. Modeling
    • 모델 선정 및 학습
  5. Evaluation
    • 모델 예측 및 평가, 수정 반복
  6. Deployment
    • 실제 업무에 적용



Package

Scikit-learn

  • 딥러닝을 제외한 머신러닝 주요 알고리즘 제공
  • 개발 패턴
    • 데이터 분할 : 훈련 데이터, 테스트 데이터로 분리
    • 모델 생성 : 예측 목적에 맞는 모델 생성, 하이퍼 파라미터 설정
    • 모델 학습 : fit
    • 예측 : predict, predict_prob, transform
    • 평가 : 모델 성능평가(정확도 AUC, R2, MSE 등), 목적에 맞는 함수 사용해 결과 확인

Tensorflow

  • 구글 브레인 팀이 개발한 텐서플로우는 머신러닝 및 딥러닝 위한 오픈소스 라이브러리

Keras

  • 딥러닝 모델을 쉽게 만들 수 있도록 다양한 딥러닝 플랫폼 위에서 실행되는 고수준 딥러닝 패키지.
  • Tensorflow가 어려워 더 쉽게 사용 목적으로 만들어짐
    • Tensorflow 2.0 부터 keras를 포함
    • 이후에 Tensorflow에 lib형태로 포함

Pytorch

  • 토치(Torch) 및 카페2(Caffe2) 프레임워크를 기반으로한 페이스북에서 만든 딥러닝 프레임워크

0개의 댓글