[Machine Learning] 머신러닝이란?

이정은·2021년 10월 3일
1
post-custom-banner

머신 러닝이란?

  • 컴퓨터를 인간처럼 학습시킴으로써 인간의 도움 없이 컴퓨터가 스스로 새로운 규칙을 생성할 수 있지 않을까?로 부터 시작 되었습니다.

  • 기계를 어떻게 가르칠 것인가에 따라 크게 세가지로 나눠서 생각할 수 있습니다.

    • Supervised Learning(지도 학습)
    • Unsupervised Learning(비지도 학습)
    • Reinforcement Learning(강화 학습)

Supervised Learning(지도 학습)

  • 간단히 말해 여러 문제를 답과 같이 학습함으로써 미지의 문제에 대한 올바른 답을 예측하고자 하는 방법이다. 따라서 학습데이터에는 문제와 함께 정답까지 알고있어야 한다.

  • 지도학습을 위한 모델은 크게 Classification(분류)모델과 Prediction(예측)모델로 구분된다.

    • Classification(분류) : 연속적이지 않은 값, 즉 '무엇'을 예측
      사용하는 알고리즘에 따라 KNN(K Nearest Neighbor), SVM(Support Vector Machine), Decision trees(의사결정 트리)등으로 구분 된다.
    • Prediction(예측) : 연속된 값, 즉 '얼마나'을 예측
      Regression(회귀)모델이 대표적으로 사용되고 있다.

    => 분류모델은 학습데이터의 레이블(답)중 하나가 결과값이 되며, 예측 모델은 학습데이터에서 도출된 함수식에서 계산된 임의의 값이 결과값이 된다.

    Classification

    • 레이블(정답)이 이산적인 경우로 숫자 인식, 번호판 인식, 스팸메일 구분등 정답이 가질 수 있는 값이 유한한 경우이다.

    Regression

    • 레이블(정답)이 실수인 경우로 특성들을 바탕으로 구분선을 찾아내는 방법
    • 데이터들을 쭉 뿌려놓고 이를 가장 잘 설명하는 직선 또는 이차함수 곡선을 그리고 싶을때 회귀 기능을 사용한다.
    • 선형회귀 기법이 가장 대표적이며 회귀 분석에서 종속변수란 결과값을 가리키며, 독립변수란 이러한 결과값에 영향을 주는 입력값(특성)들을 가리킨다.
      - Simple Linear Regression Analysis(단순 선형 회귀 분석) : 하나의 종속 변수, 하나의 독립변수 사이의 관계 분석
      - Multiple Linear Regression Analysis(다중 선형 회귀 분석) : 하나의 종속 변수, 여러개의 독립변수 사이의 관계 분석

Unsupervised Learning(비지도 학습)

  • 레이블(정답)이 정해져 있지 않은 데이터들을 기반으로 데이터의 고유한 구조나 패턴을 익히는 학습이다.
    - Clustering(군집화) : 대표적인 비지도 학습으로 데이터에서 패턴과 구조를 찾아 그룹을 지어준다.

Reinforced Learning(강화 학습)

  • 시행착오를 통해 학습하는 방법 중 하나로 실수와 보상을 통해 학습을 하여 목표를 찾아가는 알고리즘이다.
profile
성장하는 개발자_💻
post-custom-banner

0개의 댓글