Supervised Learning(지도 학습)

supervised learning(지도 학습)은 training data set(훈련 데이터 세트) 내에 label(레이블)이 된 target(타겟) 값이 있다.

classification(분류)이 전형적인 supervised learning(지도 학습) 작업이며,
또 다른 전형적인 작업은 predictor variable(예측 변수)라 부르는 feature(특성)를 사용해 target(타겟) 수치를 예측하는 regression(회귀) 있다.

supervised learning(지도 학습)에서 사용하는 알고리즘은 아래와 같다

  • Linear Regression(선형 회귀)
  • Lasso (L1 Regularization, L1 정규화)
  • Ridge (L2 Regularization, L2 정규화)
  • Logistic Regression(로지스틱 회귀)
  • Support Vector Machines(SVM, 서포트 벡터 머신)
  • Decision Tree(결정 트리), Random Forests(랜덤 포레스트)
  • XGBoost, LightGBM
  • 기타 등등

Unsupervised Learning(비지도학습)

unsupervised learning(비지도 학습)의 경우,
supervised learning(지도 학습)과는 반대로
training data set(훈련 데이터 세트) 내에 label(레이블)이 된 target(타겟) 값이 없다.

그러므로 unsupervised learning(비지도 학습)의 경우 주어진 data set(데이터 세트) 내에서 비슷한 것과 연관 지을 수 있는 clustering(군집)이 있고,
데이터가 어떻게 조직되어 있는지 이해할 수 있고 예상하지 못한 패턴을 발견할 수 있는 visualization(시각화) 알고리즘과
너무 많은 정보를 잃지 않으면서 데이터를 간소화하려는 dimensionality reduction(차원 축소)가 있다.

그 외에도 anomaly detecion(이상치 탐지)와 association rule learning(연관 규칙 학습)이 있다.

unsupervised learning(비지도 학습)에서 사용하는 알고리즘은 아래와 같다.

  • clustering(군집)
    -- K-Means(K-평균)
    -- Hierarchical Cluster Analysis(HCA, 계층 군집 분석)
    -- Expectation Maximization(EM, 기대값 최대화)
  • visualization(시각화)와 dimensionality reduction(차원 축소)
    -- Principal Component Analysis(PCA, 주성분 분석)
    -- kernel PCA(커널 PCA)
    -- Locally-Linear Embedding(LLE, 지역적 선형 임베딩)
  • Association rule learning(연관 규칙 학습)
    -- Apriori(어프라이어리)
    -- Eclat(이클렛)

-출처 : Hands-on Machine Learning

Reinforcement Learning(강화 학습)

Reinforcement Learning(강화 학습)은 매우 다른 종류의 알고리즘입니다.

여기서는 학습하는 시스템을 Agent(에이젠트)라고 부르며 environment(환경)를 관찰해서 action(행동)을 실행하고 그 결과로 reward(보상) or penalty(벌점)를 준다.
시간이 지나면서 가장 큰 보상을 얻기 위해 policy(정책)라고 부르는 최상의 전략을 스스로 학습한다.
policy(정책)는 주어진 상황에서 Agent(에이전트)가 어떤 action(행동)을 선택해야 할지 정의합니다.
-출처 : Hands-on Machine Learning

그 외에도 semisupervised learning(준지도 학습)이 있으며, 이를 제외한 3가지 구분의 차이점을 간단히 서술한다면,
supervised learning(지도 학습)의 경우
predictor variable(예측 변수)라 부르는 feature(특성)를 활용해 목표 target(타켓)을 예측 및 분류하고,
unsupervised learning(비지도 학습)의 경우
주어진 data 안에서 비슷한 것끼리 clustering(군집)시키고,
reinforcement learning(강화 학습)의 경우
Agent(에이전트)가 최고의 reward(보상)을 얻기 위해 스스로 학습하는 것입니다.

profile
ENTJ-A

0개의 댓글