[AI] 지도 학습, Supervised Learning

우주·2025년 4월 5일

AI 중심세상

목록 보기
5/8

지도 학습 (Supervised Learning) 이란?

입력 데이터에 올바른 출력값(정답 라벨)을 부여한 후,
컴퓨터가 이를 학습하여 입력과 출력 간의 일반적인 규칙(모델)을 만들어내는 방식이다.

예) 여러 장의 이미지에 ‘개’라는 라벨을 부여한 뒤,
컴퓨터가 해당 이미지를 '개'로 인식할 수 있도록 학습시키는 방식이다.
학습 이후 새로운 이미지가 입력되면, 컴퓨터는 스스로 그것이 '개'인지 판단할 수 있게 된다.


지도 학습 과정


1.  훈련에 사용될 데이터 준비

      -  데이터 수집 후 라벨링 수행

2.  학습

      -  라벨링된 데이터를 컴퓨터에게 학습시킴

3.  모델 생성

      -  반복 학습을 통해 입력과 출력 간의 관계를 일반화한 모델 생성

4.  입력

      -  새로운 데이터를 모델에 입력

5.  예측

      -  모델은 학습한 내용을 바탕으로 새로운 데이터를 분류 및 예측


대표 알고리즘

  • 로지스틱 회귀 (Logistic Regression)
    이진 분류나 다중 분류 문제에서 자주 사용되는 대표적인 선형 모델

  • 의사결정나무 (Decision Tree)
    트리 형태로 의사결정을 따라가며 분류 또는 회귀를 수행

  • 서포트 벡터 머신 (SVM)
    분류 경계를 최적화하여 데이터를 구분하는 모델

  • K-최근접 이웃 (K-NN)
    가장 가까운 K개의 데이터와 유사한 클래스로 분류하는 방식


지도 학습 활용 사례

  • 스팸 메일 필터링
    이메일 본문을 보고 스팸/정상 여부를 예측

  • 의료 진단 모델
    환자의 증상 데이터를 기반으로 질병 여부를 분류

  • 자율주행 차량의 신호등 인식
    이미지 데이터를 통해 신호등 색상을 판별하여 주행 판단

  • 뉴스 주제 분류
    기사에 라벨이 붙어 있을 경우, 새로운 기사를 분류하는 데 사용


지도 학습 vs 비지도 학습 비교

항목지도 학습 (Supervised)비지도 학습 (Unsupervised)
데이터정답(라벨)이 있는 데이터라벨이 없는 데이터
목적예측, 분류구조 탐색, 군집화
대표 알고리즘SVM, Decision Tree, K-NN, Logistic 등K-Means, DBSCAN, PCA 등
예시스팸 분류, 질병 진단, 이미지 분류고객 세분화, 이상 탐지, 주제 군집화

한줄 정리

지도학습(Supervised Learning)은 말 그대로 라벨링된 데이터를 기반으로 모델을 학습시키는 방식이다.
정답이 포함된 여러 개의 데이터를 통해 학습한 모델은, 이후 새로운 데이터를 입력받았을 때 해당 결과를 예측하거나 분석할 수 있다.

profile
신우주

0개의 댓글