머신러닝/인공지능/지도학습/비지도학습

김홍찬·2023년 1월 25일

학습내용

  • 인공지능이란?

  • 지도학습과 비지도학습에 대한 이해

인공지능이란?

  • AI(Artificial Intelligence)

  • 기계가 사람의 지능을 모방하게 하는 기술

  • 규칙기반

    • 사람이 알고리즘을 생각해서 그 일의 규칙에 맞춰 프로그래밍하는 것
    • 해결하려고 하는 문제에 대한 기반 지식이 필요(전문가의 도움 필요)
    • 전문 지식이 개정되어 바뀌면 그 때마다 작업을 해야하는 문제가 생김
    • 전문가들의 도움을 받아 프로그램을 만들지만 전문가들의 지식이 100%인지 확신할 수 없음
  • 데이터 학습 기반(머신러닝)

    • 학습을 통해서 알고리즘을 스스로 만들게하는 것
    • 알고리즘을 제공받은 데이터로 부터 시스템이 스스로 찾게 하는 것

인공지능의 발전을 가능하게 만든 요소들

  1. 데이터의 급격한 증가
  • IoT 기기, SNS 컨텐츠 등으로 인해 데이터가 폭팔적으로 증가함
    • 전 세계 디지털데이터의 90%가 최근 2년 동안 생성
  1. 알고리즘의 발전
  • 급증한 데이터를 이용해 기존 알고리즘의 개선 및 새로운 알고리즘의 개발
  1. 컴퓨터 하드웨어의 발전
  • CPU와 GPU의 발전
    • GPU의 발전은 딥러닝의 발전으로 이어짐.

머신러닝과 딥러닝

머신러닝

  • 데이터 학습 기반의 인공 지능 분야
  • 기계에게 데이터를 이용해 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야

딥러닝

  • 인공신경망 알고리즘을 기반으로 하는 머신러닝의 한 분야.
  • 비정형데이터에서 뛰어난 성능을 나타낸다.
    • 단, 학습 시킬 많은 양의 데이터가 필요.

머신러닝 모델(알고리즘, 모형)

  • 데이터의 패턴을 수식화 한 함수를 말함.
  • 입력변수와 출력변수간의 패턴을 데이터 학습을 통해 만든다.

모델을 만드는 과정

  1. 모델을 정하여 수식화 한다.
  2. 모델을 데이터를 이용해 학습 시킨다.(Train)
    2-1. 모델을 데이터의 패턴에 맞춘다.(fit)
  3. 학습된 모델이 얼마나 데이터 패턴을 잘 표현하는지 평가한다.(Test)

자주 쓰이는 용어

Feature

  • 추론하기 위한 근거가 되는 값들을 표현하는 용어로, 예측 하거나 분류해야 하는 데이터의 특성, 속성 값을 의미한다.
  • 입력변수(input)라고도 하고 일반적으로 'X'로 표현.

Label

  • 예측하거나 분류해야 하는 값들을 표현하는 용어로, 출력 변수(Output),Target이라고도 한다. 일반적으로 'y'로 표현

Class

  • Label이 범주형일 경우 그 고유값을 Class라고 한다.

데이터 포인트

  • 개별 데이터를 표현하는 용어

머신러닝 알고리즘 분류

지도학습(Supervised Learning)

  • 모델에게 데이터의 특징(Feature)과 정답(Label)을 알려주며 학습시킨다.
  • 대부분 머신러닝이 지도학습이다.
  • 지도학습은 Label에 따라 분류와 회귀로 나뉜다.
    • Label이 범주형 : 분류
      • 두개 이상의 클래스(범주)에서 선택을 묻는 지도 학습방법
    • Label이 연속형 : 회귀
      • 숫자(연속된값)를 예측 하는 지도학습
  • 사실 모든 알고리즘은 분류와 회귀 모두 지원한다.

비지도학습(Unsupervised Learning)

  • 정답이 없이 데이터의 특징만 학습하여 데이터간의 관계를 찾는 학습방법

  • 군집(Clustering)

    • 비슷한 유형의 데이터 그룹을 찾는다. 주로 데이터 경향성을 파악하는 비지도 학습
    • 그룹이 형성되면 왜 형성되었는지 이유를 찾아야 한다.
    • 지도학습을 위한 전처리 단계로 주로 사용했다.
  • 자원축소(Dimensionality Reduction)

    • 예측에 영향을 최대한 주지 않으면서 변수(Feature)를 축소하는 한다.
    • 고차원 데이터를 저차원의 데이터로 변환하는 비지도 학습
profile
바쁘다 바빠

0개의 댓글