Machine Learning

우야·2021년 5월 14일
0

머신러닝은 어원그대로 '기계학습'을 의미한다.

4가지 용어

  • 학습, 훈련, 규칙, 모델

1. 학습

3가지 학습 방법이 있음

  • 지도 학습 (supervised learning), 비지도 학습 (unsupervised learning), 강화 학습 (reinforcement learning)

    입력 : 모델이 풀어야할 문제
     타깃 : 모델이 맞춰야할 정답
     훈련 데이터 : 모델을 만들기 위한 입력,타깃 데이터 
     모델 : 훈련된 알고리즘 결과물 (좋은 훈련데이터가 많아야 모델이 잘만들어짐)
    • 지도 학습 (supervised learning)
      • 입력과 타깃으로 구성된 훈련데이터로 모델을 훈련
      • 활용 : 내일의 날씨 예측, 스팸 메일 분류
    • 비지도 학습 (unsupervised learning)
      • 타깃이 없는 훈련 데이터를 사용
      • 활용 : 패턴, 군집(clustering)같은 그룹을 구성 (결과를 평가 하기 어려움)
    • 강화 학습 (reinforcement learning)
      • 머신러닝 알고리즘으로 에이전트를 훈련으로 에이전트의 수행에 따라 보상을 준다.
      • 최대 보상을 받는 것이 목표로, 에이전트는 주어진 환경에서 아주 많은 수행을 하며 학습
      • 활용 : 드론, 비디오 게임, 알파고

2. 훈련

  • 규칙을 찾아 수정하는 과정
  • 규칙이란?
    • 모델 식에서 가중치와 바이어스(절편)
    • 예) 1.5x + 0.1 = y (y가 1 이상이면 다음 날 비가 온다고 예측)
      • 위의 식은 훈련 데이터와 규칙의 관계를 수학적 모델링한 결과
      • x는 입력, y는 타깃이며 1.5가 가중치, 0.1이 바이어스이다. 즉, 입력과 곱하는 수 = 가중치, 더하는 수 = 바이어스이며 이 둘이 머신러닝에서의 규칙

모델

  • 훈련 데이터로 학습된 머신러닝 알고리즘으로 보통 수학식으로 표현
  • 훈련의 규칙에서 본 가중치와 바이어스을 합쳐 모델 파라미터라고 부른다.
  • 모델 수정 과정에 필요한 손실함수 (loss function)
    • 새로운 입력에 대한 모델이 예측한 출력 값이 실제 타깃 값과 다른 경우가 발생할때,
      • 모델이 예측한 값과 타깃값의 차이를 계산하는 함수정의를 정의하는데, 이를 손실함수라한다.
      • 이때 손실 함수의 최소값을 효율적으로 찾는 방법이 최적화 알고리즘이다.

결론

  1. 학습 (지도, 비지도, 강화학습) 방법을 선택하고,
  2. 훈련 데이터를 사용하여 가중치와 바이어스의 규칙을 생성하여 훈련하고,
  3. 훈련된 알고리즘인 모델을 만들고,
  4. 만들어진 모델이 정확하지 않으면, 손실 함수를 사용하여 최적화 알고리즘 찾아낸다.
profile
Fullstack developer

0개의 댓글