머신러닝은 어원그대로 '기계학습'을 의미한다.
4가지 용어
1. 학습
3가지 학습 방법이 있음
2. 훈련
- 규칙을 찾아 수정하는 과정
- 규칙이란?
- 모델 식에서 가중치와 바이어스(절편)
- 예) 1.5x + 0.1 = y (y가 1 이상이면 다음 날 비가 온다고 예측)
- 위의 식은 훈련 데이터와 규칙의 관계를 수학적 모델링한 결과
- x는 입력, y는 타깃이며 1.5가 가중치, 0.1이 바이어스이다. 즉, 입력과 곱하는 수 = 가중치, 더하는 수 = 바이어스이며 이 둘이 머신러닝에서의 규칙
모델
- 훈련 데이터로 학습된 머신러닝 알고리즘으로 보통 수학식으로 표현
- 훈련의 규칙에서 본 가중치와 바이어스을 합쳐 모델 파라미터라고 부른다.
- 모델 수정 과정에 필요한 손실함수 (loss function)
- 새로운 입력에 대한 모델이 예측한 출력 값이 실제 타깃 값과 다른 경우가 발생할때,
- 모델이 예측한 값과 타깃값의 차이를 계산하는 함수정의를 정의하는데, 이를 손실함수라한다.
- 이때 손실 함수의 최소값을 효율적으로 찾는 방법이 최적화 알고리즘이다.
결론
- 학습 (지도, 비지도, 강화학습) 방법을 선택하고,
- 훈련 데이터를 사용하여 가중치와 바이어스의 규칙을 생성하여 훈련하고,
- 훈련된 알고리즘인 모델을 만들고,
- 만들어진 모델이 정확하지 않으면, 손실 함수를 사용하여 최적화 알고리즘 찾아낸다.