DATA로부터 내재된 패턴을 학습하는 과정
출력이 연속 변수인지 이산변수인지에 따라서 구분
sl 머신러닝은 model output과 정답과의 차이인 error를 통해서 그 error를 줄여가면서 학습이 진행
feature selection, model selection, optimization 과정을 거치게 된다.
머신러닝은 그 자체로 data의 결핍으로 인한 불확실성을 포함하고 있다.
에러는 각 샘플 별로 pointwise로 계산
label에서 y는 정답
대표적인 에러셋은 squared error
- model 출력과 정답과의 차이를 제곱하여 계산
binary error
- 내부의 logic을 판별하여 맞으면 0 틀리면 1인 함수
data sample에서 발생하는 모든 sample들의 pointwise error를 합쳐서 overall error를 계산 : loss function & cost function
model을 주어진 data set에 맞추어 학습하는데 사용하는 error
전체 data set에서 일부 sample을 따로 빼서 test sample을 정의
이 sample에서 나타나는 error가 E test