Dataset : 기록들의 집합Instance & Sample : 하나의 기록 자체Attribute & Feature : 기록의 성질을 반영하는 것Attribute Value : 속성에 관하여 취할 수 있는 값Attribute Space & Sample Space :
오차율(Error Rate) : 전체 샘플 수와 잘못 분류한 샘플 수의 비율, $m$개의 샘플 중 $a$개의 샘플이 잘못 분류되었다면 오차율 $E = a/m$정밀도(Accuracy) : '1-오차율', $1-a/m$우리가 원하는 학습기는 새로운 샘플 데이터를 대상으로
$d$개의 속성을 가지는 샘플 $x = (x_1; x_2; x_3; ... x_d)$이 있고, $x_i$는 $x$의 $i$번째 속성을 가지는 값이라고 가정한다면, Linear Model은 속성들의 선형 조합을 통해 예측하는 함수를 학습하는 모델이라고 정의 가능함.$$f
Decision Tree는 분류 또는 회귀 모두 가능한 지도 학습 모델 중 하나임. 일반적으로 의사결정나무는 하나의 Root Node, 여러개의 Internal Node, 그리고 여러개의 Leaf Node 또는 Terminal Node를 포함.Leaf Node의 경우
💡 신경망이란?"적응성이 있는 단순 단위로 구성된 광범위하고 서로 연결된 네트워크다. 이 조직은 현실 세계 사물에 대한 생물 신경계통의 상호작용을 모방할 수 있다.Kohonen, 1988"신경망에서 가장 기초가 되는 성분은 뉴런(Neuron) 모델입니다. 위 정의에서