전체 데이터를 다 제공하지는 않는다.
평가데이터 : 문제와 검증용 데이터로 컴퓨터에거 문제(키, 체중)를 주고
답(성별)을 추론하도록 시킨 다음 가지고 있는 정답과, 컴퓨터가 추론한 결과를 비교해서 우수성을 체크합니다.
자료 제공은 정답과 문제의 비율은 7:3 / 6:4로 제공
평균에서 튀는 데이터 : 아웃라이어(이상치)
과적합 : 특정 상황에서만 적합 / 일반적 상황에서는 오류가 나타나는 추론. 보통 80~90퍼센트 일치하면 좋은 알고리즘으로 판단