인공지능 개요 인공지능 (AI - Artificial Intelligence) 이란 지능이란? 지능: 어떤 문제를 해결하기 위한 지적 활동 능력 인공지능 기계가 사람의 지능을 모방하게 하는 기술 규칙기반, 데이터 학습 기반 정의 다트머스대학 수
Train 데이터셋 (훈련/학습 데이터셋)모델을 학습시킬 때 사용할 데이터셋.Validation 데이터셋 (검증 데이터셋)모델의 성능 중간 검증을 위한 데이터셋Test 데이터셋 (평가 데이터셋)모델의 성능을 최종적으로 측정하기 위한 데이터셋Test 데이터셋은 마지막에
Raw Data을 학습하기 전에 변경하는 작업Garbage in, Garbage out.좋은 train dataset으로 학습 해야 좋은 예측 결과를 만드는 모델을 학습할 수 있다.좋은 train dataset을 만드는 것은 모델의 성능에 가장 큰 영향을 준다.목적에
지도 학습 학습 대상이 되는 데이터에 정답을 붙여서 학습 시키고, 모델을 얻어서 완전히 새로운 데이터에 모델을 사용해서 "답"을 얻고자 하는 것 결정나무 모델이 어떻게 데이터를 분류했는지 확인하는 과정 from mlxtend.plotting import pl
PipelineJupyter Notebook 상황에서 데이터의 전처리와 여러 알고리즘의 반복 실행, 하이퍼 파라미터의 튜닝 과정을 번갈아 하다 보면 코드의 실행 순서에 혼돈이 올 수 있다. class로 만들어서 진행해도 되지만, sklearn 유저에게는 pipeline
교차검증 과적합 : 모델이 학습 데이터에만 과도하게 최적화된 현상 그로 인해서 일반회된 데이터에서 예측 성능이 과하게 떨어지는 현상 simple example 다시 와인 데이터 확인하기 위의 데이터를 통해서 교차 검증 시작 KFoldKFold는 index를 반환한다.
앙상블 학습을 통한 분류 : 여러 개의 분류기를 생성하고 그 예측을 결합하여 정확한 최종 예측을 기대하는 기법다양한 분류기의 예측 결과를 결합함으로써 단일 분류기보다 신뢰성이 높은 예측 값을 얻는 것 현재 정형데이터를 대상으로 하는 분류기에서는 앙상블 기법이 뛰어난 성