랜덤포레스트 in r

9566·2021년 6월 12일

데이터 분석

목록 보기

8/10

랜덤포레스트

rf.model <- randomForest(data.Y~., data=train, ntree=50, mtry = sqrt(변수개수), importance=T)
rf.model #OOB 에러추정치로 낮을수록 분류모델의 성능이 좋다.
plot(rf.model, 'I') #ntree 개수

names(rf.model)
rf.model$importance
importance(rf.model)
order(importance(rf.model)[,MeanDecreaseAccuracy], decreasing=T) 
#중요변수 순으로 정렬
varImpPlot(rf.model) # 변수중요도 그래프

#caret 패키지
pre <- predict(rf.model, test[,-1], type="class")
confusionMatrix(data=pre, reference=test[,1], positive='1') 
#정분류율(Accuracy), 민감도(Sensitivity), 특이도(Specificity)

#ROCR 패키지
pre.roc <- prediction(as.numeric(pre), as.numeric(test[,1]))
plot(performance(pre.roc, "tpr", "fpr"))
abline(a=0, b=1, lty=2, col="black")

performance(pre.roc, "auc")@y.values[[1]]

9566

안녕하세요 안녕안녕하세요 안녕하세요오오오~~

이전 포스트

연관성 분석 in r

다음 포스트

랜덤포레스트 in r

데이터 분석

랜덤포레스트

연관성 분석 in r

앙상블 모형 예측, 성과분석 in r

0개의 댓글