# Randomforest

[ML] RandomForest
Decision Tree데이터에 있는 규칙을 학습을 통해 자동으로 찾아내 트리 기반의 분류 규칙을 만드는 알고리즘(쉽게 이해하려면 if-else문을 자동으로 찾아내 예측 위한 규칙을 만드는 알고리즘)구조루트노드 : 시작점리프노드 : 분류 클래스의 총 개수규칙노드(=내부
랜덤포레스트
배깅과 부스팅보다 더 많은 무작위성을 주어 약한 학습기들을 생성한 후 이를 선형결합하여 최종 학습기를 만드는 방법정확도 : 0.8947368421052632\[102 5]정확도 89.47%정밀도 91.07%재현율 79.69%

[kaggle] - 자전거 대여 수요 예측
Intro 캐글의 플레이그라운드 대회 'Bike Sharing Demand' compeition에 참가해 간단한 회귀 모델을 연습해보았다. 워싱턴 DC의 Capital bikeshare 프로그램에서 과거 사용 기록과 날씨 데이터를 결합해 향후 자전거 대여 수요를 예측하

Bagging
bootstrap aggregating주어진 데이터로부터 랜덤하게 여러 개의 부트스트랩 데이터를 모델링한 후 결합하여 최종의 예측 모델을 생성하는 앙상블 기법 중 하나 각 모델별 임의의 데이터 세트 생성 시 기존 데이터 세트에서 중복을 허용한 채로 무작위 N개를 선택

머신러닝 -Regression
데이터 구성 데이터셋 로드 Outcome별 Insulin 학습, 예측해야 할 값 학습, 예측에 사용할 컬럼 학습, 예측 데이터셋 만들기 머신러닝 알고리즘 학습 cross validation 학습 세트의 오차 측정 crossvalpredict 함수 예시

GTSRB(교통표지판 분류 문제)에 대한 분류기 비교
목적 : 교통 표지판 이미지 데이터를 이용하여 여러 분류 모델을 구현하고 분류기별 성능 비교과정 : 대량의 이미지 데이터를 전처리 - support vector machine, random forest, cnn 세 모델의 성능 차이 확인 \- 캐글에서 제공하는 교통표지
[1일차]학습 셀프 모니터링 프로젝트 by cpu
SelfStudyMonitor 1주일 1프로젝트의 첫번째 프로젝트이자 학습 현황을 모니터링하는 프로젝트 최종 기능 웹캠으로 실시간 분류 및 모니터링 지표 제공 시간 (지속 시간, 기간) 횟수 > label : [자리비움 / 학습중] , [집중 / 평소 / 딴짓] 구
[TIL] 210823
테크니컬 글쓰기 특강 듣기 sprint challenge인프런 ROC, AUC 강의 끝까지 다 듣기 트리모델과 선형모델을 비교해봤을때 어떤점이 더 좋았나요?간결하다 원핫인코딩보다 오디널 인코딩 쓸 수 있어서 좋았다표준화 안해도 되서 좋았다 특성선택을 알아서 해줘서 편

[AiR_Predictor] 서울시 초미세먼지 예측 모델을 사용 가능한 프로그램으로 배포
이 글은 지난 6월 진행했던 초미세먼지 예측 모델(서울시 초미세먼지 예측 모델링 포스팅)을 실제 사용 가능한 프로그램으로 다듬어서 배포한 과정을 담고 있다.

[Project-서울시 초미세먼지 예측]3. Random Forest로 미세먼지 농도를 예측해보자
Random Forest로 서울시 PM2.5 단계를 예측해보았다.

파이썬(Python) 데이콘 오늘의 파이썬 2-3 [ 모델링, 랜덤포레스트]
랜덤포레스트는 여러 개의 의사결정나무를 만들어서 이들의 평균으로 예측의 성능을 높이는 방법이며, 이러한 기법을 앙상블(Ensemble) 기법이라고 합니다.강좌바로가기
Ensemble (Bagging vs Boosting) - 한 눈에 알아보기
Ensemble method는 예측 성능의 향상을 위해 사용된다..Ensemble의 기본적인 원칙은 기본 모델(some model)을 설정하고 그것의 linear combination을 하는 것이다.d차원 input을 이용해 실수값을 예측하는 문제를 가정하자.$$g: