앙상블 기법
앙상블 개요

voting

bagging

최종 결정에서 하드보팅

최종 결정에서 소프트보팅

랜덤포레스트 Random Forest

랜덤포레스트

HAR, Human Activity Recognition
데이터 소개
IMU 센서를 활용해서 사람의 행동을 인식하는 실험

폰에 있는 가속도/자이로 센서 사용

데이터의 공식 경로
https://archive.ics.uci.edu/ml/datasets/human+activity+recognition+using+smartphones

PinkWink’s Github 데이터 사용

데이터 소개

데이터의 특성

데이터의 클래스

시간영역의 데이터를 직접 사용하는 것은 어렵다

머신러닝을 이용한 행동 인식 연구는 꽤 발전했다

실습
데이터 읽기
조심! 지금은 특성 이름만 읽었을 뿐 → 561개

X 데이터

y 데이터, 각 액션별 데이터의 수

각 라벨별 정의

결정나무

max_depth를 다양하게 하기 위해 GridSearchCV 이용 (best→max_depth 8)

max_depth별로 표로 성능을 정리
train과 test의 score 차이가 있음. 과적합일까?

실제 test 데이터에서의 결과

랜덤포레스트 적용

결과 정리를 위한 작업 후 best 모델

test 데이터에 적용

중요 특성 확인

주요 특성 관찰

주요 20개 특성만 가지고 다시 성능 확인
561개의 특성보다 20개의 특성만 보면 연산속도가 정말 빠를 것이다. 비록 acc는 포기하더라도~
