앙상블 개요
보팅
bagging
최종 결정에서 하드보팅
최종 결정에서 소프트보팅
랜덤 포레스트
HAR
- Human Activity Recognition
IMU 센서를 활용해서 사람의 행동을 인식하는 실험
폰에 있는 가속도/자이로 센서 사용
데이터의 공식 경로
데이터 소개
데이터의 특송
데이터의 클래스
시간영역의 데이터를 직접 사용하는 것은 어렵다
머신러닝을 이용한 행동 인식 연구의 역사
데이터 읽기
특성 확인
X data
Y data
각 액션별 데이터의 수
각 라벨별 정의
결정나무
max_depth를 다양하게 하기 위해 GridSearchCV 이용
max_depth 8이 좋다고 함
max_depth별로 표로 선능을 정리
실제 test 데이터에서의 결과
베스트 모델의 결과
램덤 포레스트 적용
결과 정리를 위한 작업
성능이 좋음
best 모델
test 데이터에 적용
중요 특성 확인
각 특성들의 중요도가 개별적으로 높지 않다
주요 특성 관찰
주요 20개 특성
20개 특성만 가지고 다시 성능 확인
- 561개의 특성보다 20개의 특성만 보면 연산속도가 정말 빠를 것이다. 비록 acc는 포기하더라도 !