데이터 취업 스쿨 스터디 노트 -(63) PCA 실습(eigenface - olivetti 데이터, HAR 데이터)

테리·2024년 8월 29일
0

Olivetti 데이터 실습

사람 얼굴 관련 데이터

특정 샘플 이미지 데이터만 선택

이미지 시각화

두개의 주성분으로 차원 축소

.images 와 .data의 차이

차원 축소

차원 축소된 데이터를 원래의 고차원 데이터로 변환

이미지 다시 그리기(분석된 결과 보기)

평균값의 이미지와 주성분 벡터의 이미지 확인

각각의 주성분에 가중치를 부여해 평균데이터에 더하면서 이미지 변화 살피기

첫번째 성분에 대한 변화

두번째 성분에 대한 변화

w1.reshape(-1,) # w1의 배열을 1차원 배열로 변환하겠다.

다시 합성

HAR 데이터 실습

데이터 불러오기

pca fit

데이터프레임 만드는 함수 만들고 데이터프레임

그래프 그리기

분산 정도 측정

주성분을 3개로 바꿔서 해서 pca 학습

주성분 10개

그리드서치로 학습해보기

pca 전보다 성능은 조금 나쁘다

테스트 데이터 적용

중요!!!

xgboost 방식으로도 확인

원래 해당 데이터는 xgboost로 하면 시간이 많이 걸렸지만 시간이 단축됨.

0개의 댓글