혼자 공부하는 머신러닝 + 딥러닝 06-3 확인문제

손지호·2023년 8월 13일
0

1. 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분의 개수는 몇 개 일까요?

① 10개
② 20개
③ 50개
④ 100개

2. 샘플 개수가 1,000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉 이 데이터셋의 크기는 (1000, 1000)입니다. 이 데이터를 사이킷런의 PCA 클래스를 사용해 10개의 주성분을 찾아 변환했습니다. 변환된 데이터셋의 크기는 얼마일까요?

① (1000, 10)
② (10, 1000)
③ (10, 10)
④ (1000, 1000)

3. 2번 문제에서 설명된 분산이 가장 큰 주성분은 몇 번째 인가요?

① 첫 번재 주성분
② 다섯 번째 주성분
③ 열 번째 주성분
④ 알 수 없음













<풀이>

1. 답 ② 일반적으로 특성의 개수만큼 주성분 찾을 수 있다.


2. 답 ① (1000, 100) 크기 데이터셋에서 10개의 주성분을 찾아 변환하면 샘플의 개수는 그대로이고 특성 개수만 100에서 10으로 바뀝니다. 즉, (1000, 100)


3. 답 ① 주성분 분석은 가장 분산이 큰 방향부터 순서대로 찾습니다. 따라서 첫 번째 주성분의 설명된 분산이 가장 큽니다.

profile
초보 중의 초보. 열심히 하고자 하는 햄스터!

0개의 댓글