혼자 공부하는 머신러닝 + 딥러닝 06-2 확인문제

손지호·2023년 8월 12일
0

1. k-평균 알고리즘에서 클러스터를 표현하는 방법이 아닌 것은 무엇인가요?

① 클러스터에 속한 샘플의 평균
② 클러스터 중심
③ 센트로이드
④ 클러스터에 속한 샘플 개수

2. k-평균에서 최적의, 클러스터 개수는 어떻게 정할 수 있나요?

① 엘보우 방법을 사용해 이너셔의 감소 정도가 꺾이는 클러스터 개수를 찾는다.
② 랜덤하게 클러스터 개수를 정해서 k-평균 알고리즘을 훈련하고 가장 낮은 이너셔가 나오는 클러스터 개수를 찾는다.
③ 훈련 데이터를 모두 조사하여 몇 개의 클러스터가 나올 수 있는지 직접 확인한다.
④ 교차 검증을 사용하여 최적의 클러스터 개수를 찾습니다.













<풀이>

1. 답 ④ 클러스터에 속한 샘플 개수는 클러스터 구성에 관련이 없다.

① k-평균 알고리즘에서 클러스터에 속한 샘플을 평균 내어 클러스터 중심으로 정한다.
② 샘플은 가장 가까운 클러스터 중심에 속하며 이런 샘플들이 모여 하나의 클러스터를 구성한다.
③ 클러스터 중심을 센트로이드라고도 부른다.


2. ① 엘보우 방법을 사용해 이너셔의 감소 정도가 꺾이는 클러스터 개수를 찾는다.

② 클러스터 개수가 많을수록 이너셔가 작게 나오기 때문에 무조건 작은 이너셔를 얻을 수 있는 클러스터 개수를 선택하면 안 된다.
③ 군집은 타깃 없이 훈련하는 비지도 학습 알고리즘으로 대규모 데이터셋의 경우 직접 조사하여 몇 개의 클러스터가 만들어질지 파악하기 어렵다.
④ 교차 검증은 지도 학습 모델이 훈련 데이터에서 얻을 수 있는 성능을 평가하는 도구.

profile
초보 중의 초보. 열심히 하고자 하는 햄스터!

0개의 댓글