✅혼자 공부하는 머신러닝+딥러닝
진도: Chapter 06
실습파일 : Fruits.ipynb
(완료) 기본미션 : k-평균 알고리즘 작동 방식 설명하기
K-평균 알고리즘의 작동 방식
무작위로 k개의 클러스터 중심을 정한다.
-> 무작위 클러스터 중심을 기준으로, 클러스터가 생성된다. 무작위 샘플끼리 묶여있다.
-> 무작위 샘플 중 다수에 가까운 샘플 쪽으로, 클러스터 중심을 다시 계산하여 이동시킨다.각 샘플에서 가장 가까운 클러스터 중심을 찾아, 해당 클러스터의 샘플로 지정한다.
-> 클러스터가 재배치되어 각자의 샘플끼리 다시 묶인다. 동일한 샘플끼리만 묶여있다.
- 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경한다.
-> 조정된 클러스터의 위치에 맞게, 클러스터 중심을 한가운데로 이동한다.
- 2번으로 돌아가 반복한다. (클러스터 중심에 변화가 없을 때까지)
*무작위 클러스터링 -> (중심 이동 -> 재 클러스터링) -> 반복(중심 이동 -> 재 클러스터링)
() 선택미션 : Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기
✅06-1 : 군집 알고리즘
타깃을 모르는 비지도학습 unsupervised learning
!wget https://bil.ly/fruits_300_data -O fruits_300.npy
import numpy as np
import matplotlib.pyplot as plt
fruits = np.load('fruits_300.npy')
print(fruits.shape) #(300, 100, 100)
print(fruits[0,0,:])
[ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1
2 2 2 2 2 2 1 1 1 1 1 1 1 1 2 3 2 1
2 1 1 1 1 2 1 3 2 1 3 1 4 1 2 5 5 5
19 148 192 117 28 1 1 2 1 4 1 1 3 1 1 1 1 1
2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1]
# 0에 가까운 부분들은 이미지에서 검게 표시된다.
히스토그램
군집
✅06-2 : k-평균
k-평균
클러스터 중심 centroid
엘보우 방법
KMeans
✅06-3 : 주성분 분석
차원 축소
주성분 분석
설명된 분산