[혼공머신] 5주차_Ch.6_비지도학습

JIN A·2024년 2월 14일
0

✅혼자 공부하는 머신러닝+딥러닝
진도: Chapter 06

실습파일 : Fruits.ipynb

(완료) 기본미션 : k-평균 알고리즘 작동 방식 설명하기

K-평균 알고리즘의 작동 방식

  1. 무작위로 k개의 클러스터 중심을 정한다.
    -> 무작위 클러스터 중심을 기준으로, 클러스터가 생성된다. 무작위 샘플끼리 묶여있다.
    -> 무작위 샘플 중 다수에 가까운 샘플 쪽으로, 클러스터 중심을 다시 계산하여 이동시킨다.

  2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아, 해당 클러스터의 샘플로 지정한다.
    -> 클러스터가 재배치되어 각자의 샘플끼리 다시 묶인다. 동일한 샘플끼리만 묶여있다.

  1. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경한다.
    -> 조정된 클러스터의 위치에 맞게, 클러스터 중심을 한가운데로 이동한다.
  1. 2번으로 돌아가 반복한다. (클러스터 중심에 변화가 없을 때까지)

*무작위 클러스터링 -> (중심 이동 -> 재 클러스터링) -> 반복(중심 이동 -> 재 클러스터링)

() 선택미션 : Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기


✅06-1 : 군집 알고리즘
타깃을 모르는 비지도학습 unsupervised learning

  • 코랩의 코드 셀에서 '!' 문자로 시작하면, 코랩은 이후 명령을 파이썬 코드가 아니라 리눅스 셸(shell) 명령으로 이해한다.
    wget 명령은, 원격 주소에서 데이터를 다운로드하여 저장한다.
    -O 옵션에서, 저장할 파일 이름을 지정할 수 있다.
!wget https://bil.ly/fruits_300_data -O fruits_300.npy

import numpy as np
import matplotlib.pyplot as plt
fruits = np.load('fruits_300.npy')
print(fruits.shape) #(300, 100, 100)

print(fruits[0,0,:])
[  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   2   1
   2   2   2   2   2   2   1   1   1   1   1   1   1   1   2   3   2   1
   2   1   1   1   1   2   1   3   2   1   3   1   4   1   2   5   5   5
  19 148 192 117  28   1   1   2   1   4   1   1   3   1   1   1   1   1
   2   2   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1
   1   1   1   1   1   1   1   1   1   1]
# 0에 가까운 부분들은 이미지에서 검게 표시된다.


히스토그램
군집


✅06-2 : k-평균
k-평균
클러스터 중심 centroid
엘보우 방법

KMeans


✅06-3 : 주성분 분석
차원 축소
주성분 분석
설명된 분산

profile
CHEER UP :)

0개의 댓글