[딥러닝]비지도학습

권경민·2023년 7월 15일

딥러닝

목록 보기

4/8

3장 머신러닝 핵심 알고리즘

1. 비지도학습

비지도학습이란?
정답이 없는 상태에서 훈련시키는 방식

군집(=클러스터)
각 데이터의 유사성(거리)을 측정한 후 유사성이 높은 데이터끼리 집단으로 분류
차원축소
차원을 나타내는 특성을 줄여서 데이터를 줄이는 방식

💡 **데이터 간 유사도(거리) 측정 방법

유클리드 거리

맨해튼 거리

민코프스키 거리

코사인 유사도

1.1 K-평균 군집화

데이터를 입력받아 소수의 그룹으로 묶는 알고리즘
레이블이 없는 데이터를 입력받아 각 데이터에 레이블을 할당해 군집화 수행

K-평균 군집화 학습 과정
1. 중심점 선택 : 랜덤하게 초기 중심점 선택
2. 클러스터 할당 : K개의 중심점과 각각의 개별 데이터 간의 거리 측정 후, 가장 가까운 중심점을 기준으로 데이터 할당. 이 과정에서 클러스터 구성됨
3. 새로운 중심점 선택 : 클러스터마다 새로운 중심점 계산
4. 범위 확인 : 선택된 중심점에 더 이상의 변화가 없다면 진행 중단.