[혼공머신] 5주차_미션 및 공부내용

판도라도·2025년 8월 12일
0

K-평균(K-Means) 알고리즘


이 번주는 K- 평균 알고리즘 작동 방식 설명이 숙제였습니다.

K-평균 알고리즘은 비지도 학습이라는 머신러닝의 한 종류입니다. 비지도 학습이란, 정답이 없는 데이터를 컴퓨터가 스스로 학습해서 데이터 속에 숨겨진 패턴이나 구조를 찾아내는 것을 말합니다.

주어진 데이터를 'K'개의 그룹(클러스터)으로 묶어주는 것

K-평균은 어떻게 작동할까? (핵심 4단계)**

K-평균 알고리즘의 작동 원리는 놀라울 정도로 간단합니다. 딱 네 단계만 기억하세요!

1단계: K개의 중심점(Centroid) 무작위로 찍기

  • 먼저, 데이터를 몇 개의 그룹으로 나눌지 K값을 정합니다.
  • 그리고 데이터가 흩어져 있는 공간에 K개의 중심점을 아무 데나 찍습니다.

2단계: 가장 가까운 중심점에 데이터 할당하기

  • 모든 데이터는 자신과 가장 가까운 중심점을 찾아 그 그룹에 소속됩니다.

3단계: 중심점 이동하기 (대표 새로 뽑기)

  • 이제 각 그룹에 소속된 데이터들의 평균 지점으로 중심점을 이동시킵니다.

4단계: 더 이상 변하지 않을 때까지 2, 3단계 무한 반복

  • 중심점이 이동했으니 데이터들의 소속이 바뀝니다. 다시 2단계로 돌아가 데이터의 소속을 재할당하고, 3단계에서 중심점을 또 이동합니다.
  • 이 과정을 계속 반복하다 보면 더 이상 중심점이 움직이지 않고, 데이터의 소속도 바뀌지 않는 순간이 옵니다. 이때, 그룹핑이 최종 완료됩니다.

0개의 댓글