Unsupervised Clustering(AI-20)

김유찬·2023년 6월 6일
0

인공지능

목록 보기
12/12
post-thumbnail

■ unsupervised Clustering (무-감독 군집화)

  • Partitioning algorithms(분할 알고리즘)
    -출발은 랜덤한 분할
    -전체 집합을 몇 개의 부분 집합으로 나누는데 부분 집합들을 다시 합쳤을 때 전체 집합이 되어야 하고 부분 집합에 속하지 않고 남겨져 있는 데이터도 없어야 함
    -ex) K means clustering
  • Hierarchical algorithms(계층적 알고리즘)
    -군집들의 트리 구조
    -Top-down, divisive clustering
    -Bottom-up, agglomerative clustering

■ K-Means Clustering

  • k 개의 임의로 선정된 군집 중심점들에서 시작
  • 데이터 포인트마다 가장 근접한 군집 중심점을 찾아 해당 군집으로 편입
  • 각 군집 중심점을 해당 군집의 데이터 포인트들의 무게 중심으로 이동
  • 충분히 수렴할 때까지 이를 반복

■ Problems of K-Means Clustering

  • 군집 개수 결정 문제
  • 초기 군집 중심 선택 문제
  • 이상치 문제: 입력 데이터에 오류가 포함되어 있으면 군집에 큰 영향을 줌

■ Hierarchical Algorithm(계층적 알고리즘)

  • 특징
    -k-평균 군집화와 달리, 군집 수 k를 설정할 필요가 없음
    -군집화 결과물인 dendrogram을 적절한 수준에서 자르면 원하는 군집을 구할 수 있음
    -계산 복잡도가 O(n^3)으로서, k-평균 군집화 알고리즘보다 더 많은 계산을 요구함

  • Bottom-up(상향식 결합)

  • Top-down(하향식 분할)

profile
eukddan

0개의 댓글