[혼공머신] 5주차 - 비지도 학습

김민영·2024년 1월 29일
0

혼공학습단

목록 보기
20/22
post-thumbnail

군집 알고리즘

  • 비지도 학습
    • 타깃이 없는 훈련 데이터를 사용하는 머신러닝
    • ex, 군집, 차원 축소
  • 히스토그램
    • 구간별로 값이 발생한 빈도를 표시한 그래프
    • 일반적으로 x 축의 값이 구간이고, y 축이 빈도 수
  • 군집
    • 비슷한 샘플끼리 하나의 그룹으로 모으는 비지도 학습 작업
    • 클러스터 : 군집 알고리즘으로 모은 샘플 그룹

k-평균

  • k-평균
    • 랜덤하게 클러스터 중심을 정한 후 클러스터 생성
    • 클러스터의 중심을 이동하고 다시 클러스터 생성
    • 위 과정을 반복하여 최적의 클러스터 구성
  • 클러스터 중심 (센트로사이드)
    • k-평균 알고리즘이 만든 클러스터에 속한 샘플의 특성 평균 값
  • 엘보우 방법
    • 최적의 클러스터 개수를 정하는 방법 중 하나
    • 이너셔 : 클러스터 중심과 샘플 사이 거리의 제곱 합
    • 클러스터 개수에 따라 이너셔 감소가 꺾이는 지점이 적절한 경우가 클러스터 개수 k

주성분 분석

  • 차원 축소
    • 비지도 학습의 일종
    • 원본 데이터의 특성을 적은 수의 새로운 특성으로 변환
    • 다른 알고리즘 특성을 높임
  • 주성분 분석
    • 차원 축소 알고리즘의 일종
    • 데이터에서 가장 분산이 큰 방향(주성분)을 찾는 방법
    • 일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작음
  • 설명된 분산
    • 주성분 분석에서 주성분이 얼마나 원본 데이터의 분산을 잘 나타내는지 기록한 것

기본 미션

  • k-평균 알고리즘 작동 방식
  1. 무작위의 클러스터 중심 k개 지정
  2. 각 샘플에서 가장 가까운 클러스터 중심을 찾고 샘플로 지정
  3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심 변경
  4. 클러스터 중심 변화가 없을 때까지 2, 3번 반복
profile
노션에 1차 정리합니당 - https://cream-efraasia-f3c.notion.site/4fb02c0dc82e48358e67c61b7ce8ab36?v=

0개의 댓글