[머신러닝] 머신러닝 특강 - 군집분석

HEY! MIN·2024년 11월 28일

데이터 사이의 유사성을 기준으로 그룹을 나누는 과정인 군집분석, 클러스터링(Clustering)에 대해 알아 보려고합니다.

01. 클러스터링이란?

이 강의의 목표는?
클러스터링 개념 제대로 알기: 데이터를 그룹으로 묶는 게 왜 중요한지 이해해요!
전처리 → 모델링 → 인사이트 도출까지 프로세스 따라가기.
실습을 통해 진짜 현업에서 쓰는 코드 습득!
클러스터링? 한 마디로 요약하자면!
데이터 안의 숨겨진 패턴을 찾아 그룹으로 나누는 마법! 🪄

데이터 특징 기반으로 군집(Cluster) 형성.
각 군집에서 의미 있는 인사이트를 뽑아내는 게 핵심.
진행 과정은 이렇게!
데이터 준비 🛠️

이상치 제거: Z-Score, IQR 등 활용해 튀는 데이터를 쏙 빼요.
표준화 작업: 데이터 크기 차이를 조정해요. (MinMax Scaling, Standard Scaling)
PCA로 차원 축소까지 깔끔하게!
알고리즘 적용 🤖

가장 많이 쓰는 K-means부터 복잡한 데이터에 강한 DBScan까지 배워요.
클러스터 품질은 실루엣 분석이나 elbow method로 확인!
결과 분석 및 시각화 📊

2D와 3D 시각화로 군집이 잘 나뉘었는지 확인해요.
군집별 특징 정리하고 인사이트 도출!
실습 맛보기
python
코드 복사
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=5, random_state=42)
kmeans.fit(data)
Python 코드로 바로 실행해볼 수 있도록 깔끔한 예제도 제공돼요! 😍

결론!
데이터 분석의 기본기를 다지고 싶다면 클러스터링은 필수.
Python으로 군집 분석 프로세스를 차근차근 익히다 보면, 데이터가 가진 숨겨진 비밀을 풀 수 있어요. 🔍
현업에서도 바로 써먹을 수 있는 기술들이라 더 유용!

내일수정예정

profile
It's a, it's the Pleasure Shop

0개의 댓글