베이즈 정리
1. 베이즈 정리의 의미
- 조건부 확률을 계산하는 중요한 통계 이론
- 관측된 데이터를 바탕으로 사건의 확률을 갱신하는 방법을 제공
- '사전 확률'을 '사후 확률'로 갱신하는 데 사용
2. 베이즈 정리
P(A∣B)=P(B)P(B∣A)⨉P(A)
- P(A∣B): B가 발생했을 때 A가 발생할 확률 (사후 확률, Posterior Probability)
- P(B∣A): A가 발생했을 때 B가 발생할 확률 (우도, Likelihood)
- P(A): A가 발생할 확률 (사전 확률, Prior Probability)
- P(B): B가 발생할 확률 (Evidence)
엘보우 방법
1. K-means Clustering
- 데이터를 K개의 그룹으로 나누는 방법
- 그러나 K를 어떻게 설정할 지 모르는 경우가 많음
- 엘보우 방법을 사용해서 최적의 K 값을 찾음
2. 엘보우 방법
1) K 값을 여러 개로 설정해서 각각의 K에 대해 K-mean clustering을 수행
2) 각 K 값에 대해 WCSS (Within-Cluster Sum of Squares)를 계산.
- WCSS는 클러스터 내의 데이터 포인트들이 얼마나 가까이 모여 있는지를 나타내는 값
- 작을수록 클러스터 내 데이터가 잘 모여 있다는 뜻
3) K가 커질수록 WCSS가 급격히 줄어들다가 더 이상 크게 줄어들지 않는 지점이 있는데, 이 지점이 바로 최적의 K값이라 할 수 있음