241015 TIL 베이즈 정리, 엘보우 방법

윤수용·2024년 10월 15일
0

TIL

목록 보기
34/113

베이즈 정리

1. 베이즈 정리의 의미

  • 조건부 확률을 계산하는 중요한 통계 이론
  • 관측된 데이터를 바탕으로 사건의 확률을 갱신하는 방법을 제공
  • '사전 확률'을 '사후 확률'로 갱신하는 데 사용

2. 베이즈 정리

P(AB)=P(BA)P(A)P(B)P(A|B) = \frac{P(B|A)⨉P(A)}{P(B)}

  • P(AB)P(A|B): B가 발생했을 때 A가 발생할 확률 (사후 확률, Posterior Probability)
  • P(BA)P(B|A): A가 발생했을 때 B가 발생할 확률 (우도, Likelihood)
  • P(A)P(A): A가 발생할 확률 (사전 확률, Prior Probability)
  • P(B)P(B): B가 발생할 확률 (Evidence)

엘보우 방법

1. K-means Clustering

  • 데이터를 K개의 그룹으로 나누는 방법
  • 그러나 K를 어떻게 설정할 지 모르는 경우가 많음
  • 엘보우 방법을 사용해서 최적의 K 값을 찾음

2. 엘보우 방법

1) K 값을 여러 개로 설정해서 각각의 K에 대해 K-mean clustering을 수행
2) 각 K 값에 대해 WCSS (Within-Cluster Sum of Squares)를 계산.
- WCSS는 클러스터 내의 데이터 포인트들이 얼마나 가까이 모여 있는지를 나타내는 값
- 작을수록 클러스터 내 데이터가 잘 모여 있다는 뜻
3) K가 커질수록 WCSS가 급격히 줄어들다가 더 이상 크게 줄어들지 않는 지점이 있는데, 이 지점이 바로 최적의 K값이라 할 수 있음

profile
잘 먹고 잘 살자

0개의 댓글

관련 채용 정보