[ML] 9주차-1 : Density Estimation

k_dah·2021년 12월 7일
0

MachineLearning_AndrewNg

목록 보기
23/32
post-custom-banner

Machine Learning by professor Andrew Ng in Coursera

Anomaly Detection

1) Problem Motivation

Anomaly detection example


내가 비행기 엔진을 제작하는 사람이라고 가정한다.
좋은 엔진을 가려내기 위해 feature들을 테스트해 보려고 한다.

새로운 엔진을 기존의 데이터와 함께 표시하면

'기존 데이터와 비슷하게 잘 섞이면 괜찮다. 새로운 데이터가 튄다면 anomaly '

Density estimation


'새로운 데이터가 normal / anomalous 인지 판단하는 방법'

Anomaly detection example


  • Fraud detection
    • x(i)=features of user i’s activitiesx^{(i)} = \text{features of user i's activities}
    • Model p(x) from data\text{Model p(x) from data}
    • p(x)<=ϵp(x) <= \epsilon인 이상한 유저들을 식별한다.

2) Gaussian Distribution

Gaussian (Normal) distribution


Gaussian distribution example


Parameter estimation



μ\muσ\sigma를 추정하는 방법

  • μ=1mi=1mx(i)\mu = \frac{1}{m}\sum_{i=1}^{m}x^{(i)}
  • σ2=1mi=1m(x(i)μ)2\sigma^2 = \frac{1}{m}\sum_{i=1}^{m}(x^{(i)}-\mu)^2

'데이터가 주어졌을 때 Gaussian~을 따른다면 평균&표준편차를 추정할 수 있다.'

3) Algorithm

Density estimation


Anomaly detection algorithm


  1. anomalousanomalous 데이터를 식별할 수 있을 것으로 판단되는 특성 xix_i들을 선택한다.

  2. Fit parameters μ1,...,μn,σ12,...σn2\text{Fit parameters } \mu_1, ..., \mu_n, \sigma_1^2, ... \sigma_n^2

    • μj=1mi=1mxj(i)\mu_j = \frac{1}{m}\sum_{i=1}^{m}x_j^{(i)}
    • σj2=1mi=1m(xj(i)μj)2\sigma_j^2 = \frac{1}{m}\sum_{i=1}^{m}(x_j^{(i)} - \mu_j)^2
  3. 새로운 데이터 xx가 주어지면, 아래와 같이 p(x)p(x)를 계산한다.

    • p(x)=j=1nP(xj;μj,σj2)=j=1n12πσjexp((xjμj)22σj2)p(x) = \prod_{j=1}^{n}P(x_j; \mu_j, \sigma_j^2) = \prod_{j=1}^{n}\frac{1}{\sqrt{2\pi} \sigma_j}\exp\left(-\frac{(x_j-\mu_j)^2}{2\sigma_j^2}\right)

    이때 p(x)<ϵp(x) < \epsilon 이면 해당 데이터는 anomalyanomaly

Anomaly detection example


profile
개똥이
post-custom-banner

0개의 댓글