마르코프 부등식(Markov Inequality)은 항상 양의 값을 갖는 확률변수 X에 대해 성립하는 부등식이다. 임의의 양수 α>0에 대해, 다음이 성립한다.
P(X≥α)≤αE[X]
즉, 마르코프 부등식은 전체 데이터 분포에서 특정값 α 밖에 있는 값의 비율이 α에 관한 특정 값 안에 수렴함을 의미한다.
증명
확률변수 X에 대한 확률밀도함수를 fX(t)라고 하면, 이에 대한 기대값 E[X]은 다음과 같다.
E[X]=∫RxfX(t)dt
이 때, X는 0보다 크므로, t<0에서 확률밀도함수의 값은 0이다. 즉,
∫RxfX(t)dt=∫−∞∞xfX(t)dt=∫0∞xfX(t)dt
여기서, α값을 기준으로 적분을 나누면, 다음과 같이 쓸 수 있다.
∫0∞xfX(t)dt=∫0αxfX(t)dt+∫α∞xfX(t)dt
또한, 우항의 두번째 식에서 X≥α이므로, 다음과 같은 부등식이 성립한다.
∫0αxfX(t)dt+∫α∞xfX(t)dt≥∫0αxfX(t)dt+α∫α∞fX(t)dt≥α∫α∞fX(t)dt
맨 처음 식의 기대값 E[X]와 최종 결과만 가져오면 다음과 같다.
E[X]≥α∫α∞fX(t)dt=αP(X≥α)
위 식을 정리하면, 우리가 원하는 결과를 얻는다.
P(X≥α)≤αE[X]