가능도가 무엇인지 알아보기 전에, 먼저 확률이 무엇인지에 대해 생각해보자.
확률(Probability)은 주어진 확률분포에서 해당 관측값이 나올 수 있는 정도이다. 즉, 관측값 혹은 관측값의 구간이 확률분포 안에서 어느 비율로 존재하는지를 나타내는 값이라고 할 수 있다. 이 때의 확률분포를 라고 하고, 그 안에서의 관측값 을 라고 하면 다음과 같이 나타낼 수 있다.
이 때, 연속된 확률밀도 하에서 특정한 한 관측치에 대한 확률은 확률밀도의 특성상 0이 되는데, 그렇다고 해서 그 관측치가 절대 발생할 수 없음을 의미하는 것은 아니다. 이러한 이유로 특정한 관측치가 일어날 가능성을 비교하기에는 확률은 적합하지 않은 도구임을 알 수 있다.
가능도(Likelihood)는, 확률과는 반대로 어떤 값이 관측되었을 때, 그 관측값이 어떤 확률분포로부터 나왔을 지에 대한 가능성이다. 즉, 관측값을 기반으로 확률분포를 나타내므로 관측값이 '기반이 되는' 값이라고 할 수 있다. 확률분포를 , 관측값을 라고 하면, 가능도 은 다음과 같이 나타낼 수 있다.
이 때, 와 가 같다면 확률과 가능도는 같은 값을 가진다.
여기서, 확률변수 가 의 꼴로 주어져 있으며, 가 확률분포 를 가진다면 위 식은 다음과 같이 쓸 수 있다.
위에서 보았듯이 가능도도 결국은 확률로 표현할 수 있기 때문에, 이 확률의 곱을 덧셈으로, 지수를 곱셈으로 만들 수 있는 로그를 씌워서 로그 가능도(Log Likelihood)로 사용하는 경우도 많다. 로그 가능도 표현은 다음과 같다.
동전이 하나 있는데, 한쪽 면에 무게중심이 쏠려있어서 동전을 던졌을 때 앞면이 나올 확률을 , 뒷면이 나올 확률을 라고 하자. 이 때, 동전을 두 번 던졌는데 두 번 다 앞면이 나왔다고 하자. 그러면 이 때의 의 가능도는,
이다. 이 결과는, 앞면이 두 번 나온 사실에 근거하여, 가 라는 작은 값을 가질 가능도는 로 매우 낮은 값이라고 해석할 수 있다. 반대로, , 라고 하면,
가 되며, 일 때의 가능도는 확연히 높은 값을 가진다. 이는 일단 앞면이 두 번 나왔으니, 의 값은 큰 값을 가질 가능성이 높다는 직관적인 추론과도 일치한다.