마르코프 체인

HanJu Han·2024년 11월 9일

추천 시스템

목록 보기

2/49

마르코프 체인은 확률 과정의 일종으로, 다음 상태가 오직 현재 상태에만 의존하는 특성을 가집니다

주요 특징:

실제 응용 예시:

각 포인트는 다음날 무엇을 먹을지에 대한 확률이다.
- ex) 햄버거를 먹고 다음날 피자를 먹을 확률: 0.6
- ex) 햄버거를 먹고 다시 햄버거를 먹을 확률: 0.2
다음 날 무엇을 먹을지 예측할 때 오직 오늘의 상황 만으로 판단한다.
- (과거에 무엇을 먹었는지는 다음날 무엇을 먹을지 예측할때 생각하지 않는다.)

위와 같이 계속 계산할 경우 결국 πA = π인 수식이 된다.
- 즉 π에 A값을 계속 곱해도 결과가 같은 상태이다.
Av = λv (고유값 방정식): 이 방정식은 정상상태를 찾는 다른 방법
- A: 전이행렬
- λ: 고유값
- v: 고유벡터
- λ = 1인 고유벡터가 정상상태 확률 분포가 됨

전이행렬 계산

상태 B(Browsing)에서의 전이:

전이확률 계산:
P(B→B) = 200/400 = 0.5
P(B→C) = 120/400 = 0.3
P(B→P) = 40/400 = 0.1
P(B→E) = 40/400 = 0.1

이런 식으로 각 상태에서의 전이를 계산:

상태 C에서의 전이 (300명 관찰):
P(C→B) = 60/300 = 0.2
P(C→C) = 120/300 = 0.4
P(C→P) = 90/300 = 0.3
P(C→E) = 30/300 = 0.1

최종 전이행렬:

      B    C    P    E
B   [0.5  0.3  0.1  0.1]
C   [0.2  0.4  0.3  0.1]
P   [0.3  0.2  0.4  0.1]
E   [0.6  0.2  0.1  0.1]

Stationary의 경우 이전의 상태를 고려하기 때문에 이전 노드가 영향력이 높다면(영향이 높은 상태가 현재 노드를 참조하고 있다면) 점수가 높아진다.
- ex) 세션으로 부터 클릭을 많이 받은 아이템은 좋은 아이템이다, 이런 영향력 높은 아이템 다음으로 선택이 자주 된 아이템의 경우 클릭이 많지 않아도 좋은 아이템일 수 있다.

ref: https://www.youtube.com/watch?v=i3AkTO9HLXo&list=PLM8wYQRetTxBkdvBtz-gw8b9lcVkdXQKV

시리즈를 기반으로 작성하였습니다.