위 1개의 행렬을 두개의 저차원 행렬로 분해 한다.
MF로 분해하면 두 개의 잠재 요인 행렬로 나뉘게 된다.
예를 들어, 사용자의 선호도와 영화의 특성을 나타내는데, 여기서는 영화의 장르를 잠재 요인 중 하나로 가정한다.
저차원 행렬은 각각
잠재요인(Latent Factor)
- 우리가 해석하기 쉬운 형태로 명확히 드러나지 않고, 데이터 내에 숨겨진 패턴을 추상화하여 표현하는 변수.
- 영화 추천 시스템에서 잠재 요인은 장르, 인기도, 작품성, 배우 등 다양한 특성들을 포괄적으로 표현할 수 있다. 예를 들어서 첫 번째 잠재 요인이 장르와 관련된 것이라면, 이 잠재 요인의 값은 코미디, 로맨스, 액션 등 여러 장르에 대한 선호도를 모두 포함하는 것일 수 있다.
수식
: 전역 편향
: i번째 변수의 가중치
: i번째와 j번째 변수의 2차 상호작용을 모델링하는 요인
구분 | FM | MF |
---|---|---|
사용 정보 | 다양한 특성 결합 가능 | 사용자, 상품, 평점 정보만 사용 |
평점 계산 방식 | 모든 특성을 하나의 벡터로 치환하여 다항 회귀와 유사 | 사용자와 상품의 내적으로 평점 계산 |
희소 데이터 처리 | 희소한 데이터에서도 파라미터 추정 가능 | - |
상호 작용 고려 | 변수 간의 상호 작용을 고려하여 예측 가능 | - |