FM(Factorization Machine)은 svm과 factorization을 결합한 모델로 과거 regression이나 svm 좋은 성능을 내지 못하던 high_dimensional, highly sparse dataset의 문제를 보완하여 성능을 내는 모델이다
FFM은 FM에 Field의 개념을 접목시킨 모델이다.FM은 아래 식과 같이 field에 관계 없이 전체 feature의 interaction을 계산한다.그러나 모든 feature는 특정 그룹을 나타낼 수 있는 field에 속해있고 field마다 가지고 있는 그룹
FFM 모델은 학습해야 하는 interaction term의 parameter 수가 $n$(Field $F(i)$, $i=1, 2, ..., n$Feature $f_i$, $i=1, 2,... , m$Dataset $S = {\\bold{x}^{(s)}, y^{(s)}
CTR 예측 모델에서 feature를 다루는 것은 과거의 co-occurence 기록을 통해 새로운 feature combinationd을 탐색하는 과정으로 볼 수 있다. Regression의 경우 과거 기록이 없는 경우, 즉 train dataset에 변수간의 int
※ CTR 시리즈의 모든 코드는 FuxiCTR을 참고했으며 함수 구조와 이름 등은 개인적으로 수정하여 사용하였다.feature_dict은 각 feature의 설명을 dictionary 형태로 담고 있는 dictionary이고, EmbeddingDict()은 각 fie
DNN은 자동적으로 모든 feature의 interaction을 학습한다. Implicit하게 모든 interaction을 학습하는 과정에서 의미 없는 interaction을 학습하면서 학습 성능이 떨어지는 현상이 발생하기도 한다. DCN에서는 좀 더 explicit하
※ CTR 시리즈의 모든 코드는 FuxiCTR을 참고했으며 함수 구조와 이름 등은 개인적으로 수정하여 사용하였다.feature_dict은 각 feature의 설명을 dictionary 형태로 담고 있는 dictionary이고, EmbeddingDict()은 각 fie
※ CTR 시리즈의 모든 코드는 FuxiCTR을 참고했으며 함수 구조와 이름 등은 개인적으로 수정하여 사용하였다.feature_dict은 각 feature의 설명을 dictionary 형태로 담고 있는 dictionary이고, EmbeddingDict()은 각 fie