# "[Recommender System] Neural Collaborative Filtering"
> 2017, Neural Collaborative Filtering

- toc: true
- badges: true
- comments: true
- categories: [Paper]
- tags: [paper, recommender system, neural, collaborative, filtering]

# Neural Collaborative Filtering

![](../images/paper/recommendation/ncf/ncf-001.png)

## Abstract & Introduction

- 기존 **Linear Matrix Factorization**의 한계점을 지적
- **Neural Net** 기반의 **Collaborative Filtering**으로 non-linear한 부분을 커버
- user와 item 관계를 보다 복잡하게 모델링 할 수 있음

## Contributions

- User와 Item의 **latent features**를 모델링하기 위한 **Neural Network** 구조를 제안 (**General Framwork NCF**)
- **Matrix Factorization**은 **NCF**의 특별한 케이스임을 증명하고, **Multi-layer Perceptron**을 사용
- 실제 데이터를 활용하여 다양한 실험을 진행했으며, 이를 통해 **NCF**의 효과를 증명

## Preliminaries

### Learning from Implicit Data

![](../images/paper/recommendation/ncf/ncf-002.png)

- $M$과 $N$은 user와 item 수, rating 데이터가 0과 1의 binary 데이터
- user가 item을 관측했는지에 따라 0 또는 1로 표현 &rarr; interaction이 있는지 여부를 표시
    - 선호, 비선호를 나타내는 것이 아님(implicit feedback data)
- **interaction function** $f$를 정의하고, user와 item간 interaction이 있는지 확률을 예측하는 문제
- 2가지 **objective function**(**Point-wise loss**와 **Pair-wise loss**) 모두 사용 가능
    - **Point-wise**: 실제값과 예측값 차이를 최소화
    - **Pair-wise**: BPR에서 사용했으며, 1이 0보다 큰 값을 갖도록 마진을 최대화

### Matrix Factorization

![](../images/paper/recommendation/ncf/ncf-003.png)

- User-Item Interaction Matrix의 한계점을 지적
    - u4 &rarr; u1 &rarr; u3 &rarr; u2
    - u4 &rarr; u1 &rarr; u2 &rarr; u3
- user와 item의 복잡한 관계를 low dimension에 표현하면서 문제 발생
- Dimension 크기를 키우면 overfitting 발생
- Non-linear한 Neural Network를 사용해서 복잡한 상관관계를 표현

## Neural Collaborative Filtering

### General Framework

![](../images/paper/recommendation/ncf/ncf-004.png)

- Input Layer (Sparse): user와 item을 one-hot vector로 표현
- Embedding Layer: Sparse one-hot vector를 dense vector로 맵핑
- Neural CF Layer: User Latent Vector와 Item Latent Vector를 concat해서 Layer를 통과
- Output Layer: user $u$와 item $i$의 상관관계를 0과 1사이의 점수로 나타냄

![](../images/paper/recommendation/ncf/ncf-005.png)

- Label이 binary이기 떄문에, **Bernoulli Distribution**을 사용
- $\Upsilon$는 $y_{u,i} = 1$인 집단, $\Upsilon^{-}$는 $y_{u,i} = 0$인 집단을 나타냄
- Loss Function은 **binary cross entropy**를 사용
- 위의 L를 최소화하는 파라미터를 찾음
- 학습은 **SGD**를 사용

### Generalized Matrix Factorization (GMF)

- **Matrix Factorization**이 **Neural CF**의 특별 케이스로 된다는 것을 보여 줌

$$ 
\Large{\phi_{1}(p_{u},q_{i}) = p_{u} \bigodot q_{i}}
$$

- $p$와 $q$는 user와 item의 latent vector인데, 이를 element-wise 곱하고, weight를 곱해 줌

$$ 
\Large{\widehat{y_{ui}} = a_{out}(h^{T}(p_{u} \bigodot q_{i}))}
$$

- $a$는 non-linear activation fuction(**sigmoid**)
- $h^{T}$는 내적할 때, 가중치 역할을 하며 latent vector를 학습할 수 있게 만들고 중요도를 조절하도록 함
- $a$가 1이고, $h^{T}$가 uniform vector이면 **Matrix Factorization**이 됨

### Multi-Layer Perceptron (MLP)

![](../images/paper/recommendation/ncf/ncf-006.png)

- **GMF**보다 더 간단하게 user-item interaction을 학습할 수 있음
- $W_{x}$, $b_{x}$, $a_{x}$는 순서대로 weight matrix, bias vector, x번째 층 activation fuction
- $\theta_{1}$은 user와 item의 latent vector를 concat함
- 이후 모든 $\theta_{L}$은 weight matrix와 bias vector로 표현
- 최종 식을 **GMF**와 동일한 구조를 가짐

### Fusion of GMF and MLP

![](../images/paper/recommendation/ncf/ncf-007.png)

![](../images/paper/recommendation/ncf/ncf-008.png)

- **GMF**와 **MLP**에서 사용하는 latent vector dimension이 다를 수 있음
- 최종 score는 **MLP**와 **GMF**의 output을 concat하여 사용
- **MF** linearity와 **MLP**의 non-linearity를 결합하여 장점만 선택

## Experiments

- MovieLens와 Pinterest 데이터를 사용하여 실험
- Pinterest의 경우 데이터 셋이 매우 크지만 sparse 함
    - 사용자의 20%가 pin이 하나만 존재
    - 최소 20개 이상의 pin을 가진 user로 필터해서 사용
- Baseline
    - ItemPop: Popularity에 따라 아이템 순위를 매김
    - ItemKNN: Standard Item-based CF 방법을 implicit feedback에 적용
    - BPR: MR 모델을 최적화하는 방법
    - eALS: 아이템 추천에서 state-of-the-art MF 방법

![](../images/paper/recommendation/ncf/ncf-009.png)
![](../images/paper/recommendation/ncf/ncf-010.png)
![](../images/paper/recommendation/ncf/ncf-011.png)
![](../images/paper/recommendation/ncf/ncf-012.png)

## Conclusions

- General Framework NCF를 제안; **GMF**, **MLP**, **NeuralMF**
- Linear 모델의 한계를 neural network를 사용하여 해결
- **GMF**와 **MLP**의 장점을 합하여 **NeuralMF**를 제안했으며, 성능 향상에 기여
- User-item interaction의 다루는 Collaborative Filtering 아이디어에 집중