# "[Recommender System] Wide and Deep Learning for Recommender system"
> 2016, Google, Wide linear 모델과 Deep neural networks를 Joint한 모델

- toc: true
- badges: true
- comments: true
- categories: [Paper]
- tags: [paper, recommender system, wide and deep]

# Wide and Deep Learning for Recommender system

![](../images/paper/recommendation/wd/wd-001.png)

## Abstract

![](../images/paper/recommendation/wd/wd-002.png)

- Wide: Memorization
    - Cross-product feature transformation
    - More feature engineering effort
- Deep: Generalization
    - Generalize to unseen feature combinations
    - Less feature engineering effort
    - Over-generalize
- Wide & Deep
    - Joint wide linear models and deep neural networks

## Introduction

- Memorization의 정의
    - Frequent co-occurrence of items or features
    - Exploit correlation available in the historical data
- Generalization의 정의
    - Explore new feature combinations
- 추천 시스템에서 Memorization과 Generalization
    - Memorization: more topical and directly relevant to the items
    - Generalization: improve diversity of the recommendations
- Google Play Store의 apps recommendation 실험을 했지만 general하게 적용할 수 있음

- 기존 추천 모델의 한계
    - Generalized Linear Model
        - **Logistic Regression**과 같은 모델에 다양한 features를 만들어서 학습
        - Memorization(주어진 데이터 기억)에 특화
        - 새로운 또는 관측되지 않은 데이터(unseen data)에는 취약
        - 오버피팅이 발생할 수 있음
    - Embedding based Model
        - **Factorization Machine**, **Deep Neural Network** 방법을 활용
        - Generalization(unseen data 대응)에 특화
        - Non-zero prediction으로 인해 섬세한 추천이 불가

## Contributions
- Wide & Deep Learning framework를 제안
    - Jointly training feed-forward neural network and linear model
- Google Play에 사용화된 Wide & Deep 추천시스템의 평가와 구현내용을 공개
    - 모바일 앱스토어에서 App 구매, 다운로드 등 향상
    - 학습과 서비스 속도를 충족
- Tensorflow 기반의 API를 오픈소스 형태로 제공

### Wide & Deep Learning Framework Overview

![](../images/paper/recommendation/wd/wd-003.png)

## Recommender system Overview

![](../images/paper/recommendation/wd/wd-004.png)

- Inference: User가 App Store 방문할 때 query 생성
- Train: Log 등 User Actions을 활용하여 모델 학습

## Wide & Deep Learning

### The Wide Component

$y = w^Tx + b$

- Generalized Linear model
- y &rarr; prediction (유저 행동여부)
- $x = [x_{1}, x_{2}, ..., x_{d}]$
    - side d의 feature vector
    - Raw input features & cross-product feature
- $w = [w_{1}, w_{2}, ..., w_{d}]$ &rarr; model parameters
- $b$ &rarr; bias

![](../images/paper/recommendation/wd/wd-005.png)

$\phi_{k}(x) = \displaystyle\prod_{i=1}^{d}x_{i}^{c_{ki}} \quad c_{ki} \in \{0, 1\}$

- $\phi_{k}(x)$ &rarr; Cross-product feature의 $k$번째 요소
- $c_{ki} \in \{0, 1\}$ &rarr; Raw feature의 $i$번째 요소가 true인지 여부
- Feature interaction 반영
- 모델에 Non-linearity 적용
    - (예시) feature가 (gender, language)로 구성되어 있고 cross-product transformation(feature)의 $k$번째를 AND (female, en)일 때, 모두 만족하면 1 아니면 0

### The Deep Component

![](../images/paper/recommendation/wd/wd-006.png)

- Features를 임베딩과 뉴럴넷에 학습
    - **Generalization**

$a^{l+1} = f(W^{(l)}a^{(l)} + b^{(l)})$

- $l$은 number of layers
- $f$는 activation function(ReLU)
- $a^{(l)}, b^{(l)}, W^{(l)}$
    - Activation, bias and model weights at $l$-th layer
- **Dense Embeddings**
    - Normal Feature에 해당하는 임베딩을 랜덤 초기화(random initialize)하고 모델 전체 학습

### Joint Training of Wide & Deep Model

![](../images/paper/recommendation/wd/wd-007.png)

- Continuous와 categorical features를 concat하여 Deep의 input a로 활용
- user install app과 impression app을 cross-product하여 Wide의 input x로 활용

![](../images/paper/recommendation/wd/wd-008-1.png)

- $P(Y=1|X)$ app을 다운받을 확률
- Sigmoid 함수의 input으로 Wide와 Deep을 합한 값을 넣어주고, 그 output이 최종 결과가 됨

## System Implementation

![](../images/paper/recommendation/wd/wd-010.png)

## Experiment Results

![](../images/paper/recommendation/wd/wd-011.png)

- Offline AUC
    - Test set의 사용자 행동결과로 성능 측정
    - AUC는 클수록 좋은 점수를 나타냄 (=ROC 커브의 아래 면적)
- Online Acquision Gain
    - 실제 사용자들의 action을 추적
    - 기존 모델 대비 application 실제 다운로드 수가 증가

![](../images/paper/recommendation/wd/wd-012.png)

- Multithreading, Split each batch into smaller batches &rarr; latency를 14ms 줄일 수 있었음
- 추천 알고리즘 성능 뿐만 아니라 Commercial Mobile App Store의 서비스까지 신경 쓴 것을 알 수 있음

## Conclusion
- Memorization의 Wide와 Generalization의 Deep을 결합한 모델을 제안
    - Wide & Deep Learning
- Linear model과 embedding-based model의 장점을 잘 조합
- 좋은 추천 알고리즘을 실제 서비스 환경에서 작동할 수 있도록 구현
- Open Source로 Tensorflow API를 구현하여 다양하게 활용