# Рекомендательные системы. Гибридные рекомендательные системы.

> На этом практическом занятии мы с вами сделаем следующее:
- Посмотри как работает LightFM.
- Сравним качество и скорость BRP и WARP.
- Построим простейший сервис для рекомендаций используя LightFM.

## Импортируем библиотеку LightFM

In [None]:
import numpy as np
import pandas as pd
import time

%matplotlib inline
import matplotlib
import matplotlib.pyplot as plt

from lightfm import LightFM
from lightfm.datasets import fetch_movielens
from lightfm.evaluation import auc_score
from lightfm.evaluation import precision_at_k
from lightfm.datasets import fetch_movielens

from flask import Flask, jsonify, request

In [None]:
movielens = fetch_movielens()
train, test = movielens['train'], movielens['test']

In [None]:
train.todense()

## Сравним качество BRP и WARP

Зададим общие гиперпараметры

In [None]:
alpha = 1e-05
epochs = 70
num_components = 32

In [None]:
warp_model = LightFM(no_components=num_components,
                    loss='warp',
                    learning_schedule='adagrad',
                    max_sampled=100,
                    user_alpha=alpha,
                    item_alpha=alpha)

In [None]:
bpr_model = LightFM(no_components=num_components,
                    loss='bpr',
                    learning_schedule='adagrad',
                    user_alpha=alpha,
                    item_alpha=alpha)

In [None]:
logistic_model = 
#################
# YOUR CODE HERE
#################

In [None]:
warp_duration = []
bpr_duration = []
logistic_duration = []
warp_auc = []
bpr_auc = []
logistic_auc = []

In [None]:
for epoch in range(epochs):
    start = time.time()
    warp_model.fit_partial(train, epochs=1)
    warp_duration.append(time.time() - start)
    warp_auc.append(auc_score(warp_model, test, train_interactions=train).mean())

for epoch in range(epochs):
    start = time.time()
    bpr_model.fit_partial(train, epochs=1)
    bpr_duration.append(time.time() - start)
    bpr_auc.append(auc_score(bpr_model, test, train_interactions=train).mean())
    
#################
# YOUR CODE HERE
#################

#### AUC

Посмотрим на результаты обучения. Видно, что WARP гораздо точнее BRP. Видно также, что после 10 эпох качество снижается - модель начинает переобучаться.

In [None]:
x = np.arange(epochs)
plt.figure(figsize = (12, 8))
plt.plot(x, np.array(warp_auc))
plt.plot(x, np.array(bpr_auc))
#################
# YOUR CODE HERE
#################
plt.legend(['WARP AUC', 'BPR AUC' , 'Logistic AUC'], loc='upper right') #
plt.show()

#### Скорость

BRP обучается быстрее. Видно также, что чем ближе к концу обучения, тем WARP обучается дольше. Это связано с тем, что чем лучше модель обучилась, тем больше надо перебрать негативных объектов, чтобы найти пример нарушения ранжирования.

> max_sampled гиперпарамеетр в WARP отвечает за максимальное количество попыток найти нарушение ранжирования.

In [None]:
x = np.arange(epochs)
plt.figure(figsize = (12, 8))
plt.plot(x, np.array(warp_duration))
plt.plot(x, np.array(bpr_duration))
#################
# YOUR CODE HERE
#################
plt.legend(['WARP duration', 'BPR duration', 'Logistic duration'], loc='upper right')
plt.show()

## По традиции запустим сервис рекомендаций

In [None]:
data = fetch_movielens(min_rating=4.0)

In [None]:
#################
# YOUR CODE HERE
#################
# необходимо определить модель, обучить и вывести метрику precision

In [None]:
# create app
app = Flask(__name__)

In [None]:
# API endpoint
@app.route('/')
def recom_for_user():
    user_id = request.args.get('user_id', default = 1, type = int)
    
    n_users, n_items = data['train'].shape
    known_positives = data['item_labels'][data['train'].tocsr()[user_id].indices]
    scores = model.predict(user_id, np.arange(n_items))
    top_items = data['item_labels'][np.argsort(-scores)][:10]
    
    movie_scores = zip(top_items, scores)
    
    return jsonify(
        movies=[
            {
                "id": i,
                "score": float(s),
            }
            for i, s in movie_scores
        ],
    )

In [None]:
app.run(host="0.0.0.0", port=5000)