## Sistemas de recomendación de películas con TensorFlow

No es raro que al ver un vídeo (o una película) en YouTube (o Netflix) nos aparezca inmediatamente una lista de vídeos (o películas) sugeridos para ver a continuación. Lo mismo ocurre a menudo con los servicios de streaming de música digital. Uno escucha una canción en Spotify e inmediatamente recibe una lista de canciones similares, quizá del mismo género o del mismo artista.

Esta lista la elabora un modelo de aprendizaje automático de recomendaciones, a menudo denominado motor/sistema de recomendaciones. Un sistema de recomendación es más que un simple aprendizaje automático. Es necesario construir un canal de datos para recopilar la información que necesita el modelo (por ejemplo, los últimos cinco vídeos que ha visto el usuario). Esta necesidad la satisface un sistema de recomendación.

Un gran error es creer que los sistemas de recomendación se limitan a sugerir productos a los usuarios. No podría estar más lejos de la realidad. Los sistemas de recomendación no sólo sugieren productos a los usuarios, sino que también pueden sugerir productos a los usuarios. Por ejemplo, en aplicaciones de marketing, cuando hay una nueva promoción, un sistema de recomendación puede encontrar a los mil primeros clientes actuales más relevantes. Es lo que se denomina targeting. También, en la misma línea en la que Google maps sugiere la ruta que evita las autopistas de peaje mediante un sistema de recomendación, la respuesta inteligente en Gmail que sugiere posibles respuestas a un correo electrónico que uno acaba de recibir también se realiza mediante un sistema de recomendación. Los motores de búsqueda son otro gran ejemplo de cómo los motores de recomendación pueden ofrecer personalización. Las consultas de búsqueda tienen en cuenta la ubicación, el historial de usuario, las preferencias de cuenta y las búsquedas anteriores para garantizar que lo que se ofrece es lo más relevante para los usuarios.  

Por ejemplo, escribir "gigantes" en la barra de búsqueda puede arrojar resultados diferentes según dónde se encuentre el usuario. Si el usuario está en Nueva York, lo más probable es que obtenga muchos resultados sobre el equipo de fútbol americano New York Giants. Sin embargo, la misma búsqueda en San Francisco podría devolver información sobre el equipo de béisbol de San Francisco. En esencia, desde el punto de vista del usuario, los sistemas de recomendación pueden ayudar a encontrar contenidos relacionados, explorar nuevos elementos y mejorar la toma de decisiones del usuario. Desde el punto de vista del productor, ayuda a aumentar el compromiso del usuario, aprender más sobre él y controlar los cambios en su comportamiento. En definitiva, los sistemas de recomendación tienen que ver con la personalización. Implica tomar un producto que funciona para todos y personalizarlo para un usuario individual.

#### Tipos de sistemas de recomendación
Filtrado basado en el contenido:
En este tipo de marco de recomendación se utilizan los metadatos del producto disponibles en los sistemas.  Supongamos que un usuario ha visto y valorado varias películas. A algunas les ha dado un pulgar hacia arriba y a otras un pulgar hacia abajo, y queremos saber qué película de la base de datos sugerirle a continuación.

Gracias a los metadatos que tenemos sobre las películas, quizá sepamos que este usuario en concreto prefiere la ciencia ficción a las comedias de situación. Por lo tanto, empleando este tipo de sistema, podríamos utilizar esos datos para sugerir a este cliente series de ciencia ficción muy populares. Otras veces, no disponemos de las preferencias de cada usuario. Para crear un sistema de recomendación basado en el contenido, lo único que podemos necesitar es una segmentación del mercado que muestre qué películas gustan a los usuarios de distintas partes del mundo. Se argumenta que aquí no hay aprendizaje automático. Se trata de una regla sencilla que depende de que el creador del sistema de recomendación etiquete adecuadamente a las personas y los objetos. El mayor inconveniente de este método es que, para que funcione correctamente, el sistema necesita conocimientos del dominio. Aunque existen soluciones a este problema de "arranque en frío", nada puede superar completamente el efecto de la falta de información de formación. Además, debido a su naturaleza, este sistema sólo hace recomendaciones seguras.

#### Filtrado colaborativo:
En este método, en este caso no disponemos de metadatos sobre los productos; en su lugar, podemos inferir información sobre la similitud entre artículos y usuarios a partir de los datos de valoración. Por ejemplo, es posible que tengamos que guardar los datos de la película del usuario en una matriz con marcas de verificación que indiquen si el usuario vio la película completa, dejó un comentario sobre ella, posiblemente le dio una calificación de estrellas, o lo que sea que se utilice para determinar si a un determinado usuario le encantó una película dada. Como era de esperar, el tamaño de esta matriz es enorme. Un individuo sólo puede ver un pequeño número de estas películas porque puede haber millones o miles de millones de personas y cientos o millones de películas disponibles. Como resultado, la mayoría de estas matrices son a la vez enormes y dispersas.

Para aproximarse a esta enorme matriz de usuario por elemento, el filtrado colaborativo combina dos matrices más pequeñas conocidas como factores de usuario y factores de elemento. Entonces, si queremos determinar si a un usuario concreto le gustará una determinada película, todo lo que tenemos que hacer es tomar la fila que corresponde a la película y multiplicarlas para obtener la calificación prevista. A continuación, elegimos las películas que creemos que recibirán las mejores valoraciones antes de recomendarlas a los consumidores.

Lo mejor del filtrado colaborativo es que no tenemos que estar familiarizados con los metadatos de ningún elemento. Además, siempre que dispongamos de una matriz de interacción, estaremos listos y no necesitaremos segmentar por mercados a los usuarios. Dicho esto, los problemas pueden venir de la escasez y de la naturaleza descontextualizada de la función.

#### Recomendaciones basadas en el conocimiento:
En este tipo de sistema de recomendación, los datos se obtienen de encuestas a los usuarios o de la configuración introducida por los usuarios que muestra sus preferencias. Esto suele hacerse preguntando a los usuarios por sus preferencias. Una gran ventaja de las recomendaciones basadas en el conocimiento es que no necesitan datos sobre la interacción usuario-artículo. Al contrario, simplemente puede basarse en datos centrados en el usuario para relacionarlo con otros usuarios y recomendar cosas similares que les hayan gustado a esos usuarios. Además, las recomendaciones basadas en el conocimiento utilizan, en última instancia, datos de alta fidelidad, porque los usuarios de interés han informado por sí mismos de su información y sus preferencias. Como tales, es justo suponer que son ciertos. Sin embargo, en la otra cara de la moneda, puede plantearse un reto importante cuando los usuarios no se sienten cómodos compartiendo sus preferencias. La falta de datos de los usuarios puede ser un problema por cuestiones de privacidad. Debido a estos problemas de privacidad, puede ser más fácil probar otros métodos de recomendación que no estén basados en el conocimiento.

## Demo
Como ejemplo, en este tutorial, crearás un sistema práctico de recomendación de películas utilizando TensorFlow. En esencia, TensorFlow te permite desarrollar y entrenar modelos utilizando Python (o JavaScript), y desplegar fácilmente en la nube, on-prem, en el navegador, o en el dispositivo sin importar el lenguaje de programación que utilices. Para esta demostración vamos a utilizar los cuadernos GPU gratuitos de Papersapce Gradient.

Antes de continuar, es importante tener en cuenta que los sistemas de recomendación del mundo real suelen constar de dos etapas:

La etapa de recuperación: Esta etapa se utiliza para seleccionar un conjunto inicial de películas candidatas de entre todas las posibles. El objetivo principal de este modelo es desterrar de forma eficaz todos los candidatos que no interesan al usuario. La etapa de recuperación suele utilizar el filtrado colaborativo.
La fase de clasificación: Esta etapa toma los resultados obtenidos del modelo de recuperación y los ajusta para seleccionar el mejor puñado posible de recomendaciones de películas. Su tarea consiste en reducir el conjunto de películas que pueden interesar al usuario a una lista de posibles candidatas.
Modelos de recuperación

Como en todos los sistemas de recomendación basados en el filtrado colaborativo, estos modelos suelen estar compuestos por dos submodelos:

* Un modelo de consulta que calcula la representación de la consulta (normalmente un vector de incrustación de dimensiones fijas) utilizando características.
* Un modelo candidato que calcula la representación de la película candidata (un vector de igual tamaño) utilizando las características de las películas.

Los resultados de los dos modelos se multiplican para obtener una puntuación de afinidad entre la película candidata y la consulta; las puntuaciones más altas expresan una mejor correspondencia entre la película candidata y la consulta. En este tutorial, vamos a construir y entrenar un sistema de recomendación utilizando el conjunto de datos Movielens con TensorFlow. El conjunto de datos Movielens es un conjunto de datos del grupo de investigación GroupLens. Contiene un conjunto de valoraciones dadas a películas por un conjunto de usuarios recogidas durante varios periodos de tiempo, dependiendo del tamaño del conjunto. Es muy popular en las investigaciones sobre sistemas de recomendación.

Estos datos pueden verse de dos maneras. Pueden interpretarse como las películas que los usuarios han visto (y puntuado) y las que no. También puede interpretarse como el grado de satisfacción de los usuarios con las películas que han visto. El primer punto de vista ve el conjunto de datos como una forma de retroalimentación implícita, en la que el historial de visionado de los usuarios nos dice qué cosas prefieren ver y cuáles preferirían no ver. El segundo punto de vista puede traducir el conjunto de datos como una forma de retroalimentación explícita que puede decir aproximadamente cuánto le ha gustado una película a un usuario que la ha visto fijándose en la calificación que le ha dado.

Para el sistema de recuperación, en el que el modelo predice un conjunto de películas del catálogo que es probable que vea el usuario, los datos implícitos serán tradicionalmente más útiles aquí. Por ello, trataremos Movielens como un sistema implícito. En esencia, cada película que un usuario ha visto es un ejemplo positivo, y cada película que no ha visto es un ejemplo negativo implícito.

In [None]:
!pip install -q --upgrade tensorflow-recommenders
!pip install -q --upgrade tensorflow-datasets
!pip install -q --upgrade scann

In [3]:
import os
import pprint
import tempfile

from typing import Dict, Text

import numpy as np
import tensorflow as tf
import tensorflow_datasets as tfds

import tensorflow_recommenders as tfrs

<function tensorflow.python.platform.tf_logging.get_logger()>

### Obtener los datos y dividirlos en un conjunto de entrenamiento y otro de prueba

In [4]:
# Ratings data.
ratings = tfds.load("movielens/100k-ratings", split="train")
# Features of all the available movies.
movies = tfds.load("movielens/100k-movies", split="train")

La variable calificaciones contiene los datos de las calificaciones, mientras que la variable películas contiene las características de todas las películas disponibles.  El conjunto de datos de valoraciones devuelve un diccionario con el identificador de la película, el identificador del usuario, la valoración asignada, la marca de tiempo, la información de la película y la información del usuario, como se muestra a continuación. Mientras que el conjunto de datos de películas contiene el id de la película, el título de la película y datos sobre los géneros a los que pertenece. Los géneros se codifican con etiquetas enteras. Es importante señalar que, dado que el conjunto de datos Movielens no tiene divisiones predefinidas, todos sus datos están bajo la división de tren.

In [5]:
ratings = ratings.map(lambda x: {
    "movie_title": x["movie_title"],
    "user_id": x["user_id"],
})
movies = movies.map(lambda x: x["movie_title"])

In [6]:
tf.random.set_seed(42)
shuffled = ratings.shuffle(100_000, seed=42, reshuffle_each_iteration=False)

train = shuffled.take(80_000)
test = shuffled.skip(80_000).take(20_000)

Para ajustar y evaluar el modelo, lo dividiremos en un conjunto de entrenamiento y otro de evaluación. Utilizaremos una división aleatoria, colocando el 80% de las valoraciones en el conjunto de entrenamiento y el 20% en el conjunto de prueba.

Llegados a este punto, nos gustaría conocer los identificadores únicos de usuario y los títulos de las películas presentes en los datos. Esto es importante porque necesitamos poder asignar los valores brutos de las características categóricas a vectores de incrustación en los modelos. Para lograrlo, necesitamos un vocabulario que asigne un valor de característica en bruto a un número entero en un rango contiguo: esto nos permite buscar las incrustaciones correspondientes en las tablas de incrustación.

In [7]:
movie_titles = movies.batch(1_000)
user_ids = ratings.batch(1_000_000).map(lambda x: x["user_id"])

unique_movie_titles = np.unique(np.concatenate(list(movie_titles)))
unique_user_ids = np.unique(np.concatenate(list(user_ids)))

### Implantar un modelo de recuperación

In [11]:
embedding_dimension = 32
user_model = tf.keras.Sequential([
    tf.keras.layers.StringLookup(
      vocabulary=unique_user_ids, mask_token=None),
  tf.keras.layers.Embedding(len(unique_user_ids) + 1, embedding_dimension)
])

Dado que los valores más altos de las dimensiones de incrustación corresponderán a modelos que pueden ser más precisos, pero también serán más lentos de ajustar y más propensos al sobreajuste, la dimensionalidad de la consulta y las representaciones candidatas se establecen en **32**. Para definir el modelo en sí, se utilizarán las capas de preprocesamiento de keras para convertir los identificadores de usuario en números enteros y, a continuación, convertirlos en incrustaciones de usuario mediante una capa de incrustación.

Haremos lo mismo con la torre de candidatos a película.

In [12]:
movie_model = tf.keras.Sequential([
  tf.keras.layers.StringLookup(
      vocabulary=unique_movie_titles, mask_token=None),
  tf.keras.layers.Embedding(len(unique_movie_titles) + 1, embedding_dimension)
])

En los datos de entrenamiento, observamos que tenemos pares positivos de usuario y películas. Para evaluar la calidad de nuestro modelo, compararemos la puntuación de afinidad que el modelo calcula para este par con las puntuaciones de todos los demás candidatos posibles. Esto significa que si la puntuación para el par positivo es mayor que para todos los demás candidatos, su modelo es muy preciso. Para comprobarlo, podemos utilizar la métrica tfrs.metrics.FactorizedTopK. Esta métrica tiene un argumento obligatorio: el conjunto de datos de candidatos que utilizó como negativos implícitos para la evaluación. Esto implica el conjunto de datos de películas que convertirá en incrustaciones mediante el modelo de películas.

In [13]:
metrics = tfrs.metrics.FactorizedTopK(
  candidates=movies.batch(128).map(movie_model)
)

Además, tenemos que comprobar la pérdida utilizada para entrenar nuestro modelo. Lo bueno es que tfrs tiene varias capas de pérdida y tareas para esto. Podemos utilizar el objeto de tarea Recuperación, que es una envoltura de conveniencia que agrupa la función de pérdida y el cálculo métrico con las siguientes líneas de código.


In [14]:
task = tfrs.tasks.Retrieval(
  metrics=metrics
)

Con todo eso configurado, ahora podemos ponerlo todo junto en un modelo *tfrs.models.Model*, se utilizará una clase de modelo base de tfrs para simplificar los modelos de construcción. La clase base tfrs.Model existe de tal manera que nos permite calcular tanto las pérdidas de entrenamiento como las de prueba usando el mismo método. 

Todo lo que tendremos que hacer es configurar los componentes en el método __init__ y luego implementar el método **compute_loss** usando las características sin procesar y devolviendo un valor de pérdida. A partir de entonces, utilizaremos el modelo base para crear el ciclo de entrenamiento adecuado para que se ajuste a su modelo.

In [15]:
class MovielensModel(tfrs.Model):

  def __init__(self, user_model, movie_model):
    super().__init__()
    self.movie_model: tf.keras.Model = movie_model
    self.user_model: tf.keras.Model = user_model
    self.task: tf.keras.layers.Layer = task

  def compute_loss(self, features: Dict[Text, tf.Tensor], training=False) -> tf.Tensor:
    user_embeddings = self.user_model(features["user_id"])
    positive_movie_embeddings = self.movie_model(features["movie_title"])
    return self.task(user_embeddings, positive_movie_embeddings)

El método compute_loss comienza seleccionando las características del usuario y las pasa al modelo de usuario. A continuación, selecciona las características de la película y las pasa al modelo de película, obteniendo de vuelta los embeddings.

### Ajuste y evaluación.

Tras definir el modelo, utilizaremos las rutinas estándar de ajuste y evaluación de Keras para ajustar y evaluar el modelo.

In [16]:
model = MovielensModel(user_model, movie_model)
model.compile(optimizer=tf.keras.optimizers.Adagrad(learning_rate=0.1))
cached_train = train.shuffle(100_000).batch(8192).cache()
cached_test = test.batch(4096).cache()
model.fit(cached_train, epochs=3)

Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x7fe749fa93a0>

Nuestro modelo se entrenará en tres épocas. Podemos ver que, a medida que el modelo se entrena, la pérdida disminuye y se actualiza un conjunto de métricas de recuperación top-k. 

Estas métricas nos permiten saber si el verdadero positivo se encuentra en el top-k de elementos recuperados de todo el conjunto de candidatos. Tenga en cuenta que, en este tutorial, evaluaremos las métricas tanto durante el entrenamiento como durante la evaluación. Debido a que esto puede ser bastante lento con grandes conjuntos de candidatos, puede ser prudente desactivar el cálculo de métricas en el entrenamiento, y sólo ejecutarlo en la evaluación.

Por último, podemos evaluar nuestro modelo en el conjunto de pruebas:

In [17]:
model.evaluate(cached_test, return_dict=True)



{'factorized_top_k/top_1_categorical_accuracy': 0.0009500000160187483,
 'factorized_top_k/top_5_categorical_accuracy': 0.010700000450015068,
 'factorized_top_k/top_10_categorical_accuracy': 0.021800000220537186,
 'factorized_top_k/top_50_categorical_accuracy': 0.12475000321865082,
 'factorized_top_k/top_100_categorical_accuracy': 0.2373500019311905,
 'loss': 28241.87109375,
 'regularization_loss': 0,
 'total_loss': 28241.87109375}

Hay que señalar que el rendimiento del conjunto de pruebas no es tan bueno como el del conjunto de entrenamiento. La razón no es descabellada. Nuestro modelo funcionará mejor con los datos que ha visto antes. Además, el modelo sólo vuelve a recomendar algunas de las películas que los usuarios ya han visto.

### Haciendo predicciones

Ya que tenemos un modelo funcionando, podemos empezar a hacer predicciones. Para ello utilizaremos la capa *tfrs.layers.factorized_top_k.BruteForce* La utilizaremos para tomar las características de consulta en bruto y luego recomendar películas de todo el conjunto de datos de películas. Finalmente, obtendremos nuestras recomendaciones.


In [18]:
index = tfrs.layers.factorized_top_k.BruteForce(model.user_model)
index.index_from_dataset(
  tf.data.Dataset.zip((movies.batch(100), movies.batch(100).map(model.movie_model)))
)

_, titles = index(tf.constant(["46"]))
print(f"Recommendations for user 46: {titles[0, :3]}")

Recommendations for user 46: [b'Game, The (1997)' b'Welcome To Sarajevo (1997)' b'Amistad (1997)']


En el bloque de código anterior, obtendremos la recomendación para el *Usuario 46*.

### Exportar el modelo

Intuitivamente, la capa de Fuerza Bruta es demasiado lenta para servir un modelo con muchos candidatos. Este proceso se acelerará utilizando un índice de recuperación aproximado. Mientras que el servicio en el modelo de recuperación tiene dos componentes (es decir, un modelo de consulta de servicio y un modelo de candidato de servicio), con tfrs, ambos componentes pueden empaquetarse en un único modelo que podemos exportar. Este modelo toma el identificador de usuario en bruto y devuelve los títulos de las mejores películas para ese usuario. Para ello, vamos a exportar el modelo a un formato SavedModel que hace que sea posible servir utilizando TensorFlow Serving.

In [23]:
with tempfile.TemporaryDirectory() as tmp:
    path = os.path.join("./", "model")
    tf.saved_model.save(index, path)
    loaded = tf.saved_model.load(path)
    scores, titles = loaded(["42"])
    print(f"Recommendations: {titles[0][:3]}")



Recommendations: [b'Rudy (1993)' b'Bridges of Madison County, The (1995)'
 b'101 Dalmatians (1996)']


Para obtener recomendaciones eficientes de millones de películas candidatas, utilizaremos una dependencia opcional de TFRS conocida como la capa TFRS scann. El paquete se instaló por separado al principio del tutorial llamando a *!pip install -q scann*. Esta capa puede realizar búsquedas aproximadas que harán que la recuperación sea ligeramente menos precisa, mientras que se mantiene órdenes de magnitud más rápida en grandes conjuntos de candidatos.

In [24]:
scann_index = tfrs.layers.factorized_top_k.ScaNN(model.user_model)
scann_index.index_from_dataset(
  tf.data.Dataset.zip((movies.batch(100), movies.batch(100).map(model.movie_model)))
)

_, titles = scann_index(tf.constant(["42"]))
print(f"Recommendations for user 42: {titles[0, :3]}")

Recommendations for user 42: [b'Grumpier Old Men (1995)' b'Aristocats, The (1970)'
 b"Preacher's Wife, The (1996)"]


Por último, exportaremos el modelo de consulta, guardaremos el índice, lo volveremos a cargar y le pasaremos un identificador de usuario para obtener los títulos de películas más populares.

In [25]:
with tempfile.TemporaryDirectory() as tmp:
  path = os.path.join("./", "model_final")

  tf.saved_model.save(
      index,
      path,
      options=tf.saved_model.SaveOptions(namespace_whitelist=["Scann"])
  )
  loaded = tf.saved_model.load(path)

  scores, titles = loaded(["42"])

  print(f"Recommendations: {titles[0][:3]}")



Recommendations: [b'Rudy (1993)' b'Bridges of Madison County, The (1995)'
 b'101 Dalmatians (1996)']


### Modelos de clasificación

Con el modelo de clasificación, los dos primeros pasos (es decir, importar las bibliotecas necesarias y dividir los datos en conjuntos de entrenamiento y de prueba) son exactamente iguales a los del modelo de recuperación.

En el caso del modelo de clasificación, las limitaciones de eficacia son muy distintas a las del modelo de recuperación. Por tanto, tenemos más libertad a la hora de elegir la arquitectura.  Para las tareas de clasificación se suele utilizar un modelo compuesto por múltiples capas densas apiladas. A continuación lo implementaremos:

*Nota: Este modelo tomará los ID de usuario y los títulos de las películas como datos de entrada y, a continuación, emitirá una valoración prevista.*

In [26]:
class RankingModel(tf.keras.Model):

  def __init__(self):
    super().__init__()
    embedding_dimension = 32

    # Compute embeddings for users
    self.user_embeddings = tf.keras.Sequential([
      tf.keras.layers.StringLookup(
        vocabulary=unique_user_ids, mask_token=None),
      tf.keras.layers.Embedding(len(unique_user_ids) + 1, embedding_dimension)
    ])

    # Compute embeddings for movies
    self.movie_embeddings = tf.keras.Sequential([
      tf.keras.layers.StringLookup(
        vocabulary=unique_movie_titles, mask_token=None),
      tf.keras.layers.Embedding(len(unique_movie_titles) + 1, embedding_dimension)
    ])

    # Compute predictions
    self.ratings = tf.keras.Sequential([
      # Learn multiple dense layers.
      tf.keras.layers.Dense(256, activation="relu"),
      tf.keras.layers.Dense(64, activation="relu"),
      # Make rating predictions in the final layer.
      tf.keras.layers.Dense(1)
  ])

  def call(self, inputs):

    user_id, movie_title = inputs

    user_embedding = self.user_embeddings(user_id)
    movie_embedding = self.movie_embeddings(movie_title)

    return self.ratings(tf.concat([user_embedding, movie_embedding], axis=1))

Para evaluar la pérdida utilizada para entrenar nuestro modelo, utilizaremos el objeto de tarea Ranking que combina la función de pérdida con el cálculo métrico.  Lo utilizaremos junto con la pérdida MeanSquaredError Keras para predecir las valoraciones.

In [27]:
task = tfrs.tasks.Ranking(
  loss = tf.keras.losses.MeanSquaredError(),
  metrics=[tf.keras.metrics.RootMeanSquaredError()]
)

Al reunirlo todo en un modelo de clasificación completo, tenemos:

In [29]:
class MovielensModel(tfrs.models.Model):

  def __init__(self):
    super().__init__()
    self.ranking_model: tf.keras.Model = RankingModel()
    self.task: tf.keras.layers.Layer = tfrs.tasks.Ranking(
      loss = tf.keras.losses.MeanSquaredError(),
      metrics=[tf.keras.metrics.RootMeanSquaredError()]
    )

  def call(self, features: Dict[str, tf.Tensor]) -> tf.Tensor:
    return self.ranking_model(
        (features["user_id"], features["movie_title"]))

  def compute_loss(self, features: Dict[Text, tf.Tensor], training=False) -> tf.Tensor:
    labels = features.pop("user_rating")

    rating_predictions = self(features)
    return self.task(labels=labels, predictions=rating_predictions)

### Ajuste y evaluación del modelo de clasificación

Una vez definido el modelo, utilizaremos las rutinas estándar de ajuste y evaluación de Keras para ajustar y evaluar el modelo de clasificación.

In [None]:
model = MovielensModel()
model.compile(optimizer=tf.keras.optimizers.Adagrad(learning_rate=0.1))
cached_train = train.shuffle(100_000).batch(8192).cache()
cached_test = test.batch(4096).cache()
model.fit(cached_train, epochs=3)
model.evaluate(cached_test, return_dict=True)

Con el modelo entrenado en tres épocas, probaremos el modelo de clasificación calculando predicciones para un conjunto de películas y clasificándolas en función de las predicciones:

In [None]:
test_ratings = {}
test_movie_titles = ["M*A*S*H (1970)", "Dances with Wolves (1990)", "Speed (1994)"]
for movie_title in test_movie_titles:
  test_ratings[movie_title] = model({
      "user_id": np.array(["42"]),
      "movie_title": np.array([movie_title])
  })

print("Ratings:")
for title, score in sorted(test_ratings.items(), key=lambda x: x[1], reverse=True):
  print(f"{title}: {score}")

### Exportar para servir y convertir el modelo a TensorFlow Lite

Un sistema de recomendación no sirve de nada si no puede ser utilizado por los usuarios. Por ello, debemos exportar el modelo para servirlo. Después, podemos cargarlo de nuevo y realizar predicciones.

In [None]:
tf.saved_model.save(model, "export")
loaded = tf.saved_model.load("export")

loaded({"user_id": np.array(["42"]), "movie_title": ["Speed (1994)"]}).numpy()

Para mejorar la privacidad del usuario y reducir la latencia, utilizaremos TensorFlow Lite para ejecutar el modelo de clasificación entrenado en los dispositivos, a pesar de que TensorFlow Recommenders está pensado principalmente para realizar recomendaciones del lado del servidor.

In [None]:
converter = tf.lite.TFLiteConverter.from_saved_model("export")
tflite_model = converter.convert()
open("converted_model.tflite", "wb").write(tflite_model)

### Conclusión

Ahora deberíamos saber qué es un recomendador, cómo funciona, la diferencia entre feedback implícito y explícito y cómo construir un sistema de recomendación con algoritmos de filtrado colaborativo. Por nuestra cuenta, podemos modificar ajustes de la red como la dimensión de las capas ocultas para ver los cambios correspondientes. Como regla general, estas dimensiones dependen de la complejidad de las funciones que queremos aproximar. Si las capas ocultas son demasiado grandes, nuestro modelo corre el riesgo de sobreajustarse y, por tanto, de perder la capacidad de generalizar bien en el conjunto de pruebas. Por el contrario, si las capas ocultas son demasiado pequeñas, la red neuronal se quedará corta de parámetros para ajustarse bien a los datos.