# 推荐系统概述

在过去十年中，互联网已经演变成一个大规模在线服务的平台，这深刻地改变了我们交流、阅读新闻、购买产品和观看电影的方式。同时，在线提供的前所未有的商品数量（我们用*商品*一词来指代电影、新闻、书籍和产品）需要一个系统来帮助我们发现我们偏好的商品。因此，推荐系统是强大的信息过滤工具，可以促进个性化服务，并为个别用户提供量身定制的体验。简而言之，推荐系统在利用可用数据使选择变得可管理方面发挥着关键作用。如今，推荐系统已成为诸如亚马逊、Netflix和YouTube等许多在线服务提供商的核心。回想一下亚马逊推荐的深度学习书籍的例子 :numref:`subsec_recommender_systems`。使用推荐系统的好处是两方面的：一方面，它可以大大减少用户寻找商品的努力，并缓解信息过载的问题。另一方面，它能为在线服务提供商增加商业价值，并成为重要的收入来源。本章将介绍推荐系统的基本概念、经典模型以及最近结合深度学习的进展，还有实现的例子。

![推荐过程示意图](../img/rec-intro.svg)


## 协同过滤

我们从推荐系统中的一个重要概念——协同过滤(CF)开始我们的旅程，这一术语最早由Tapestry系统提出 :cite:`Goldberg.Nichols.Oki.ea.1992`，指的是“人们合作帮助彼此执行过滤过程以处理大量的电子邮件和发布到新闻组的消息”。这个术语后来被赋予了更多的含义。广义上讲，它是利用多个用户、代理和数据源之间的协作技术来过滤信息或模式的过程。自其出现以来，已提出了许多形式的CF方法。

总体来说，CF技术可以分为：基于记忆的CF、基于模型的CF及其混合型 :cite:`Su.Khoshgoftaar.2009`。代表性的基于记忆的CF技术包括最近邻方法，如基于用户的CF和基于项目的CF :cite:`Sarwar.Karypis.Konstan.ea.2001`。潜在因子模型，例如矩阵分解，是基于模型的CF的例子。由于基于记忆的CF计算相似度值依赖于共同项目，因此在处理稀疏和大规模数据时存在局限性。而基于模型的方法因其更好地处理稀疏性和可扩展性能力而变得更受欢迎。许多基于模型的CF方法可以通过神经网络进行扩展，从而在深度学习的计算加速下产生更灵活和可扩展的模型 :cite:`Zhang.Yao.Sun.ea.2019`。一般来说，CF仅使用用户-项目交互数据来进行预测和推荐。除了CF外，基于内容和基于上下文的推荐系统也很有用，它们能够结合物品/用户的描述信息以及时间戳、位置等上下文信号。显然，当我们有不同输入数据时，可能需要调整模型类型/结构。



## 显式反馈与隐式反馈

为了了解用户的偏好，系统应该收集他们的反馈。反馈可以是显式的也可以是隐式的 :cite:`Hu.Koren.Volinsky.2008`。例如，[IMDb](https://www.imdb.com/) 收集了一星到十星的电影评分。YouTube提供了点赞和点踩按钮供用户表达偏好。显然，收集显式反馈要求用户主动表明兴趣。然而，并非所有用户都愿意对产品进行评分，因此显式反馈并不总是容易获得。相比之下，隐式反馈通常更容易获得，因为它主要关注建模隐含行为，比如用户点击。因此，许多推荐系统围绕隐式反馈构建，通过观察用户行为间接反映用户的意见。隐式反馈的形式多样，包括购买历史、浏览历史、观看记录甚至鼠标移动。例如，一位购买了许多同一作者书籍的用户很可能喜欢该作者。需要注意的是，隐式反馈本质上是嘈杂的。我们只能*猜测*他们的偏好和真实动机。用户观看了某部电影并不一定表示对该电影持正面看法。



## 推荐任务

过去几十年里，研究了多种推荐任务。根据应用领域，有电影推荐、新闻推荐、兴趣点推荐 :cite:`Ye.Yin.Lee.ea.2011` 等等。还可以根据反馈类型和输入数据来区分任务，例如，评分预测任务旨在预测显式评分。Top-$n$ 推荐（项目排名）基于隐式反馈为每个用户个人化地对所有项目进行排序。如果还包括时间戳信息，我们可以构建序列感知推荐 :cite:`Quadrana.Cremonesi.Jannach.2018`。另一个流行的任务是点击率预测，这也基于隐式反馈，但可以利用各种分类特征。向新用户推荐以及向现有用户推荐新项目被称为冷启动推荐 :cite:`Schein.Popescul.Ungar.ea.2002`。



## 小结

* 推荐系统对个人用户和行业都很重要。协同过滤是推荐中的一个关键概念。
* 反馈有两种类型：隐式反馈和显式反馈。过去十年中探索了许多推荐任务。

## 练习

1. 你能解释推荐系统如何影响你的日常生活吗？
2. 你认为哪些有趣的推荐任务值得研究？

[讨论](https://discuss.d2l.ai/t/398)