
# 推薦システムの概要

過去 10 年間で、インターネットは大規模なオンライン サービスのプラットフォームに進化し、私たちのコミュニケーション方法、ニュースの読み方、商品の購入方法、映画の視聴方法が大きく変わりました。その一方で、前例のない数のアイテム (映画、ニュース、書籍、製品を指す*言葉*としてアイテムという用語を使用します) がオンラインで提供されているため、好みのアイテムを見つけるのに役立つシステムが必要です。したがって、レコメンダー システムは、パーソナライズされたサービスを促進し、個々のユーザーに合わせたエクスペリエンスを提供できる強力な情報フィルタリング ツールです。つまり、レコメンダー システムは、利用可能な豊富なデータを活用して選択を管理しやすくする上で極めて重要な役割を果たします。現在、レコメンダー システムは、Amazon、Netflix、YouTube などの多くのオンライン サービス プロバイダーの中核となっています。 :numref: `subsec_recommender_systems`で Amazon が推奨する深層学習書籍の例を思い出してください。レコメンダー システムを採用する利点は 2 つあります。1 つは、ユーザーがアイテムを見つける労力を大幅に軽減し、情報過多の問題を軽減できることです。一方で、オンライン サービス プロバイダーにとってはビジネス価値を高めることができ、重要な収益源となります。この章では、レコメンダー システムの分野における基本概念、古典的なモデル、ディープ ラーニングの最近の進歩を実装例とともに紹介します。

![](../img/rec-intro.svg)

## 協調フィルタリング

私たちは、レコメンダー システムにおける重要な概念から旅を始めます。協調フィルタリング (CF) は、タペストリー システム (引用: `Goldberg.Nichols.Oki.ea.1992` ) によって最初に作られた造語で、「人々が協力して互いに助け合うこと」を指します。ニュースグループに投稿される大量の電子メールやメッセージを処理するために、フィルタリング プロセスを実行します。」今期はさらに感覚が豊かになりました。広い意味では、複数のユーザー、エージェント、データ ソース間のコラボレーションを伴う技術を使用して、情報またはパターンをフィルタリングするプロセスです。 CF にはその出現以来、さまざまな形式があり、数多くの CF 手法が提案されています。

全体として、CF 技術は、メモリベースの CF、モデルベースの CF、およびそれらのハイブリッドに分類できます:cite: `Su.Khoshgoftaar.2009` 。代表的なメモリベースの CF 手法は、ユーザーベースの CF やアイテムベースの CF などの最近傍ベースの CF です (引用: `Sarwar.Karypis.Konstan.ea.2001` )。行列分解などの潜在因子モデルは、モデルベースの CF の例です。メモリベースの CF は、共通項目に基づいて類似度値を計算するため、疎で大規模なデータを扱うには制限があります。モデルベースの手法は、スパース性とスケーラビリティを処理する機能が優れているため、より人気が高まっています。多くのモデルベースの CF アプローチはニューラル ネットワークで拡張でき、ディープ ラーニングの計算高速化により、より柔軟でスケーラブルなモデルを実現できます (cite: `Zhang.Yao.Sun.ea.2019` )。一般に、CF は予測と推奨を行うためにユーザーとアイテムのインタラクション データのみを使用します。 CF に加えて、コンテンツベースおよびコンテキストベースの推奨システムも、アイテム/ユーザーのコンテンツ説明と、タイムスタンプや場所などのコンテキスト信号を組み込むのに役立ちます。明らかに、異なる入力データが利用可能な場合には、モデルのタイプ/構造を調整する必要があるかもしれません。

## 明示的なフィードバックと暗黙的なフィードバック

ユーザーの好みを知るために、システムはユーザーからのフィードバックを収集します。フィードバックは明示的または暗黙的のいずれかです。 :cite: `Hu.Koren.Volinsky.2008` 。たとえば、 [IMDb は](https://www.imdb.com/)、映画の 1 つ星から 10 つ星までの星評価を収集します。 YouTube では、ユーザーが好みを示すための親指ボタンと親指ボタンを提供しています。明示的なフィードバックを収集するには、ユーザーが積極的に興味を示す必要があることは明らかです。それにもかかわらず、多くのユーザーは製品を評価することに消極的であるため、明示的なフィードバックが常にすぐに得られるわけではありません。比較的言えば、暗黙的なフィードバックは主にユーザーのクリックなどの暗黙的な動作のモデル化に関係しているため、多くの場合容易に利用できます。そのため、多くのレコメンダー システムは、ユーザーの行動を観察することでユーザーの意見を間接的に反映する暗黙的なフィードバックを中心としています。暗黙のフィードバックには、購入履歴、閲覧履歴、時計、さらにはマウスの動きなど、さまざまな形があります。たとえば、同じ著者の書籍を多数購入したユーザーは、その著者が好きである可能性があります。暗黙的なフィードバックは本質的にノイズが多いことに注意してください。彼らの好みと真の動機*を推測する*ことしかできません。映画を見たユーザーが、必ずしもその映画に対して肯定的な意見を示しているわけではありません。

## 推奨タスク

過去数十年にわたり、数多くの推奨タスクが研究されてきました。アプリケーションのドメインに基づいて、映画の推奨、ニュースの推奨、興味のある場所の推奨:cite: `Ye.Yin.Lee.ea.2011`などがあります。フィードバックと入力データのタイプに基づいてタスクを区別することも可能です。たとえば、評価予測タスクは明示的な評価を予測することを目的としています。 Top-$n$ レコメンデーション (アイテム ランキング) では、暗黙的なフィードバックに基づいて、各ユーザーのすべてのアイテムが個人的にランク付けされます。タイムスタンプ情報も含まれている場合は、シーケンスを意識した推奨事項を構築できます (cite: `Quadrana.Cremonesi.Jannach.2018` )。もう 1 つの一般的なタスクはクリックスルー率予測と呼ばれるもので、これも暗黙的なフィードバックに基づいていますが、さまざまなカテゴリ特徴を利用できます。新規ユーザーへの推奨、および既存ユーザーへの新規アイテムの推奨は、コールドスタート推奨と呼ばれます:cite: `Schein.Popescul.Ungar.ea.2002` 。

## まとめ
- レコメンダー システムは、個々のユーザーや業界にとって重要です。協調フィルタリングはレコメンデーションにおける重要な概念です。
- フィードバックには、暗黙的フィードバックと明示的フィードバックの 2 種類があります。過去 10 年間に、数多くの推奨タスクが検討されてきました。

## 演習
1. レコメンダーシステムがあなたの日常生活にどのような影響を与えるか説明していただけますか?
1. どのような興味深い推奨タスクを調査できると思いますか?

[ディスカッション](https://discuss.d2l.ai/t/398)
