-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[2023/06/21]Machine Learning 輪講 #200
Comments
Debiased Offline Evaluation of Recommender Systems: A Weighted-Sampling Approach推薦システムの評価をするときに、データにバイアスがあるとモデルの性能を正確に測ることができないという課題をデータ品質側から解決しようとした論文。ここでフォーカスしているバイアスは、「データ欠損の非ランダム性」。例えばECサイトでいうと人気アイテムにはユーザは良くインタラクションするが、そうではないアイテムにはあまりインタラクションしないのでアイテムの人気度でデータセットの欠損パターンにバイアスがかかる。 この論文では、データセット全体から評価に使うデータセットをサンプリングする方法について提案している。 アイデア自体は非常にシンプルで、理想的な状態(MAR; Missing At Random)よりもあるユーザ or アイテムがサンプリングされにくい状態(MNAR; Missing Not At Random)になっていればウェイトを掛けてサンプリング確率を上げる、逆なら下げるということをしている。 MARとMNARデータが両方あるデータセットを使って提案手法(WTD, WTD_H)を評価。評価値がMARでの値(Y^gt)とどれだけ乖離するかまとめている(Recall@10)。
|
A First Look at LLM-Powered Generative News Recommendation大規模言語モデルのセマンティック知識を活用するニュース推薦用のフレームワーク GENRE を提案。 このフレームワークはプロンプトデザインが肝となっており、LLMによるデータ生成・更新を反復的に行って品質の高いデータを生成し、ニュース推薦モデルの性能を向上させる。 使い方の例
|
Improving Content Retrievability in Search with Controllable Query Generation論文URLhttps://arxiv.org/abs/2303.11648 著者Gustavo Penha, Enrico Palumbo, Maryam Aziz, Alice Wang, Hugues Bouchard 会議World Wide Web Conference 2023 背景特定のアイテムを見つけたいというケースとは対称的に、探索的にアイテムを検索したいことがある。 目的
アプローチ
memo |
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. #197
What
話したいことがある人はここにコメントしましょう!
面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!
The text was updated successfully, but these errors were encountered: