# BPR (Bayesian Personalized Ranking)

## Теорема Байеса

В основе баесовских методов лежит формула Байеса:

$$
P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B)}
$$

Где:  
- $P(A)$ — априорная вероятность события $A$
- $P(B)$ — априорная вероятность события $B$  
- $P(B \mid A)$ — вероятность события $B$ при условии $A$  
- $P(A \mid B)$ — апостериорная вероятность события $A$ при наличии $B$  

## BPR (Bayesian Personalized Ranking)

BPR (Bayesian Personalized Ranking) — это метод коллаборативной фильтрации, разработанный специально для рекомендаций с неявными данными, такими как клики, просмотры или лайки. В отличие от стандартных подходов, основанных на явных оценках (рейтингах), BPR лучше справляется с ситуациями, когда данные не содержат явных оценок.

### Идея BPR:
Основная идея BPR заключается в следующем:

- У пользователя больше интерес к элементам, с которыми он взаимодействовал (например, прочитал новость), чем к тем, с которыми не взаимодействовал.
- Задача метода — ранжировать взаимодействованные объекты выше невзаимодействованных.

### Пример:
Если пользователь **U** прочитал новость **A**, но не читал новость **B**, модель должна предсказать, что **A** предпочтительнее **B** для пользователя **U**.

### Формулировка задачи:
Пусть **U** — множество пользователей, **I** — множество новостей.  
Для пользователя **u** существует пара взаимодействий (положительное — **i**, отрицательное — **j**).  
- Положительные взаимодействия — новости, которые пользователь прочитал.
- Отрицательные взаимодействия — случайные новости, которые пользователь не читал.  

Цель: максимизировать вероятность того, что пользователь предпочтет **i** над **j**.

### Функция вероятности и ранжирования:
Для каждой тройки (**u**, **i**, **j**), где:

- **u** — пользователь,
- **i** — положительное взаимодействие (прочитанная новость),
- **j** — отрицательное взаимодействие (непрочитанная новость),

максимизируем вероятность:

$$
P(i >_u j) = \sigma(\hat{x}_{ui} - \hat{x}_{uj})
$$

где:

- $\sigma$ — сигмоида: $$\sigma(x) = \frac{1}{1 + e^{-x}}$$
- $\hat{x}_{ui}$ — предсказанная "полезность" объекта **i** для пользователя **u**.
- $\hat{x}_{uj}$ — предсказанная "полезность" объекта **j** для пользователя **u**.

### Функция потерь:
Оптимизация происходит через максимизацию логарифма правдоподобия:

$$
L = \sum_{(u, i, j) \in D} \log(\sigma(\hat{x}_{ui} - \hat{x}_{uj})) - \lambda \| \Theta \|_2^2
$$

где:

- **D** — множество всех возможных тройных комбинаций (**u**, **i**, **j**).
- **λ** — коэффициент регуляризации для контроля переобучения.
- **Θ** — параметры модели (матрицы эмбеддингов пользователей и новостей).

### Реализация модели:
Обычно BPR используется в сочетании с матричной факторизацией. Эмбеддинги пользователей и новостей обучаются одновременно:

$$
\hat{x}_{ui} = \langle p_u, q_i \rangle = \sum_{f=1}^F p_{uf} \cdot q_{if}
$$

где:

- $p_u$ — вектор эмбеддинга пользователя **u**.
- $q_i$ — вектор эмбеддинга новости **i**.
- **F** — размерность скрытого пространства.

### Пошаговый алгоритм BPR:
1. **Инициализация**: случайная инициализация эмбеддингов пользователей и новостей.
2. **Формирование триплетов** (**u**, **i**, **j**): Для каждого пользователя **u** выбирается положительная новость **i**. Случайным образом выбирается отрицательная новость **j**.
3. **Обновление эмбеддингов**: используется стохастический градиентный спуск (SGD) для обновления эмбеддингов.
4. **Оптимизация**: максимизация правдоподобия или минимизация функции потерь.
5. **Рекомендации**: на основе полученных эмбеддингов строится ранжированный список рекомендаций.
