# RecSys

## 1. item KNN

**Item KNN (K-Nearest Neighbors)** — это один из методов коллаборативной фильтрации, который используется для построения рекомендаций на основе схожести между элементами (items). В отличие от User KNN , который ищет похожих пользователей, Item KNN анализирует взаимодействия между элементами и строит рекомендации на основе того, какие элементы часто оцениваются или используются вместе.

In [1]:
import pandas as pd
import numpy as np
import implicit

from collections import Counter

from sklearn.neighbors import NearestNeighbors
from sklearn.linear_model import ElasticNet
from sklearn.model_selection import train_test_split
from scipy.sparse import coo_matrix, csr_matrix
from datetime import datetime, timedelta

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F

from torch_geometric.nn import MessagePassing
from torch_geometric.data import Data
from torch_geometric.nn import GCNConv

In [2]:
#За исходные данные возьмем пример с просмотром пользователем популярных фильмов и их оценками
data = {
    'user_id': ['A','A','A','A','A','B','B','B','C','C','C','C','D','D','D','D','E','E','E','E'],
    'item_id': ['Inception','The Matrix','Interstellar','Titanic','Avatar',
                'Inception','The Matrix','Gladiator',
                'Interstellar','Titanic','Avatar','Gladiator',
                'The Matrix','Interstellar','Titanic','Avatar',
                'Inception','The Matrix','Interstellar','Gladiator'],
    'rating': [5,4,5,3,4,4,5,4,5,4,3,5,3,4,5,4,5,4,5,3]
}

df = pd.DataFrame(data)
df.head()

Unnamed: 0,user_id,item_id,rating
0,A,Inception,5
1,A,The Matrix,4
2,A,Interstellar,5
3,A,Titanic,3
4,A,Avatar,4


In [3]:
# Создаем user-item матрицу С ИСХОДНЫМИ РЕЙТИНГАМИ
user_item = df.pivot(index='user_id', columns='item_id', values='rating').fillna(0)
user_item

item_id,Avatar,Gladiator,Inception,Interstellar,The Matrix,Titanic
user_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
A,4.0,0.0,5.0,5.0,4.0,3.0
B,0.0,4.0,4.0,0.0,5.0,0.0
C,3.0,5.0,0.0,5.0,0.0,4.0
D,4.0,0.0,0.0,4.0,3.0,5.0
E,0.0,3.0,5.0,5.0,4.0,0.0


In [4]:
# Транспонируем для item-based подхода
item_user = user_item.T
item_user

user_id,A,B,C,D,E
item_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Avatar,4.0,0.0,3.0,4.0,0.0
Gladiator,0.0,4.0,5.0,0.0,3.0
Inception,5.0,4.0,0.0,0.0,5.0
Interstellar,5.0,0.0,5.0,4.0,5.0
The Matrix,4.0,5.0,0.0,3.0,4.0
Titanic,3.0,0.0,4.0,5.0,0.0


In [5]:
# Преобразуем в разреженную матрицу
sparse_item_user = csr_matrix(item_user.values)

In [6]:
# Обучаем модель с cosine_similarity
model = NearestNeighbors(metric='cosine', algorithm='brute', n_jobs=-1)
model.fit(sparse_item_user)

In [7]:
# Напишем функцию выдачи топ-3 рекоммендации
def get_recommendations(item_name, n=3):
    item_index = item_user.index.get_loc(item_name)
    distances, indices = model.kneighbors(
        sparse_item_user[item_index], 
        n_neighbors=n+1  # +1 чтобы исключить сам элемент
    )
    
    results = []
    for i in range(1, len(indices[0])):
        # Переводим косинусное расстояние в схожесть
        sim_score = 1 - distances[0][i]
        movie = item_user.index[indices[0][i]]
        results.append((movie, round(sim_score, 3)))
    
    # Сортировка по убыванию схожести
    return sorted(results, key=lambda x: x[1], reverse=True)

In [8]:
# Пример использования
print("Inception подобен:")
for item in get_recommendations('Inception'):
    print(f"- {item[0]} ({item[1]})")

print("\nGladiator подобен:")
for item in get_recommendations('Gladiator'):
    print(f"- {item[0]} ({item[1]})")

Inception подобен:
- The Matrix (0.909)
- Interstellar (0.645)
- Gladiator (0.54)

Gladiator подобен:
- Interstellar (0.593)
- The Matrix (0.557)
- Inception (0.54)


## 2. TIFU KNN

**TIFU-KNN (Time-Informed Frequent User K-Nearest Neighbors)** — это метод рекомендаций, который расширяет классический алгоритм K-ближайших соседей (KNN), добавляя временной аспект. Он учитывает:

* Историю взаимодействий (например, покупки клиентов).
* Временные метки (когда произошли взаимодействия).
* Частоту взаимодействий (как часто клиенты покупают определённые товары).

In [9]:
# Параметры датасета
num_customers = 100  # Количество клиентов
num_products = 50    # Количество товаров
num_transactions = 1000  # Количество транзакций

# Создаем синтетические данные
np.random.seed(42)
customer_ids = np.random.randint(0, num_customers, num_transactions)
product_ids = np.random.randint(0, num_products, num_transactions)
timestamps = [datetime.now() - timedelta(days=np.random.randint(0, 365)) for _ in range(num_transactions)]

# Создаем DataFrame
df = pd.DataFrame({
    'customer_id': customer_ids,
    'product_id': product_ids,
    'timestamp': timestamps
})

# Сортируем по времени
df = df.sort_values(by='timestamp')
df.head()

Unnamed: 0,customer_id,product_id,timestamp
971,55,40,2024-03-22 13:07:57.373607
273,81,17,2024-03-22 13:07:57.373607
85,99,39,2024-03-23 13:07:57.372146
999,85,12,2024-03-23 13:07:57.373607
505,56,44,2024-03-23 13:07:57.373607


In [10]:
# Добавляем столбец с временным интервалом (например, неделя)
df['time_interval'] = df['timestamp'].dt.isocalendar().week

# Группируем по клиенту и временному интервалу, чтобы получить частоту покупок
customer_product_freq = df.groupby(['customer_id', 'time_interval', 'product_id']).size().reset_index(name='frequency')
customer_product_freq.head()

Unnamed: 0,customer_id,time_interval,product_id,frequency
0,0,1,10,1
1,0,11,28,1
2,0,14,33,1
3,0,17,26,1
4,0,19,23,1


In [11]:
# Создаем матрицу "клиент-товар" с учетом частоты покупок
customer_product_matrix = customer_product_freq.pivot_table(
    index='customer_id', columns='product_id', values='frequency', fill_value=0
)
customer_product_matrix

product_id,0,1,2,3,4,5,6,7,8,9,...,40,41,42,43,44,45,46,47,48,49
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0
1,0.0,0.0,0.0,1.0,0.0,1.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0
2,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,1.0,0.0
3,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
4,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,...,0.0,1.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,...,0.0,1.0,0.0,1.0,0.0,0.0,1.0,0.0,1.0,0.0
96,1.0,0.0,0.0,0.0,1.0,0.0,1.0,0.0,0.0,0.0,...,0.0,0.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0
97,0.0,0.0,0.0,1.0,0.0,0.0,1.0,0.0,1.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0
98,0.0,1.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,1.0,0.0,0.0,0.0,0.0,1.0,1.0,0.0


In [12]:
# Инициализируем KNN
knn = NearestNeighbors(n_neighbors=5, metric='cosine')
knn.fit(customer_product_matrix)

In [13]:
# Функция для рекомендаций
def recommend_products(customer_id, knn_model, customer_product_matrix, top_n=5):
    # Находим индексы ближайших соседей
    distances, indices = knn_model.kneighbors([customer_product_matrix.loc[customer_id]])
    
    # Получаем товары, купленные соседями
    neighbor_products = customer_product_matrix.iloc[indices[0]].sum(axis=0)
    
    # Убираем товары, которые уже покупал клиент
    customer_products = set(customer_product_matrix.loc[customer_id].to_numpy().nonzero()[0])
    neighbor_products = neighbor_products.drop(customer_products)
    
    # Рекомендуем топ-N товаров
    recommendations = neighbor_products.sort_values(ascending=False).head(top_n)
    return recommendations

In [14]:
# Пример рекомендаций для клиента
customer_id = 0
recommendations = recommend_products(customer_id, knn, customer_product_matrix, top_n=5)
print(f"Рекомендации для клиента {customer_id}:")
print(recommendations)

Рекомендации для клиента 0:
product_id
22    2.0
14    2.0
21    2.0
11    2.0
36    1.0
dtype: float64


## 3. iALS

**iALS (Implicit Alternating Least Squares)**  — это метод матричной факторизации, который используется для построения рекомендаций на основе неявных данных взаимодействий пользователей с элементами. Этот алгоритм является расширением классического метода Alternating Least Squares (ALS) , адаптированным для работы с неявными сигналами (например, клики, просмотры, покупки), которые отличаются от явных оценок (например, рейтингов).

![image.png](attachment:528bf9aa-86ec-430f-b1d8-679c5f305b73.png)

![image.png](attachment:9a17a5a1-feb5-42e8-882b-68166c5a70ad.png)

In [15]:
# Шаг 1: Создаем синтетический датасет с пользователями и товарами
num_users = 25
num_items = 10
num_interactions = 100

# Генерация случайных взаимодействий
user_ids = np.random.randint(0, num_users, num_interactions)
item_ids = np.random.randint(0, num_items, num_interactions)
interactions = np.random.randint(1, 6, num_interactions)  # Случайные значения от 1 до 5

# Создаем DataFrame
df = pd.DataFrame({'user_id': user_ids, 'item_id': item_ids, 'interaction': interactions})
df

Unnamed: 0,user_id,item_id,interaction
0,24,8,2
1,19,1,2
2,23,9,5
3,24,1,3
4,3,2,5
...,...,...,...
95,9,2,3
96,20,0,1
97,4,3,4
98,1,8,4


In [16]:
df.duplicated(subset=['user_id', 'item_id']).sum()

17

In [17]:
# в зависимости от задачи может использоваться суммирование, усреднение либо удаление дубликатов
df_aggregated = df.groupby(['user_id', 'item_id'])['interaction'].mean().reset_index()
df_aggregated.head()

Unnamed: 0,user_id,item_id,interaction
0,0,0,2.0
1,0,5,3.0
2,0,7,3.0
3,0,8,2.0
4,1,3,2.0


In [18]:
# Шаг 2: Преобразуем DataFrame в разреженную матрицу взаимодействий
# Создаем матрицу, где строки — пользователи, столбцы — товары
interactions_matrix = coo_matrix((df_aggregated['interaction'], (df_aggregated['user_id'], df_aggregated['item_id'])), shape=(num_users, num_items))
print("\nРазреженная матрица взаимодействий (COO формат):")
print(interactions_matrix.toarray())  # Преобразуем в плотный массив для наглядности


Разреженная матрица взаимодействий (COO формат):
[[2.         0.         0.         0.         0.         3.
  0.         3.         2.         0.        ]
 [0.         0.         0.         2.         3.         0.
  0.         0.         4.5        0.        ]
 [0.         0.         4.         0.         0.         0.
  2.         0.         0.         0.        ]
 [2.         0.         4.         0.         0.         0.
  0.         0.         4.         0.        ]
 [0.         0.         0.         4.         0.         0.
  0.         4.5        0.         0.        ]
 [0.         0.         0.         1.         0.         1.
  3.         4.         0.         0.        ]
 [0.         0.         0.         0.         4.         0.
  3.         0.         0.         3.        ]
 [0.         0.         0.         0.         0.         0.
  0.         0.         0.         0.        ]
 [3.         1.         0.         0.         0.         2.
  0.         0.         0.        

In [19]:
# Транспонируем матрицу для implicit: (items, users)
interactions_matrix_csr = interactions_matrix.T.tocsr()

In [20]:
# Шаг 3: Инициализация и обучение модели iALS
model = implicit.als.AlternatingLeastSquares(factors=3, iterations=30, regularization=0.1)
model.fit(interactions_matrix_csr)

# Шаг 4: Получение рекомендаций для пользователя с user_id=0
user_id = 0
user_items = csr_matrix(interactions_matrix_csr[:, user_id].T)  # Преобразуем в CSR формат
recommended_items, scores = model.recommend(user_id, user_items, N=3)

# Вывод рекомендаций
print(f"\nРекомендации для пользователя {user_id}:")
for item_id, score in zip(recommended_items, scores):
    print(f"Товар {item_id} с оценкой {score:.4f}")

  check_blas_config()


  0%|          | 0/30 [00:00<?, ?it/s]


Рекомендации для пользователя 0:
Товар 24 с оценкой 0.9453
Товар 23 с оценкой 0.8741
Товар 3 с оценкой 0.8355


## 4. EASE

**EASE (Embarrassingly Shallow Autoencoders for Sparse Data)** — это алгоритм для рекомендательных систем, который работает с неявными данными (implicit feedback). Он прост в реализации, но при этом показывает высокую эффективность. Основная идея EASE — предсказать взаимодействия пользователей с товарами, используя взвешенную линейную комбинацию взаимодействий с другими товарами.

![image.png](attachment:fadf15de-f97c-4eec-919c-43629c90b3bb.png)

In [21]:
# Шаг 1: Создаем синтетический датафрейм
num_users = 10
num_items = 20
num_interactions = 100

# Генерация случайных взаимодействий
user_ids = np.random.randint(0, num_users, num_interactions)
item_ids = np.random.randint(0, num_items, num_interactions)
interactions = np.random.randint(1, 6, num_interactions)  # Случайные значения от 1 до 5

# Создаем DataFrame
df = pd.DataFrame({'user_id': user_ids, 'item_id': item_ids, 'interaction': interactions})
df.head()

Unnamed: 0,user_id,item_id,interaction
0,6,12,2
1,8,5,5
2,6,16,5
3,8,13,1
4,2,16,1


In [22]:
df.duplicated(subset=['user_id', 'item_id']).sum()

25

In [23]:
# Также, в зависимости от задачи может использоваться суммирование, усреднение либо удаление дубликатов
df_aggregated = df.groupby(['user_id', 'item_id'])['interaction'].mean().reset_index()
df_aggregated.head()

Unnamed: 0,user_id,item_id,interaction
0,0,7,4.0
1,0,8,1.0
2,0,9,3.0
3,0,11,3.0
4,0,12,2.333333


In [24]:
# Преобразуем DataFrame в разреженную матрицу
R = csr_matrix((df_aggregated['interaction'], (df_aggregated['user_id'], df_aggregated['item_id'])), 
               shape=(num_users, num_items))

print("Разреженная матрица взаимодействий:")
print(R.toarray())

Разреженная матрица взаимодействий:
[[0.         0.         0.         0.         0.         0.
  0.         4.         1.         3.         0.         3.
  2.33333333 0.         3.         0.         4.         0.
  0.         4.        ]
 [0.         5.         3.         0.         0.         0.
  0.         4.         2.         0.         3.         0.
  0.         3.         0.         0.         0.         0.
  0.         0.        ]
 [2.         4.         2.5        0.         4.         0.
  2.         0.         1.         0.         0.         0.
  4.         0.         0.         0.         2.66666667 0.
  5.         0.        ]
 [4.         0.         0.         0.         2.         0.
  2.66666667 1.66666667 4.         0.         5.         0.
  0.         0.         3.         0.         0.         0.
  0.         0.        ]
 [3.         0.         0.         0.         2.         0.
  0.         1.         4.         0.         0.         5.
  0.         0.         

In [25]:
# Реализация EASE
class EASE:
    def __init__(self, lambda_=100):
        self.lambda_ = lambda_
        self.B = None

    def fit(self, X):
        X_dense = X.toarray()
        G = X_dense.T @ X_dense
        diag_indices = np.diag_indices_from(G)
        G[diag_indices] += self.lambda_
        P = np.linalg.inv(G)
        B = P @ X_dense.T @ X_dense
        np.fill_diagonal(B, 0)
        self.B = B

    def predict(self, X):
        X_dense = X.toarray()
        return X_dense @ self.B

In [26]:
# Создаем и обучаем модель EASE
ease = EASE(lambda_=100)
ease.fit(R)

# Получаем предсказания
predictions = ease.predict(R)
print("Предсказанные оценки:")
print(predictions)

Предсказанные оценки:
[[ 0.71565062  0.35660293  0.11134185  0.03905852  0.0753026   0.33873673
   0.13030499  0.84190956  1.05844101  1.18373245  0.66071191  1.21251446
   1.09061365  0.52792516  0.90055064  0.00272875  1.32216737  0.8553451
   0.65315057  1.37308802]
 [ 0.47997885  0.95816183  1.00330136  0.11585234  0.37737474  0.20071194
   0.43765132  0.94413419  0.78449382  0.10143646  0.91732554  0.09164047
   0.45094365  0.69148088  0.47766495  0.33601498  0.48448049  0.2431491
   0.49193545  0.40102291]
 [ 0.97293495  1.15351412  0.93363131  0.05918999  1.3044226   0.70559236
   1.15539791  0.40137392  0.75458233 -0.01946243  0.65337469  0.52936872
   1.60598916  0.79410158  0.30401128  0.5655014   1.3590993   0.54850308
   1.69811743  0.48119503]
 [ 1.58214999  0.56932691  0.3437332  -0.01830571  0.77743057  0.28262134
   0.83433943  0.72088228  1.57745641  0.29596573  1.45193203  0.81544462
   0.48852493  0.10027256  0.64220903  0.17941228  0.30593958  0.70321023
   0.404220

In [27]:
# Функция для генерации рекомендаций с вероятностями
def recommend_top_n_with_scores(predictions, user_id, top_n=3):
    user_predictions = predictions[user_id]
    top_indices = np.argsort(-user_predictions)[:top_n]
    top_scores = user_predictions[top_indices]
    return top_indices, top_scores

# Рекомендации для пользователя 0
user_id = 0
recommended_items, recommended_scores = recommend_top_n_with_scores(predictions, user_id, top_n=3)

print(f"Рекомендации для пользователя {user_id}:")
for item, score in zip(recommended_items, recommended_scores):
    print(f"Элемент: {item}, Предсказанное значение: {score:.2f}")

Рекомендации для пользователя 0:
Элемент: 19, Предсказанное значение: 1.37
Элемент: 16, Предсказанное значение: 1.32
Элемент: 11, Предсказанное значение: 1.21


## 5. SLIM

**SLIM (Sparse Linear Methods)** — это еще один эффективный метод для рекомендательных систем, который фокусируется на построении разреженной модели взаимодействий между элементами. В отличие от EASE, SLIM использует оптимизацию с ограничениями для поиска весов W, которые минимизируют ошибку восстановления матрицы взаимодействий.

![image.png](attachment:be551147-6c75-4ba0-81dd-a94c26fe62a3.png)

In [28]:
#Возьмем разреженную матрицу взаимодействий из предыдущего примера
print("Разреженная матрица взаимодействий:")
print(R.toarray())

Разреженная матрица взаимодействий:
[[0.         0.         0.         0.         0.         0.
  0.         4.         1.         3.         0.         3.
  2.33333333 0.         3.         0.         4.         0.
  0.         4.        ]
 [0.         5.         3.         0.         0.         0.
  0.         4.         2.         0.         3.         0.
  0.         3.         0.         0.         0.         0.
  0.         0.        ]
 [2.         4.         2.5        0.         4.         0.
  2.         0.         1.         0.         0.         0.
  4.         0.         0.         0.         2.66666667 0.
  5.         0.        ]
 [4.         0.         0.         0.         2.         0.
  2.66666667 1.66666667 4.         0.         5.         0.
  0.         0.         3.         0.         0.         0.
  0.         0.        ]
 [3.         0.         0.         0.         2.         0.
  0.         1.         4.         0.         0.         5.
  0.         0.         

In [29]:
class SLIM:
    def __init__(self, alpha=0.01, l1_ratio=0.5):
        self.alpha = alpha
        self.l1_ratio = l1_ratio
        self.W = None

    def fit(self, X):
        n_items = X.shape[1]
        W = np.zeros((n_items, n_items))

        for j in range(n_items):
            # Извлекаем столбец j как целевую переменную
            y_j = X[:, j].toarray().ravel()

            # Удаляем столбец j из матрицы для обучения
            mask = np.ones(n_items, dtype=bool)
            mask[j] = False
            X_j = X[:, mask]

            # Обучаем ElasticNet для предсказания столбца j
            model = ElasticNet(alpha=self.alpha, l1_ratio=self.l1_ratio, 
                               positive=True, fit_intercept=False, max_iter=10000)
            model.fit(X_j, y_j)

            # Заполняем строку j матрицы W
            W[mask, j] = model.coef_

        self.W = W

    def predict(self, X):
        return X @ self.W

In [30]:
# Создаем и обучаем модель SLIM
slim = SLIM(alpha=0.01, l1_ratio=0.5)
slim.fit(R)

# Получаем предсказания
predictions = slim.predict(R)
print("Предсказанные оценки:")
print(predictions)

Предсказанные оценки:
[[0.90431183 0.         0.57930398 0.257116   0.07237291 0.
  0.         2.80681552 2.07582262 2.01437415 1.36309004 3.54676193
  2.57567911 1.49145795 2.1491257  1.06021933 3.46417396 1.66778769
  0.73788483 3.66693512]
 [1.41791609 4.83098324 1.95553126 0.27639483 1.19783249 0.19414272
  0.48267644 2.50555936 1.34698324 0.61486777 1.81802105 0.72049393
  0.60544357 1.35121691 1.43942821 0.         1.50651193 0.04443417
  1.42811585 0.        ]
 [2.29974832 4.15179099 1.82027291 0.22111586 2.53455152 0.92099579
  1.94170626 1.75925603 1.75786011 0.0778555  1.57914991 1.08615529
  3.24942194 1.9515319  0.57779109 1.06708953 3.17573662 0.39258758
  4.48878658 0.        ]
 [3.54812948 0.31722904 0.71254674 0.21165935 1.08691343 1.22799439
  1.77531386 1.31478407 3.82473477 0.2561949  3.3743712  1.16356085
  0.88006005 0.22775263 1.14191626 0.53354476 0.37699811 0.8592321
  2.06237931 1.01715274]
 [2.81283491 0.67398685 0.61599607 0.38405801 1.67328394 0.
  0.9708531

In [31]:
def recommend_top_n_with_scores(predictions, user_id, top_n=3):
    # Получаем предсказания для конкретного пользователя
    user_predictions = predictions[user_id]

    # Находим индексы топ-N элементов и их значения
    top_indices = np.argsort(-user_predictions)[:top_n]
    top_scores = user_predictions[top_indices]

    return top_indices, top_scores

# Рекомендации для пользователя 0
user_id = 0
recommended_items, recommended_scores = recommend_top_n_with_scores(predictions, user_id, top_n=3)

print(f"Рекомендации для пользователя {user_id}:")
for item, score in zip(recommended_items, recommended_scores):
    print(f"Элемент: {item}, Предсказанное значение: {score:.2f}")

Рекомендации для пользователя 0:
Элемент: 19, Предсказанное значение: 3.67
Элемент: 11, Предсказанное значение: 3.55
Элемент: 16, Предсказанное значение: 3.46


## 6. MultiVAE

**MultiVAE (Multinomial Variational Autoencoder)** — это вероятностная модель, которая используется для рекомендательных систем, особенно в задачах с неявной обратной связью (например, клики, просмотры). В отличие от детерминированных методов (например, EASE или SLIM), MultiVAE использует стохастический подход для моделирования скрытых представлений пользователей и элементов.

![image.png](attachment:b92fe973-dbee-4894-a887-33e424185045.png)

In [32]:
# Воспользуемся готовой разреженной матрицей взаимодействий
print(R)

<Compressed Sparse Row sparse matrix of dtype 'float64'
	with 75 stored elements and shape (10, 20)>
  Coords	Values
  (0, 7)	4.0
  (0, 8)	1.0
  (0, 9)	3.0
  (0, 11)	3.0
  (0, 12)	2.3333333333333335
  (0, 14)	3.0
  (0, 16)	4.0
  (0, 19)	4.0
  (1, 1)	5.0
  (1, 2)	3.0
  (1, 7)	4.0
  (1, 8)	2.0
  (1, 10)	3.0
  (1, 13)	3.0
  (2, 0)	2.0
  (2, 1)	4.0
  (2, 2)	2.5
  (2, 4)	4.0
  (2, 6)	2.0
  (2, 8)	1.0
  (2, 12)	4.0
  (2, 16)	2.6666666666666665
  (2, 18)	5.0
  (3, 0)	4.0
  (3, 4)	2.0
  :	:
  (6, 18)	4.0
  (7, 0)	5.0
  (7, 5)	1.0
  (7, 8)	5.0
  (7, 9)	2.5
  (7, 10)	4.0
  (7, 11)	5.0
  (7, 12)	2.6666666666666665
  (7, 16)	2.5
  (7, 17)	5.0
  (7, 19)	5.0
  (8, 0)	2.0
  (8, 1)	3.0
  (8, 5)	5.0
  (8, 6)	4.0
  (8, 10)	2.6666666666666665
  (8, 12)	4.0
  (8, 13)	1.5
  (8, 16)	4.0
  (8, 17)	4.0
  (8, 18)	3.0
  (8, 19)	3.0
  (9, 1)	4.0
  (9, 3)	1.0
  (9, 15)	5.0


In [33]:
class MultiVAE(nn.Module):
    def __init__(self, input_dim, hidden_dim, latent_dim):
        super(MultiVAE, self).__init__()
        
        # Энкодер
        self.encoder = nn.Sequential(
            nn.Linear(input_dim, hidden_dim),
            nn.Tanh(),
            nn.Linear(hidden_dim, 2 * latent_dim)  # Выход: [mu, log_sigma]
        )
        
        # Декодер
        self.decoder = nn.Sequential(
            nn.Linear(latent_dim, hidden_dim),
            nn.Tanh(),
            nn.Linear(hidden_dim, input_dim),
            nn.Sigmoid()  # Вероятности для элементов
        )
    
    def encode(self, x):
        h = self.encoder(x)
        mu, log_sigma = torch.chunk(h, 2, dim=1)
        return mu, log_sigma
    
    def reparameterize(self, mu, log_sigma):
        sigma = torch.exp(0.5 * log_sigma)
        eps = torch.randn_like(sigma)
        return mu + eps * sigma
    
    def decode(self, z):
        return self.decoder(z)
    
    def forward(self, x):
        mu, log_sigma = self.encode(x)
        z = self.reparameterize(mu, log_sigma)
        recon_x = self.decode(z)
        return recon_x, mu, log_sigma

In [34]:
# Параметры модели
input_dim = num_items
hidden_dim = 64
latent_dim = 32

# Создаем модель
model = MultiVAE(input_dim, hidden_dim, latent_dim)

# Функция потерь
def loss_function(recon_x, x, mu, log_sigma, beta=1.0):
    recon_loss = -torch.sum(x * torch.log(recon_x + 1e-8))  # Реконструкционная ошибка
    kl_divergence = -0.5 * torch.sum(1 + log_sigma - mu.pow(2) - log_sigma.exp())  # KL-дивергенция
    return recon_loss + beta * kl_divergence

# Оптимизатор
optimizer = optim.Adam(model.parameters(), lr=1e-3)

# Преобразуем разреженную матрицу в тензор
R_tensor = torch.FloatTensor(R.toarray())

# Обучение
num_epochs = 50
for epoch in range(num_epochs):
    model.train()
    optimizer.zero_grad()
    
    # Forward pass
    recon_x, mu, log_sigma = model(R_tensor)
    
    # Вычисляем функцию потерь
    loss = loss_function(recon_x, R_tensor, mu, log_sigma, beta=0.2)
    
    # Backward pass
    loss.backward()
    optimizer.step()
    
    if (epoch + 1) % 10 == 0:
        print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}")

Epoch [10/50], Loss: 151.7847
Epoch [20/50], Loss: 123.0624
Epoch [30/50], Loss: 102.1800
Epoch [40/50], Loss: 80.8839
Epoch [50/50], Loss: 62.7499


In [35]:
def recommend_top_n(model, user_id, top_n=3):
    model.eval()
    with torch.no_grad():
        user_vector = R_tensor[user_id].unsqueeze(0)
        recon_x, _, _ = model(user_vector)
        scores = recon_x.squeeze().numpy()
        top_indices = np.argsort(-scores)[:top_n]
        top_scores = scores[top_indices]
    return top_indices, top_scores

# Рекомендации для пользователя 0
user_id = 0
recommended_items, recommended_scores = recommend_top_n(model, user_id, top_n=3)

print(f"Рекомендации для пользователя {user_id}:")
for item, score in zip(recommended_items, recommended_scores):
    print(f"Элемент: {item}, Предсказанное значение: {score:.2f}")

Рекомендации для пользователя 0:
Элемент: 18, Предсказанное значение: 0.90
Элемент: 12, Предсказанное значение: 0.89
Элемент: 10, Предсказанное значение: 0.88


## 7. LightGCN

**LightGCN (Light Graph Convolutional Network)** — это упрощённая версия графовых нейронных сетей, специально разработанная для задач коллаборативной фильтрации. Она работает с графом взаимодействий пользователей и товаров, где:

Узлы графа — это пользователи и товары.
Рёбра графа — это взаимодействия (например, клики, покупки).
Основная идея LightGCN заключается в том, чтобы распространять эмбеддинги (векторные представления) между соседними узлами графа через несколько слоёв.

In [36]:
# Параметры датасета
num_users = 50
num_items = 20
num_interactions = 500

# Создаем синтетические данные
np.random.seed(42)
user_ids = np.random.randint(0, num_users, num_interactions)
item_ids = np.random.randint(0, num_items, num_interactions)
clicks = np.random.randint(1, 6, num_interactions)  # Оценки от 1 до 5

# Создаем DataFrame
df = pd.DataFrame({
    'user_id': user_ids,
    'item_id': item_ids,
    'click': clicks
})

# Удаляем дубликаты (если один пользователь взаимодействовал с товаром несколько раз)
df = df.drop_duplicates(subset=['user_id', 'item_id'])
df.head()

Unnamed: 0,user_id,item_id,click
0,38,15,1
1,28,6,1
2,14,3,1
3,42,0,1
4,7,4,2


In [37]:
# Создаем маппинг user_id и item_id в индексы
unique_users = df['user_id'].unique()
unique_items = df['item_id'].unique()

user_to_idx = {user: idx for idx, user in enumerate(unique_users)}
item_to_idx = {item: idx + len(unique_users) for idx, item in enumerate(unique_items)}  # Сдвигаем индексы товаров

# Преобразуем user_id и item_id в индексы
df['user_idx'] = df['user_id'].map(user_to_idx)
df['item_idx'] = df['item_id'].map(item_to_idx)

# Создаем edge_index (граф взаимодействий)
edge_index = torch.tensor([
    df['user_idx'].values,
    df['item_idx'].values
], dtype=torch.long)

# Создаем объект Data для PyTorch Geometric
data = Data(edge_index=edge_index)

print("Edge index shape:", edge_index.shape)

Edge index shape: torch.Size([2, 394])


  edge_index = torch.tensor([


In [38]:
class LightGCN(torch.nn.Module):
    def __init__(self, num_users, num_items, embedding_dim):
        super(LightGCN, self).__init__()
        self.num_users = num_users
        self.num_items = num_items
        self.embedding_dim = embedding_dim

        # Эмбеддинги для пользователей и товаров
        self.user_embeddings = torch.nn.Embedding(num_users, embedding_dim)
        self.item_embeddings = torch.nn.Embedding(num_items, embedding_dim)

        # Слои GCN
        self.conv1 = GCNConv(embedding_dim, embedding_dim)
        self.conv2 = GCNConv(embedding_dim, embedding_dim)

    def forward(self, edge_index):
        # Инициализация эмбеддингов
        user_embeds = self.user_embeddings.weight
        item_embeds = self.item_embeddings.weight
        embeddings = torch.cat([user_embeds, item_embeds], dim=0)

        # Первый слой GCN
        embeddings = self.conv1(embeddings, edge_index)
        embeddings = F.relu(embeddings)

        # Второй слой GCN
        embeddings = self.conv2(embeddings, edge_index)

        # Разделяем эмбеддинги пользователей и товаров
        user_embeds, item_embeds = torch.split(embeddings, [self.num_users, self.num_items])

        return user_embeds, item_embeds

# Инициализация модели
embedding_dim = 32
model = LightGCN(num_users=len(unique_users), num_items=len(unique_items), embedding_dim=embedding_dim)

In [39]:
from torch.optim import Adam

# Функция потерь BPR
def bpr_loss(user_embeds, item_embeds_positive, item_embeds_negative):
    pos_scores = torch.sum(user_embeds * item_embeds_positive, dim=1)
    neg_scores = torch.sum(user_embeds * item_embeds_negative, dim=1)
    return -torch.mean(torch.log(torch.sigmoid(pos_scores - neg_scores)))

# Оптимизатор
optimizer = Adam(model.parameters(), lr=0.01)

# Пример обучения
for epoch in range(10):
    model.train()
    optimizer.zero_grad()

    # Прямой проход
    user_embeds, item_embeds = model(data.edge_index)

    # Выбор положительных и отрицательных примеров
    user_indices = torch.tensor(df['user_idx'].values, dtype=torch.long)
    item_indices_positive = torch.tensor(df['item_idx'].values, dtype=torch.long)
    item_indices_negative = torch.randint(len(unique_users), len(unique_users) + len(unique_items), (len(df),))  # Случайные отрицательные примеры

    # Вычисление потерь
    loss = bpr_loss(user_embeds[user_indices], item_embeds[item_indices_positive - len(unique_users)], item_embeds[item_indices_negative - len(unique_users)])

    # Обратное распространение
    loss.backward()
    optimizer.step()

    print(f"Epoch {epoch + 1}, Loss: {loss.item()}")

Epoch 1, Loss: 1.4296354055404663
Epoch 2, Loss: 0.8112242817878723
Epoch 3, Loss: 0.7822353839874268
Epoch 4, Loss: 0.6133307814598083
Epoch 5, Loss: 0.5749878287315369
Epoch 6, Loss: 0.5780735611915588
Epoch 7, Loss: 0.528906524181366
Epoch 8, Loss: 0.5451253652572632
Epoch 9, Loss: 0.5599259734153748
Epoch 10, Loss: 0.5611675381660461


In [40]:
# Переводим модель в режим оценки
model.eval()

# Получаем эмбеддинги пользователей и товаров
user_embeds, item_embeds = model(data.edge_index)

# Предсказание рейтингов для всех пользователей и товаров
all_user_indices = torch.arange(len(unique_users), dtype=torch.long)  # Все пользователи
all_item_indices = torch.arange(len(unique_items), dtype=torch.long)  # Все товары

# Вычисляем предсказанные рейтинги
with torch.no_grad():
    pred_ratings = user_embeds[all_user_indices] @ item_embeds[all_item_indices].T

# Преобразуем предсказанные рейтинги в numpy для удобства
pred_ratings = pred_ratings.numpy()

# Проверяем форму pred_ratings
print("Shape of pred_ratings:", pred_ratings.shape)

Shape of pred_ratings: (50, 20)


In [41]:
# Пример: Рекомендации для первого пользователя
user_id = 0  # ID пользователя (можно выбрать любого)
top_n = 5    # Количество рекомендаций

# Получаем топ-N товаров для пользователя
top_items = np.argsort(pred_ratings[user_id])[::-1][:top_n]

# Выводим рекомендации
print(f"Рекомендации для пользователя {user_id}:")
for item in top_items:
    print(f"Товар {item} с предсказанным рейтингом {pred_ratings[user_id, item]:.2f}")

Рекомендации для пользователя 0:
Товар 6 с предсказанным рейтингом 3.33
Товар 10 с предсказанным рейтингом 3.07
Товар 12 с предсказанным рейтингом 3.04
Товар 1 с предсказанным рейтингом 2.92
Товар 19 с предсказанным рейтингом 2.87


## 8. Bert4Rec

**BERT4Rec** — модель для построения рекомендательных систем, основанная на архитектуре BERT. 

BERT4Rec использует двунаправленную трансформерную архитектуру для моделирования последовательностей взаимодействий пользователей с элементами (например, просмотры, покупки, клики). В отличие от традиционных методов, которые рассматривают последовательности только в одном направлении (например, слева направо), BERT4Rec учитывает контекст с обеих сторон, что позволяет лучше понимать предпочтения пользователей.

In [42]:
# Параметры данных
num_users = 100  # Количество пользователей
num_items = 50   # Количество товаров
seq_length = 10  # Длина последовательности взаимодействий

# Создаем синтетические данные
data = {
    "user_id": [],
    "item_sequence": []
}

for user_id in range(num_users):
    # Генерируем последовательность из 10 товаров для каждого пользователя
    item_sequence = np.random.choice(num_items, size=seq_length, replace=True).tolist()
    data["user_id"].append(user_id)
    data["item_sequence"].append(item_sequence)

# Преобразуем в pandas DataFrame
df = pd.DataFrame(data)
df.head()

Unnamed: 0,user_id,item_sequence
0,0,"[12, 16, 49, 39, 44, 31, 28, 2, 39, 33]"
1,1,"[39, 26, 12, 44, 32, 5, 23, 18, 15, 39]"
2,2,"[27, 32, 47, 40, 12, 42, 44, 24, 41, 35]"
3,3,"[26, 37, 6, 4, 42, 44, 30, 22, 41, 9]"
4,4,"[31, 42, 29, 38, 30, 17, 35, 1, 13, 12]"


In [43]:
mask_prob = 0.2  # Вероятность маскирования элемента

# Функция для маскирования последовательности
def mask_sequence(sequence, mask_token):
    masked_sequence = sequence.copy()
    labels = np.full_like(sequence, -1)  # -1 означает, что элемент не используется для обучения
    for i in range(len(sequence)):
        if np.random.rand() < mask_prob:
            labels[i] = masked_sequence[i]  # Сохраняем оригинальный элемент как метку
            masked_sequence[i] = mask_token  # Маскируем элемент
    return masked_sequence, labels

# Применяем маскирование к данным
mask_token = num_items  # Используем num_items как токен маски
df["masked_sequence"], df["labels"] = zip(*df["item_sequence"].apply(
    lambda x: mask_sequence(x, mask_token)
))
df.head()

Unnamed: 0,user_id,item_sequence,masked_sequence,labels
0,0,"[12, 16, 49, 39, 44, 31, 28, 2, 39, 33]","[12, 50, 49, 39, 44, 50, 28, 50, 39, 33]","[-1, 16, -1, -1, -1, 31, -1, 2, -1, -1]"
1,1,"[39, 26, 12, 44, 32, 5, 23, 18, 15, 39]","[39, 26, 12, 44, 32, 5, 23, 18, 15, 39]","[-1, -1, -1, -1, -1, -1, -1, -1, -1, -1]"
2,2,"[27, 32, 47, 40, 12, 42, 44, 24, 41, 35]","[27, 32, 47, 50, 12, 42, 44, 24, 41, 35]","[-1, -1, -1, 40, -1, -1, -1, -1, -1, -1]"
3,3,"[26, 37, 6, 4, 42, 44, 30, 22, 41, 9]","[26, 50, 6, 50, 42, 44, 30, 50, 50, 9]","[-1, 37, -1, 4, -1, -1, -1, 22, 41, -1]"
4,4,"[31, 42, 29, 38, 30, 17, 35, 1, 13, 12]","[50, 50, 50, 38, 30, 17, 35, 1, 13, 12]","[31, 42, 29, -1, -1, -1, -1, -1, -1, -1]"


In [44]:
train_df, test_df = train_test_split(df, test_size=0.2, random_state=42)

train_df.shape, test_df.shape

((80, 4), (20, 4))

In [45]:
class BERT4Rec(nn.Module):
    def __init__(self, num_items, hidden_size=64, num_layers=2, num_heads=2, max_len=10):
        super(BERT4Rec, self).__init__()
        self.num_items = num_items
        self.hidden_size = hidden_size
        self.item_embeddings = nn.Embedding(num_items + 1, hidden_size)  # +1 для токена маски
        self.position_embeddings = nn.Embedding(max_len, hidden_size)
        encoder_layer = nn.TransformerEncoderLayer(d_model=hidden_size, nhead=num_heads)
        self.transformer_encoder = nn.TransformerEncoder(encoder_layer, num_layers=num_layers)
        self.fc = nn.Linear(hidden_size, num_items)

    def forward(self, x):
        seq_length = x.size(1)
        positions = torch.arange(seq_length, dtype=torch.long, device=x.device).unsqueeze(0)
        item_emb = self.item_embeddings(x)
        pos_emb = self.position_embeddings(positions)
        x = item_emb + pos_emb
        x = self.transformer_encoder(x)
        logits = self.fc(x)
        return logits

In [46]:
def prepare_batch(df):
    masked_sequences = np.stack(df["masked_sequence"].values)
    labels = np.stack(df["labels"].values)
    return torch.tensor(masked_sequences, dtype=torch.long), torch.tensor(labels, dtype=torch.long)

# Подготовка обучающих и тестовых данных
train_data, train_labels = prepare_batch(train_df)
test_data, test_labels = prepare_batch(test_df)

In [47]:
# Параметры модели
hidden_size = 64
num_layers = 2
num_heads = 2
max_len = seq_length
num_epochs = 10
batch_size = 32
learning_rate = 0.001

# Создание модели
model = BERT4Rec(num_items, hidden_size, num_layers, num_heads, max_len)

# Оптимизатор и функция потерь
optimizer = optim.Adam(model.parameters(), lr=learning_rate)
criterion = nn.CrossEntropyLoss(ignore_index=-1)  # Игнорируем элементы с меткой -1

# Обучение
for epoch in range(num_epochs):
    model.train()
    total_loss = 0
    for i in range(0, len(train_data), batch_size):
        batch_data = train_data[i:i + batch_size]
        batch_labels = train_labels[i:i + batch_size]

        optimizer.zero_grad()
        logits = model(batch_data)
        logits = logits.view(-1, model.num_items)
        labels_flat = batch_labels.view(-1)
        loss = criterion(logits, labels_flat)
        loss.backward()
        optimizer.step()
        total_loss += loss.item()

    print(f"Epoch {epoch + 1}/{num_epochs}, Loss: {total_loss / len(train_data)}")

Epoch 1/10, Loss: 0.15497352480888366




Epoch 2/10, Loss: 0.13642631471157074
Epoch 3/10, Loss: 0.1322248697280884
Epoch 4/10, Loss: 0.1279701054096222
Epoch 5/10, Loss: 0.12268362343311309
Epoch 6/10, Loss: 0.12035196423530578
Epoch 7/10, Loss: 0.11760526895523071
Epoch 8/10, Loss: 0.11597256362438202
Epoch 9/10, Loss: 0.11533617079257966
Epoch 10/10, Loss: 0.11388923227787018


In [48]:
def predict(model, data, top_k=3):
    """
    Предсказывает топ-K рекомендаций для клиента на основе его последовательности.
    
    Параметры:
        model: Обученная модель BERT4Rec.
        data: Входные данные (тензор) для одного клиента.
        top_k: Количество рекомендаций (по умолчанию 3).
    
    Возвращает:
        Список топ-K рекомендаций для клиента.
    """
    model.eval()
    with torch.no_grad():
        # Получаем предсказания модели
        logits = model(data)
        scores = torch.softmax(logits, dim=-1)
        
        # Выбираем топ-K рекомендаций для каждого элемента в последовательности
        top_k_items = torch.topk(scores, k=top_k, dim=-1).indices
        
        # Собираем все рекомендации в один список
        all_recommendations = top_k_items.flatten().tolist()
        
        # Подсчитываем частоту рекомендаций
        recommendation_counts = Counter(all_recommendations)
        
        # Выбираем топ-K самых частых рекомендаций
        top_k_for_client = [item for item, count in recommendation_counts.most_common(top_k)]
        
        return top_k_for_client

In [49]:
# Выберем случайного клиента из тестовой выборки
client_index = 0  # Например, первый клиент в тестовой выборке
client_data = test_data[client_index].unsqueeze(0)  # Добавляем batch dimension
client_original_sequence = test_df.iloc[client_index]["item_sequence"]
client_masked_sequence = test_df.iloc[client_index]["masked_sequence"]

# Получаем топ-3 рекомендации для клиента
top_3_recommendations = predict(model, client_data, top_k=3)

# Выводим результаты
print(f"Клиент {client_index}:")
print(f"Оригинальная последовательность: {client_original_sequence}")
print(f"Маскированная последовательность: {client_masked_sequence}")
print(f"Топ-3 рекомендации для клиента: {top_3_recommendations}")

Клиент 0:
Оригинальная последовательность: [33, 13, 35, 32, 22, 49, 44, 1, 40, 20]
Маскированная последовательность: [33, 13, 35, 32, 22, 49, 44, 50, 40, 20]
Топ-3 рекомендации для клиента: [32, 5, 13]
