In [1]:
import os
from copy import deepcopy

import pandas as pd
from rectools.dataset import Dataset
from rectools.model_selection import TimeRangeSplitter
from rectools.models import PopularModel, RandomModel
from rectools.metrics import MAP, NDCG, Precision, Recall, MeanInvUserFreq, Serendipity

from dev_eval import calculate_metrics, read_kion_dataset, visualize

pd.set_option("display.max_columns", None)

# Data

Подгружаем датасет кион используя дополнительную функцию

In [2]:
kion_data = read_kion_dataset()
interactions = kion_data["interactions"]
users = kion_data["users"]
items = kion_data["items"]

# Параметры тестирования функций

Модели: `rectools.models.RandomModel(random_state=32)`, `rectools.models.PopularModel()` с параметрами по умолчанию

In [3]:
models = {
    "random": RandomModel(random_state=32),
    "popular": PopularModel(),
}

Метрики: 2 ранжирующие (MAP, NDCG), 2 классификационные (precision, recall), 2 beyond-accuracy (novelty, serendipity). Считаем по порогам 1, 5, 10. MAP обязательно

In [4]:
metrics = {
    "MAP@1": MAP(k=1),
    "MAP@5": MAP(k=5),
    "MAP@10": MAP(k=10),
    "NDCG@1": NDCG(k=1),
    "NDCG@5": NDCG(k=5),
    "NDCG@10": NDCG(k=10),
    "precision@1": Precision(k=1),
    "precision@5": Precision(k=5),
    "precision@10": Precision(k=10),
    "recall@1": Recall(k=1),
    "recall@5": Recall(k=5),
    "recall@10": Recall(k=10),
    "novelty@1": MeanInvUserFreq(k=1),
    "novelty@5": MeanInvUserFreq(k=5),
    "novelty@10": MeanInvUserFreq(k=10),
    "serendipity@1": Serendipity(k=1),
    "serendipity@5": Serendipity(k=5),
    "serendipity@10": Serendipity(k=10),
}

Сплиттер: `rectools.model_selection.TimeRangeSplitter`, 3 фолда для кросс-валидации по неделе, исключение холодных юзеров и айтемов и просмотренных айтемов

In [5]:
cv = TimeRangeSplitter(
    test_size="7D",  # по неделе
    n_splits=3,  # 3 фолда для кросс-валидации
    filter_already_seen=True,  # исключение просмотренных айтемов
    filter_cold_items=True,  # исключение холодных айтемов
    filter_cold_users=True,  #  исключение холодных юзеров
)

Визуализация рекомендаций и историй просмотров для юзеров `[666262, 672861, 955527]`. Для айтемов обязательно отражаем названия, жанры и количество просмотров в датасете (как для айтемов из истории взаимодействий каждого юзера, так и для айтемов из его рекомендаций)

In [6]:
users_list = [666262, 672861, 955527]
k_recos = 10

# Функция 1: метрики 

In [7]:
result_data = calculate_metrics(models, kion_data, metrics, cv, k_recos=k_recos, style=True)
result_data

  0%|          | 0/3 [00:00<?, ?it/s]

Fit time: 0.0 sec.
Recommend time: 5.88 sec.
Metrics time: 2.2 sec.
Fit time: 1.25 sec.
Recommend time: 3.62 sec.
Metrics time: 1.89 sec.
Fit time: 0.0 sec.
Recommend time: 5.52 sec.
Metrics time: 2.02 sec.
Fit time: 1.28 sec.
Recommend time: 3.81 sec.
Metrics time: 2.44 sec.
Fit time: 0.0 sec.
Recommend time: 6.39 sec.
Metrics time: 2.4 sec.
Fit time: 1.48 sec.
Recommend time: 3.85 sec.
Metrics time: 2.39 sec.


Metric,MAP,MAP,MAP,MAP,MAP,MAP,NDCG,NDCG,NDCG,NDCG,NDCG,NDCG,precision,precision,precision,precision,precision,precision,recall,recall,recall,recall,recall,recall,novelty,novelty,novelty,novelty,novelty,novelty,serendipity,serendipity,serendipity,serendipity,serendipity,serendipity
At,1,1,5,5,10,10,1,1,5,5,10,10,1,1,5,5,10,10,1,1,5,5,10,10,1,1,5,5,10,10,1,1,5,5,10,10
Stat,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std
model,Unnamed: 1_level_3,Unnamed: 2_level_3,Unnamed: 3_level_3,Unnamed: 4_level_3,Unnamed: 5_level_3,Unnamed: 6_level_3,Unnamed: 7_level_3,Unnamed: 8_level_3,Unnamed: 9_level_3,Unnamed: 10_level_3,Unnamed: 11_level_3,Unnamed: 12_level_3,Unnamed: 13_level_3,Unnamed: 14_level_3,Unnamed: 15_level_3,Unnamed: 16_level_3,Unnamed: 17_level_3,Unnamed: 18_level_3,Unnamed: 19_level_3,Unnamed: 20_level_3,Unnamed: 21_level_3,Unnamed: 22_level_3,Unnamed: 23_level_3,Unnamed: 24_level_3,Unnamed: 25_level_3,Unnamed: 26_level_3,Unnamed: 27_level_3,Unnamed: 28_level_3,Unnamed: 29_level_3,Unnamed: 30_level_3,Unnamed: 31_level_3,Unnamed: 32_level_3,Unnamed: 33_level_3,Unnamed: 34_level_3,Unnamed: 35_level_3,Unnamed: 36_level_3
popular,0.04272,0.004366,0.078295,0.00437,0.084109,0.004921,0.076432,0.006826,0.057932,0.002332,0.043084,0.001978,0.076432,0.006826,0.052402,0.001618,0.033903,0.001443,0.04272,0.004366,0.137413,0.005346,0.173492,0.007987,2.377055,0.023002,3.066979,0.012316,3.71339,0.002076,2e-06,0.0,3e-06,0.0,2e-06,0.0
random,7.2e-05,1.9e-05,0.000169,3.3e-05,0.000211,3.2e-05,0.000221,3.3e-05,0.000208,2.5e-05,0.0002,2e-05,0.000221,3.3e-05,0.000202,2.8e-05,0.000193,1.9e-05,7.2e-05,1.9e-05,0.000365,8.4e-05,0.000693,7.6e-05,15.614137,0.022585,15.612989,0.01957,15.613009,0.019786,6e-06,2e-06,7e-06,1e-06,7e-06,0.0


# Функция 2: визуализация

In [8]:
item_data = ["title", "genres"]
k_recos = 10

In [9]:
for model_name in models:
    print(f"==={model_name}===")
    # extract model and train
    model = deepcopy(models[model_name])
    dataset_for_train = Dataset.construct(interactions.df)
    model.fit(dataset_for_train)
    visualize(model, kion_data, users_list, item_data, k_recos=k_recos, display=display)

===random===
Visual report
----------------------------------------------------------
User: 666262
Already watched films amount: 3
Display last 10 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
2,12981,2021-05-14,10292.0,100.0,12981,Томирис,"боевики, драмы, историческое, военные",10370
0,7957,2021-05-12,2052.0,32.0,7957,Последний викинг,"боевики, историческое, приключения",746
1,4785,2021-05-12,1946.0,28.0,4785,Робин Гуд: Начало,"боевики, триллеры, приключения",485



Recommended films amount: 10
(Amount of all films: 15706)
Display first 10 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10101,10,1,10101,Возвращение Будулая,мелодрамы,99
1,619,9,2,619,Новые приключения Аладдина (жестовым языком),"зарубежные, комедии",1
2,12618,8,3,12618,Пропавшая грамота,"фэнтези, комедии",51
3,5967,7,4,5967,Братья вне игры,"драмы, спорт",262
4,4041,6,5,4041,Фрилансеры,"криминал, детективы, драмы, зарубежные, боевики",19
5,5701,5,6,5701,Алые паруса: Новая история,"комедии, мелодрамы",4
6,9738,4,7,9738,Женщина в беде 3,"детективы, мелодрамы",2
7,15247,3,8,15247,Гордость и предубеждение,"драмы, мелодрамы",150
8,10004,2,9,10004,Болванчики,"мультфильм, приключения, комедии",51
9,2816,1,10,2816,Избави нас от лукавого,"ужасы, триллеры, детективы",1370


----------------------------------------------------------
User: 672861
Already watched films amount: 2
Display last 10 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
1,8662,2021-05-04,6354.0,100.0,8662,Он – дракон,фэнтези,643
0,6870,2021-04-27,10.0,0.0,6870,Красавица и чудовище,"драмы, фэнтези, музыкальные",1083



Recommended films amount: 10
(Amount of all films: 15706)
Display first 10 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,9457,10,1,9457,Комната (жестовым языком),"драмы, зарубежные, триллеры",5
1,15730,9,2,15730,Твое подтянутое тело,фитнес,2
2,473,8,3,473,Кто такой Букабу?,"развлекательные, для детей, документальное",15
3,12736,7,4,12736,Палач,"драмы, зарубежные, комедии",3
4,3927,6,5,3927,Помни меня,"драмы, мелодрамы",2982
5,3300,5,6,3300,Антилопа Гну. Южная Африка,документальное,8
6,5334,4,7,5334,Boys and Toys,no_genre,3
7,14273,3,8,14273,Влюбленный скорпион,"драмы, зарубежные, спорт, триллеры, мелодрамы",2
8,3087,2,9,3087,Жуки - караоке,no_genre,1
9,4416,1,10,4416,Питер,"фэнтези, приключения",33


----------------------------------------------------------
User: 955527
Already watched films amount: 4
Display last 10 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
0,1183,2021-06-02,40.0,1.0,1183,Стань легендой! Бигфут Младший,"мультфильм, фэнтези, приключения, комедии",1587
2,4725,2021-06-02,255.0,4.0,4725,Лобановский навсегда,"спорт, биография, документальное",683
3,1238,2021-06-02,556.0,7.0,1238,Диего Марадона,"спорт, биография, документальное",691
1,13371,2021-05-04,686.0,11.0,13371,Пеле: Рождение легенды,"драмы, спорт, биография",945



Recommended films amount: 10
(Amount of all films: 15706)
Display first 10 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,496,10,1,496,Воскресший Эртугрул,"боевики, драмы, приключения",6167
1,4205,9,2,4205,Дело гастронома №1 (Операция Беркут),"драмы, русские",1
2,10822,8,3,10822,Она защищает Родину,"драмы, советские, военные",2
3,10914,7,4,10914,Великолепная,"зарубежные, комедии, мелодрамы",3
4,3999,6,5,3999,Джиперс криперс,"ужасы, триллеры",648
5,15756,5,6,15756,Ремнант: Всё ещё вижу тебя (жестовым языком),"фантастика, зарубежные, триллеры",2
6,14961,4,7,14961,Битва за Землю,"боевики, ужасы, фантастика, триллеры",2032
7,13734,3,8,13734,Сексуальный массаж и Фантазии,для взрослых,31
8,3407,2,9,3407,Черный капитан,"боевики, русские, военные",1
9,14614,1,10,14614,Настя,"мелодрамы, комедии",2


===popular===
Visual report
----------------------------------------------------------
User: 666262
Already watched films amount: 3
Display last 10 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
2,12981,2021-05-14,10292.0,100.0,12981,Томирис,"боевики, драмы, историческое, военные",10370
0,7957,2021-05-12,2052.0,32.0,7957,Последний викинг,"боевики, историческое, приключения",746
1,4785,2021-05-12,1946.0,28.0,4785,Робин Гуд: Начало,"боевики, триллеры, приключения",485



Recommended films amount: 10
(Amount of all films: 15706)
Display first 10 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10440,202457.0,1,10440,Хрустальный,"триллеры, детективы",202457
1,15297,193123.0,2,15297,Клиника счастья,"драмы, мелодрамы",193123
2,9728,132865.0,3,9728,Гнев человеческий,"боевики, триллеры",132865
3,13865,122119.0,4,13865,Девятаев,"драмы, военные, приключения",122119
4,4151,91167.0,5,4151,Секреты семейной жизни,комедии,91167
5,3734,74803.0,6,3734,Прабабушка легкого поведения,комедии,74803
6,2657,68581.0,7,2657,Подслушано,"драмы, триллеры",68581
7,4880,55043.0,8,4880,Афера,комедии,55043
8,142,45367.0,9,142,Маша,"драмы, триллеры",45367
9,6809,40372.0,10,6809,Дуров,документальное,40372


----------------------------------------------------------
User: 672861
Already watched films amount: 2
Display last 10 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
1,8662,2021-05-04,6354.0,100.0,8662,Он – дракон,фэнтези,643
0,6870,2021-04-27,10.0,0.0,6870,Красавица и чудовище,"драмы, фэнтези, музыкальные",1083



Recommended films amount: 10
(Amount of all films: 15706)
Display first 10 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10440,202457.0,1,10440,Хрустальный,"триллеры, детективы",202457
1,15297,193123.0,2,15297,Клиника счастья,"драмы, мелодрамы",193123
2,9728,132865.0,3,9728,Гнев человеческий,"боевики, триллеры",132865
3,13865,122119.0,4,13865,Девятаев,"драмы, военные, приключения",122119
4,4151,91167.0,5,4151,Секреты семейной жизни,комедии,91167
5,3734,74803.0,6,3734,Прабабушка легкого поведения,комедии,74803
6,2657,68581.0,7,2657,Подслушано,"драмы, триллеры",68581
7,4880,55043.0,8,4880,Афера,комедии,55043
8,142,45367.0,9,142,Маша,"драмы, триллеры",45367
9,6809,40372.0,10,6809,Дуров,документальное,40372


----------------------------------------------------------
User: 955527
Already watched films amount: 4
Display last 10 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
0,1183,2021-06-02,40.0,1.0,1183,Стань легендой! Бигфут Младший,"мультфильм, фэнтези, приключения, комедии",1587
2,4725,2021-06-02,255.0,4.0,4725,Лобановский навсегда,"спорт, биография, документальное",683
3,1238,2021-06-02,556.0,7.0,1238,Диего Марадона,"спорт, биография, документальное",691
1,13371,2021-05-04,686.0,11.0,13371,Пеле: Рождение легенды,"драмы, спорт, биография",945



Recommended films amount: 10
(Amount of all films: 15706)
Display first 10 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10440,202457.0,1,10440,Хрустальный,"триллеры, детективы",202457
1,15297,193123.0,2,15297,Клиника счастья,"драмы, мелодрамы",193123
2,9728,132865.0,3,9728,Гнев человеческий,"боевики, триллеры",132865
3,13865,122119.0,4,13865,Девятаев,"драмы, военные, приключения",122119
4,4151,91167.0,5,4151,Секреты семейной жизни,комедии,91167
5,3734,74803.0,6,3734,Прабабушка легкого поведения,комедии,74803
6,2657,68581.0,7,2657,Подслушано,"драмы, триллеры",68581
7,4880,55043.0,8,4880,Афера,комедии,55043
8,142,45367.0,9,142,Маша,"драмы, триллеры",45367
9,6809,40372.0,10,6809,Дуров,документальное,40372


Проверка, если попросить выводить только первые пять (меняем `k_display`, не `k_recos`)

In [11]:
for model_name in models:
    print(f"==={model_name}===")
    # extract model and train
    model = deepcopy(models[model_name])
    dataset_for_train = Dataset.construct(interactions.df)
    model.fit(dataset_for_train)
    visualize(model, kion_data, users_list, item_data, k_recos=k_recos, display=display, k_display=5)

===random===
Visual report
----------------------------------------------------------
User: 666262
Already watched films amount: 3
Display last 5 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
2,12981,2021-05-14,10292.0,100.0,12981,Томирис,"боевики, драмы, историческое, военные",10370
0,7957,2021-05-12,2052.0,32.0,7957,Последний викинг,"боевики, историческое, приключения",746
1,4785,2021-05-12,1946.0,28.0,4785,Робин Гуд: Начало,"боевики, триллеры, приключения",485



Recommended films amount: 10
(Amount of all films: 15706)
Display first 5 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10101,10,1,10101,Возвращение Будулая,мелодрамы,99
1,619,9,2,619,Новые приключения Аладдина (жестовым языком),"зарубежные, комедии",1
2,12618,8,3,12618,Пропавшая грамота,"фэнтези, комедии",51
3,5967,7,4,5967,Братья вне игры,"драмы, спорт",262
4,4041,6,5,4041,Фрилансеры,"криминал, детективы, драмы, зарубежные, боевики",19


----------------------------------------------------------
User: 672861
Already watched films amount: 2
Display last 5 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
1,8662,2021-05-04,6354.0,100.0,8662,Он – дракон,фэнтези,643
0,6870,2021-04-27,10.0,0.0,6870,Красавица и чудовище,"драмы, фэнтези, музыкальные",1083



Recommended films amount: 10
(Amount of all films: 15706)
Display first 5 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,9457,10,1,9457,Комната (жестовым языком),"драмы, зарубежные, триллеры",5
1,15730,9,2,15730,Твое подтянутое тело,фитнес,2
2,473,8,3,473,Кто такой Букабу?,"развлекательные, для детей, документальное",15
3,12736,7,4,12736,Палач,"драмы, зарубежные, комедии",3
4,3927,6,5,3927,Помни меня,"драмы, мелодрамы",2982


----------------------------------------------------------
User: 955527
Already watched films amount: 4
Display last 5 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
0,1183,2021-06-02,40.0,1.0,1183,Стань легендой! Бигфут Младший,"мультфильм, фэнтези, приключения, комедии",1587
2,4725,2021-06-02,255.0,4.0,4725,Лобановский навсегда,"спорт, биография, документальное",683
3,1238,2021-06-02,556.0,7.0,1238,Диего Марадона,"спорт, биография, документальное",691
1,13371,2021-05-04,686.0,11.0,13371,Пеле: Рождение легенды,"драмы, спорт, биография",945



Recommended films amount: 10
(Amount of all films: 15706)
Display first 5 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,496,10,1,496,Воскресший Эртугрул,"боевики, драмы, приключения",6167
1,4205,9,2,4205,Дело гастронома №1 (Операция Беркут),"драмы, русские",1
2,10822,8,3,10822,Она защищает Родину,"драмы, советские, военные",2
3,10914,7,4,10914,Великолепная,"зарубежные, комедии, мелодрамы",3
4,3999,6,5,3999,Джиперс криперс,"ужасы, триллеры",648


===popular===
Visual report
----------------------------------------------------------
User: 666262
Already watched films amount: 3
Display last 5 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
2,12981,2021-05-14,10292.0,100.0,12981,Томирис,"боевики, драмы, историческое, военные",10370
0,7957,2021-05-12,2052.0,32.0,7957,Последний викинг,"боевики, историческое, приключения",746
1,4785,2021-05-12,1946.0,28.0,4785,Робин Гуд: Начало,"боевики, триллеры, приключения",485



Recommended films amount: 10
(Amount of all films: 15706)
Display first 5 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10440,202457.0,1,10440,Хрустальный,"триллеры, детективы",202457
1,15297,193123.0,2,15297,Клиника счастья,"драмы, мелодрамы",193123
2,9728,132865.0,3,9728,Гнев человеческий,"боевики, триллеры",132865
3,13865,122119.0,4,13865,Девятаев,"драмы, военные, приключения",122119
4,4151,91167.0,5,4151,Секреты семейной жизни,комедии,91167


----------------------------------------------------------
User: 672861
Already watched films amount: 2
Display last 5 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
1,8662,2021-05-04,6354.0,100.0,8662,Он – дракон,фэнтези,643
0,6870,2021-04-27,10.0,0.0,6870,Красавица и чудовище,"драмы, фэнтези, музыкальные",1083



Recommended films amount: 10
(Amount of all films: 15706)
Display first 5 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10440,202457.0,1,10440,Хрустальный,"триллеры, детективы",202457
1,15297,193123.0,2,15297,Клиника счастья,"драмы, мелодрамы",193123
2,9728,132865.0,3,9728,Гнев человеческий,"боевики, триллеры",132865
3,13865,122119.0,4,13865,Девятаев,"драмы, военные, приключения",122119
4,4151,91167.0,5,4151,Секреты семейной жизни,комедии,91167


----------------------------------------------------------
User: 955527
Already watched films amount: 4
Display last 5 watched:



Unnamed: 0,item_id,datetime,weight,watched_pct,item_id_x,title,genres,item_id_y
0,1183,2021-06-02,40.0,1.0,1183,Стань легендой! Бигфут Младший,"мультфильм, фэнтези, приключения, комедии",1587
2,4725,2021-06-02,255.0,4.0,4725,Лобановский навсегда,"спорт, биография, документальное",683
3,1238,2021-06-02,556.0,7.0,1238,Диего Марадона,"спорт, биография, документальное",691
1,13371,2021-05-04,686.0,11.0,13371,Пеле: Рождение легенды,"драмы, спорт, биография",945



Recommended films amount: 10
(Amount of all films: 15706)
Display first 5 recommendations:


Unnamed: 0,item_id,score,rank,item_id_x,title,genres,item_id_y
0,10440,202457.0,1,10440,Хрустальный,"триллеры, детективы",202457
1,15297,193123.0,2,15297,Клиника счастья,"драмы, мелодрамы",193123
2,9728,132865.0,3,9728,Гнев человеческий,"боевики, триллеры",132865
3,13865,122119.0,4,13865,Девятаев,"драмы, военные, приключения",122119
4,4151,91167.0,5,4151,Секреты семейной жизни,комедии,91167


Работает!