In [1]:
import numpy as np
import pandas as pd
import typing

from rectools import Columns
from rectools.metrics import Precision, Recall, MeanInvUserFreq, Serendipity, Accuracy, F1Beta
from rectools.metrics.ranking import MAP, MRR, NDCG
from rectools.models import RandomModel, PopularModel
from rectools.model_selection import TimeRangeSplitter

import sys  
sys.path.insert(1, '../')  # to make rec_sys visible

from rec_sys.metrics import CVMetrics
from rec_sys.visual_analysis import VisualAnalysis

  from .autonotebook import tqdm as notebook_tqdm


# Init metrics

In [2]:
n_splits = 3

models = {
    "random": RandomModel(random_state=47),
    "popular_int": PopularModel(popularity='n_interactions'),
}

def add_metrics(metrics: typing.Dict, name: str, metric: typing.Callable):
    metrics[f"{name}@1"] = metric(k=1)
    metrics[f"{name}@5"] = metric(k=5)
    metrics[f"{name}@10"] = metric(k=10)


metrics = {}
add_metrics(metrics, "Precision", Precision)
add_metrics(metrics, "Recall", Recall)
add_metrics(metrics, "Accuracy", Accuracy)
add_metrics(metrics, "F1", F1Beta)
add_metrics(metrics, "MAP", MAP)
add_metrics(metrics, "MRR", MRR)
add_metrics(metrics, "NDCG", NDCG)
add_metrics(metrics, "MeanInvUserFreq", MeanInvUserFreq)
add_metrics(metrics, "Serendipity", Serendipity)

splitter = TimeRangeSplitter(
    test_size="7D",
    n_splits=n_splits,
    filter_already_seen=True,
    filter_cold_items=True,
    filter_cold_users=True,
)

In [3]:
metrics = CVMetrics(
    models=models,
    metrics=metrics,
    splitter=splitter,
    k=10
)

# Read the data

In [4]:
interactions_df = pd.read_csv(
    "../data/interactions.csv", 
    sep=",",
    names=[Columns.User, Columns.Item, Columns.Datetime, 'total_dur', 'watched_pct'],
)

interactions_df = interactions_df.iloc[1:]
interactions_df = interactions_df[[Columns.User, Columns.Item, Columns.Datetime]]
interactions_df[Columns.Weight] = 1
interactions_df[Columns.Score] = 1
interactions_df[Columns.Item] = interactions_df[Columns.Item].astype("int")
interactions_df[Columns.User] = interactions_df[Columns.User].astype("int")

print(interactions_df.shape)
interactions_df.head()

  interactions_df = pd.read_csv(


(5476251, 5)


Unnamed: 0,user_id,item_id,datetime,weight,score
1,176549,9506,2021-05-11,1,1
2,699317,1659,2021-05-29,1,1
3,656683,7107,2021-05-09,1,1
4,864613,7638,2021-07-05,1,1
5,964868,9506,2021-04-30,1,1


In [5]:
items_df = pd.read_csv(
    "../data/items.csv", 
    sep=",",
)
items_df.head()

Unnamed: 0,item_id,content_type,title,title_orig,release_year,genres,countries,for_kids,age_rating,studios,directors,actors,description,keywords
0,10711,film,Поговори с ней,Hable con ella,2002.0,"драмы, зарубежные, детективы, мелодрамы",Испания,,16.0,,Педро Альмодовар,"Адольфо Фернандес, Ана Фернандес, Дарио Гранди...",Мелодрама легендарного Педро Альмодовара «Пого...,"Поговори, ней, 2002, Испания, друзья, любовь, ..."
1,2508,film,Голые перцы,Search Party,2014.0,"зарубежные, приключения, комедии",США,,16.0,,Скот Армстронг,"Адам Палли, Брайан Хаски, Дж.Б. Смув, Джейсон ...",Уморительная современная комедия на популярную...,"Голые, перцы, 2014, США, друзья, свадьбы, прео..."
2,10716,film,Тактическая сила,Tactical Force,2011.0,"криминал, зарубежные, триллеры, боевики, комедии",Канада,,16.0,,Адам П. Калтраро,"Адриан Холмс, Даррен Шалави, Джерри Вассерман,...",Профессиональный рестлер Стив Остин («Все или ...,"Тактическая, сила, 2011, Канада, бандиты, ганг..."
3,7868,film,45 лет,45 Years,2015.0,"драмы, зарубежные, мелодрамы",Великобритания,,16.0,,Эндрю Хэй,"Александра Риддлстон-Барретт, Джеральдин Джейм...","Шарлотта Рэмплинг, Том Кортни, Джеральдин Джей...","45, лет, 2015, Великобритания, брак, жизнь, лю..."
4,16268,film,Все решает мгновение,,1978.0,"драмы, спорт, советские, мелодрамы",СССР,,12.0,Ленфильм,Виктор Садовский,"Александр Абдулов, Александр Демьяненко, Алекс...",Расчетливая чаровница из советского кинохита «...,"Все, решает, мгновение, 1978, СССР, сильные, ж..."


# Calculate metrics

In [6]:
metrics.calculate_metrics(interactions_df)

100%|██████████| 3/3 [03:17<00:00, 65.97s/it]


In [7]:
metrics.print_metrics()

Unnamed: 0_level_0,Precision@1,Precision@1,Recall@1,Recall@1,Accuracy@1,Accuracy@1,F1@1,F1@1,Precision@5,Precision@5,Recall@5,Recall@5,Accuracy@5,Accuracy@5,F1@5,F1@5,Precision@10,Precision@10,Recall@10,Recall@10,Accuracy@10,Accuracy@10,F1@10,F1@10,NDCG@1,NDCG@1,NDCG@5,NDCG@5,NDCG@10,NDCG@10,MRR@1,MRR@1,MRR@5,MRR@5,MRR@10,MRR@10,MAP@1,MAP@1,MAP@5,MAP@5,MAP@10,MAP@10,MeanInvUserFreq@1,MeanInvUserFreq@1,MeanInvUserFreq@5,MeanInvUserFreq@5,MeanInvUserFreq@10,MeanInvUserFreq@10,Serendipity@1,Serendipity@1,Serendipity@5,Serendipity@5,Serendipity@10,Serendipity@10
Unnamed: 0_level_1,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std
model,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2,Unnamed: 22_level_2,Unnamed: 23_level_2,Unnamed: 24_level_2,Unnamed: 25_level_2,Unnamed: 26_level_2,Unnamed: 27_level_2,Unnamed: 28_level_2,Unnamed: 29_level_2,Unnamed: 30_level_2,Unnamed: 31_level_2,Unnamed: 32_level_2,Unnamed: 33_level_2,Unnamed: 34_level_2,Unnamed: 35_level_2,Unnamed: 36_level_2,Unnamed: 37_level_2,Unnamed: 38_level_2,Unnamed: 39_level_2,Unnamed: 40_level_2,Unnamed: 41_level_2,Unnamed: 42_level_2,Unnamed: 43_level_2,Unnamed: 44_level_2,Unnamed: 45_level_2,Unnamed: 46_level_2,Unnamed: 47_level_2,Unnamed: 48_level_2,Unnamed: 49_level_2,Unnamed: 50_level_2,Unnamed: 51_level_2,Unnamed: 52_level_2,Unnamed: 53_level_2,Unnamed: 54_level_2
random,0.000213,2.7e-05,7.7e-05,3e-05,0.99976,2e-06,9.7e-05,3.1e-05,0.000177,1.2e-05,0.000338,4.3e-05,0.9995,5e-06,0.000193,1.7e-05,0.000182,7e-06,0.000695,2.8e-05,0.999176,8e-06,0.000251,9e-06,0.000213,2.7e-05,0.000185,1.1e-05,0.000186,8e-06,0.000213,2.7e-05,0.000436,2.6e-05,0.000556,2.6e-05,7.7e-05,3e-05,0.000162,2.9e-05,0.000208,2.8e-05,15.60489,0.019506,15.612142,0.025779,15.613775,0.023606,6e-06,2e-06,6e-06,1e-06,6e-06,1e-06
popular_int,0.076432,0.006826,0.04272,0.004366,0.99977,1e-06,0.049677,0.004912,0.052402,0.001618,0.137413,0.005346,0.999534,3e-06,0.067764,0.00236,0.033903,0.001443,0.173492,0.007987,0.99922,6e-06,0.051827,0.002296,0.076432,0.006826,0.057932,0.002332,0.043084,0.001978,0.076432,0.006826,0.131669,0.006167,0.138603,0.006728,0.04272,0.004366,0.078295,0.00437,0.084109,0.004921,2.377055,0.023002,3.066979,0.012316,3.71339,0.002076,2e-06,0.0,3e-06,0.0,2e-06,0.0


In [8]:
metrics.models

{'random': <rectools.models.random.RandomModel at 0x1a6a07c9540>,
 'popular_int': <rectools.models.popular.PopularModel at 0x1a6a07c94b0>}

# Visual Analysis

In [9]:
visual_analysis = VisualAnalysis(
    trained_model=metrics.models["random"],
    interactions_df=interactions_df,
    user_ids=np.array([666262, 672861, 955527]),
    item_data=items_df,
).visualize()

In [10]:
for user in visual_analysis:
    print(f'Пользователь: {user}')
    print('Рекомендации:')
    display(visual_analysis[user]["recommendations"])
    print('История просмотров:')
    display(visual_analysis[user]["user_history"])
    print('\n')

Пользователь: 666262
Рекомендации:


Unnamed: 0,title,genres,user_views,total_views,score,rank
0,И шарик вернется,"русские, мелодрамы",0,26,10,1
1,Малефисента,"семейное, фэнтези, приключения, мелодрамы",0,1956,9,2
2,Баксы,"драмы, фэнтези",0,9,8,3
3,Маруся 2. Трудные взрослые,"русские, мелодрамы",0,5,7,4
4,Спайды,"фантастика, зарубежные, триллеры, детективы",0,22,6,5
5,Республика Сары,драмы,0,46,5,6
6,Стычка в ночи,"драмы, зарубежные, фильм-нуар, мелодрамы",0,3,4,7
7,Невероятная история о гигантской груше,"мультфильм, приключения",0,150,3,8
8,Таймлесс 2: Сапфировая книга,приключения,0,7,2,9
9,Беги,"триллеры, криминал, комедии",0,40,1,10


История просмотров:


Unnamed: 0,title,genres,datetime,user_views,total_views
0,Последний викинг,"боевики, историческое, приключения",2021-05-12,1,746
1,Робин Гуд: Начало,"боевики, триллеры, приключения",2021-05-12,1,485
2,Томирис,"боевики, драмы, историческое, военные",2021-05-14,1,10370




Пользователь: 672861
Рекомендации:


Unnamed: 0,title,genres,user_views,total_views,score,rank
0,Всё дело в брате,"семейное, советские, для детей",0,3,10,1
1,На золотом крыльце сидели,"семейное, фэнтези",0,104,9,2
2,"Ярославна, королева Франции","советские, биография, приключения",0,3,8,3
3,Дракон: История Брюса Ли,"боевики, драмы, биография, мелодрамы",0,803,7,4
4,Мадам парфюмер,комедии,0,1083,6,5
5,100% волк,"мультфильм, приключения, семейное, фэнтези, ко...",0,28372,5,6
6,"Макатеа, промышленная зона. Французская Полинезия",документальное,0,31,4,7
7,Серая мышь,"драмы, русские",0,1,3,8
8,Свидетели (жестовым языком),"драмы, военные",0,4,2,9
9,Монстр в Париже (с тифлокомментарием),"зарубежные, семейное, фэнтези, полнометражные",0,44,1,10


История просмотров:


Unnamed: 0,title,genres,datetime,user_views,total_views
0,Красавица и чудовище,"драмы, фэнтези, музыкальные",2021-04-27,1,1083
1,Он – дракон,фэнтези,2021-05-04,1,643




Пользователь: 955527
Рекомендации:


Unnamed: 0,title,genres,user_views,total_views,score,rank
0,Легенда о Нараяме,драмы,0,186,10,1
1,Костер в белой ночи,"катастрофы, семейное, советские, боевики",0,1,9,2
2,Покемон Фильм: Курем против Меча справедливости,"аниме, приключения, зарубежные, семейное, фэнтези",0,2,8,3
3,Без особых примет,"зарубежные, триллеры",0,1,7,4
4,Я больше не верю в любовь,"драмы, зарубежные",0,2,6,5
5,Семеро солдатиков,семейное,0,13,5,6
6,Просто о важном. Про Миру и Гошу,"развлекательные, развитие, мультфильмы",0,48,4,7
7,Влюблённые женщины,драмы,0,167,3,8
8,"Карты, деньги, два ствола",комедии,0,61,2,9
9,Максим Перепелица,"советские, комедии",0,14,1,10


История просмотров:


Unnamed: 0,title,genres,datetime,user_views,total_views
0,Стань легендой! Бигфут Младший,"мультфильм, фэнтези, приключения, комедии",2021-06-02,1,1587
1,Пеле: Рождение легенды,"драмы, спорт, биография",2021-05-04,1,945
2,Лобановский навсегда,"спорт, биография, документальное",2021-06-02,1,683
3,Диего Марадона,"спорт, биография, документальное",2021-06-02,1,691




