## Загрузка данных <a name="data-loader"></a>

In [1]:
import numpy as np

In [2]:
# используем пакет https://pypi.org/project/rs-datasets/
!pip install rs_datasets

You should consider upgrading via the 'pip install --upgrade pip' command.[0m


In [3]:
from rs_datasets import MovieLens

data = MovieLens("100k")
data.info()

ratings


Unnamed: 0,user_id,item_id,rating,timestamp
0,196,242,3,881250949
1,186,302,3,891717742
2,22,377,1,878887116



users


Unnamed: 0,user_id,gender,age,occupation,zip_code
0,1,24,M,technician,85711
1,2,53,F,other,94043
2,3,23,M,writer,32067



items


Unnamed: 0,item_id,title,release_date,imdb_url,unknown,Action,Adventure,Animation,Children's,Comedy,...,Fantasy,Film-Noir,Horror,Musical,Mystery,Romance,Sci-Fi,Thriller,War,Western
0,1,Toy Story (1995),01-Jan-1995,http://us.imdb.com/M/title-exact?Toy%20Story%2...,False,False,False,True,True,True,...,False,False,False,False,False,False,False,False,False,False
1,2,GoldenEye (1995),01-Jan-1995,http://us.imdb.com/M/title-exact?GoldenEye%20(...,False,True,True,False,False,False,...,False,False,False,False,False,False,False,True,False,False
2,3,Four Rooms (1995),01-Jan-1995,http://us.imdb.com/M/title-exact?Four%20Rooms%...,False,False,False,False,False,False,...,False,False,False,False,False,False,False,True,False,False





In [4]:
users_count_from_log = data.ratings['user_id'].unique().shape 
items_count_from_log = data.ratings['item_id'].unique().shape

In [5]:
# загрузим данные в Spark

from replay.data_preparator import DataPreparator

log = DataPreparator().transform(
    data=data.ratings,
    columns_names={
        "user_id": "user_id",
        "item_id": "item_id",
        "timestamp": "timestamp",
        "relevance": "rating"
    }
).cache()

## Сценарий с разными моделями

In [6]:
import numpy as np
import replay

In [7]:
# import importlib
# importlib.reload(replay)

<module 'replay' from '/mnt2/volodkevich/replay_tasks/replay/replay/__init__.py'>

## Пример с KNN

In [8]:
from replay.models import *

MODELS = {'knn_': KNN(), 
         'slim_': SLIM(),
         'random_rec_': RandomRec()}

PARAM_GRID = {'knn_':
              {
                  'num_neighbours': [3, 100],
                  'shrink': []
              },
              'slim_':
              {
                  'beta': [2**(-8), 2], 
                  'lambda_': [2**(-8), 2]
              },
              'random_rec_':
              {
                  'distribution': ['popular_based', 'uniform']
              }
             }

##  Схема валидации

In [9]:
from replay.splitters import UserSplitter

user_random_splitter = UserSplitter(
    item_test_size=1,
    user_test_size=0.2,
    drop_cold_items=True,
    drop_cold_users=True,
    shuffle=True,
    seed=1234
)

## Обучение сценария <a name="fit-scenario"></a>

In [12]:
from replay.scenarios import MainScenario
from replay.metrics import NDCG, HitRate

### KNN

In [13]:
KNN._search_space['shrink']['type'] = 'int'
KNN._search_space['shrink']['args'] = [0, 50]
KNN._search_space

{'num_neighbours': {'type': 'int', 'args': [5, 100]},
 'shrink': {'type': 'int', 'args': [0, 50]}}

In [15]:
k = 10
k_for_metrics = [10, 5, 1] 
budget = 20
metrics={
        NDCG: k_for_metrics,
        HitRate: k_for_metrics
}

In [16]:
scenario = MainScenario(
    splitter=user_random_splitter,
    recommender=MODELS['knn_'],
    criterion=NDCG,
    metrics=metrics
)

In [17]:
best_knn_params = scenario.research(PARAM_GRID['knn_'],
    log,
    k=k,
    n_trials=budget
)
knn_results = scenario.experiment.results

11-Nov-20 16:55:29, replay, DEBUG: Деление лога на обучающую и тестовую выборку
11-Nov-20 16:55:40, replay, DEBUG: Длина трейна и теста: 99812 187
11-Nov-20 16:55:42, replay, DEBUG: Количество пользователей в трейне и тесте: 943, 187
11-Nov-20 16:55:43, replay, DEBUG: Количество объектов в трейне и тесте: 1681, 154
11-Nov-20 16:55:44, replay, DEBUG: Инициализация метрик
11-Nov-20 16:55:44, replay, DEBUG: Обучение и предсказание дополнительной модели
11-Nov-20 16:55:44, replay, DEBUG: Начало обучения PopRec
11-Nov-20 16:55:44, replay, DEBUG: Предварительная стадия обучения (pre-fit)
11-Nov-20 16:55:46, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 16:55:48, replay, DEBUG: Начало предикта PopRec
11-Nov-20 16:55:54, replay, DEBUG: Оптимизация параметров
11-Nov-20 16:55:54, replay, DEBUG: Количество попыток: 20
11-Nov-20 16:55:54, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 16:55:54, replay, DEBUG: Начало обучения KNN
11-Nov-20 16:55:54, replay, DEBUG: Предварител

{10: 0.10019754834638137}


11-Nov-20 16:56:44, replay, DEBUG: NDCG=0.10
[32m[I 2020-11-11 16:56:44,830][0m Finished trial#0 resulted in value: 0.10019754834638137. Current best value is 0.10019754834638137 with parameters: {'num_neighbours': 82, 'shrink': 40}.[0m
11-Nov-20 16:56:44, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 16:56:44, replay, DEBUG: Начало обучения KNN
11-Nov-20 16:56:44, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 16:56:46, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 16:56:46, replay, DEBUG: Начало предикта KNN
11-Nov-20 16:56:51, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.11867968544793812}


11-Nov-20 16:57:22, replay, DEBUG: NDCG=0.12
[32m[I 2020-11-11 16:57:22,583][0m Finished trial#1 resulted in value: 0.11867968544793812. Current best value is 0.11867968544793812 with parameters: {'num_neighbours': 68, 'shrink': 25}.[0m
11-Nov-20 16:57:22, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 16:57:22, replay, DEBUG: Начало обучения KNN
11-Nov-20 16:57:22, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 16:57:24, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 16:57:24, replay, DEBUG: Начало предикта KNN
11-Nov-20 16:57:28, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.13428789707832686}


11-Nov-20 16:57:56, replay, DEBUG: NDCG=0.13
[32m[I 2020-11-11 16:57:56,980][0m Finished trial#2 resulted in value: 0.13428789707832686. Current best value is 0.13428789707832686 with parameters: {'num_neighbours': 37, 'shrink': 12}.[0m
11-Nov-20 16:57:56, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 16:57:56, replay, DEBUG: Начало обучения KNN
11-Nov-20 16:57:56, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 16:57:58, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 16:57:58, replay, DEBUG: Начало предикта KNN
11-Nov-20 16:58:02, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.15169487705471352}


11-Nov-20 16:58:31, replay, DEBUG: NDCG=0.15
[32m[I 2020-11-11 16:58:31,512][0m Finished trial#3 resulted in value: 0.15169487705471352. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 16:58:31, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 16:58:31, replay, DEBUG: Начало обучения KNN
11-Nov-20 16:58:31, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 16:58:32, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 16:58:32, replay, DEBUG: Начало предикта KNN
11-Nov-20 16:58:36, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.113550314760753}


11-Nov-20 16:59:05, replay, DEBUG: NDCG=0.11
[32m[I 2020-11-11 16:59:05,434][0m Finished trial#4 resulted in value: 0.113550314760753. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 16:59:05, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 16:59:05, replay, DEBUG: Начало обучения KNN
11-Nov-20 16:59:05, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 16:59:06, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 16:59:06, replay, DEBUG: Начало предикта KNN
11-Nov-20 16:59:11, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.14074986770177583}


11-Nov-20 16:59:40, replay, DEBUG: NDCG=0.14
[32m[I 2020-11-11 16:59:40,422][0m Finished trial#5 resulted in value: 0.14074986770177583. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 16:59:40, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 16:59:40, replay, DEBUG: Начало обучения KNN
11-Nov-20 16:59:40, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 16:59:41, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 16:59:41, replay, DEBUG: Начало предикта KNN
11-Nov-20 16:59:46, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.1230382583615503}


11-Nov-20 17:00:13, replay, DEBUG: NDCG=0.12
[32m[I 2020-11-11 17:00:13,390][0m Finished trial#6 resulted in value: 0.1230382583615503. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 17:00:13, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:00:13, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:00:13, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:00:14, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:00:14, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:00:18, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.128332954979549}


11-Nov-20 17:00:43, replay, DEBUG: NDCG=0.13
[32m[I 2020-11-11 17:00:44,122][0m Finished trial#7 resulted in value: 0.128332954979549. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 17:00:44, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:00:44, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:00:44, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:00:45, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:00:45, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:00:49, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.12911127338018089}


11-Nov-20 17:01:15, replay, DEBUG: NDCG=0.13
[32m[I 2020-11-11 17:01:15,565][0m Finished trial#8 resulted in value: 0.12911127338018089. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 17:01:15, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:01:15, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:01:15, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:01:16, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:01:16, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:01:20, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.11710044233716631}


11-Nov-20 17:01:48, replay, DEBUG: NDCG=0.12
[32m[I 2020-11-11 17:01:48,580][0m Finished trial#9 resulted in value: 0.11710044233716631. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 17:01:48, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:01:48, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:01:48, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:01:49, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:01:49, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:01:56, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.1406194733104321}


11-Nov-20 17:02:22, replay, DEBUG: NDCG=0.14
[32m[I 2020-11-11 17:02:22,809][0m Finished trial#10 resulted in value: 0.1406194733104321. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 17:02:22, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:02:22, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:02:22, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:02:23, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:02:23, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:02:27, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.14489153552418288}


11-Nov-20 17:02:55, replay, DEBUG: NDCG=0.14
[32m[I 2020-11-11 17:02:55,468][0m Finished trial#11 resulted in value: 0.14489153552418288. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 17:02:55, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:02:55, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:02:55, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:02:56, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:02:56, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:03:00, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.14474608412867812}


11-Nov-20 17:03:27, replay, DEBUG: NDCG=0.14
[32m[I 2020-11-11 17:03:28,184][0m Finished trial#12 resulted in value: 0.14474608412867812. Current best value is 0.15169487705471352 with parameters: {'num_neighbours': 13, 'shrink': 29}.[0m
11-Nov-20 17:03:28, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:03:28, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:03:28, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:03:29, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:03:29, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:03:33, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.15657915220764393}


11-Nov-20 17:04:00, replay, DEBUG: NDCG=0.16
[32m[I 2020-11-11 17:04:00,897][0m Finished trial#13 resulted in value: 0.15657915220764393. Current best value is 0.15657915220764393 with parameters: {'num_neighbours': 19, 'shrink': 0}.[0m
11-Nov-20 17:04:00, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:04:00, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:04:00, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:04:02, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:04:02, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:04:06, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.11206378646287202}


11-Nov-20 17:04:34, replay, DEBUG: NDCG=0.11
[32m[I 2020-11-11 17:04:34,851][0m Finished trial#14 resulted in value: 0.11206378646287202. Current best value is 0.15657915220764393 with parameters: {'num_neighbours': 19, 'shrink': 0}.[0m
11-Nov-20 17:04:34, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:04:34, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:04:34, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:04:36, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:04:36, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:04:40, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.14082106845590847}


11-Nov-20 17:05:06, replay, DEBUG: NDCG=0.14
[32m[I 2020-11-11 17:05:06,322][0m Finished trial#15 resulted in value: 0.14082106845590847. Current best value is 0.15657915220764393 with parameters: {'num_neighbours': 19, 'shrink': 0}.[0m
11-Nov-20 17:05:06, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:05:06, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:05:06, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:05:07, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:05:07, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:05:11, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.1633295519305541}


11-Nov-20 17:05:36, replay, DEBUG: NDCG=0.16
[32m[I 2020-11-11 17:05:37,236][0m Finished trial#16 resulted in value: 0.1633295519305541. Current best value is 0.1633295519305541 with parameters: {'num_neighbours': 12, 'shrink': 2}.[0m
11-Nov-20 17:05:37, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:05:37, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:05:37, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:05:38, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:05:38, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:05:42, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.09551792200282885}


11-Nov-20 17:06:08, replay, DEBUG: NDCG=0.10
[32m[I 2020-11-11 17:06:08,397][0m Finished trial#17 resulted in value: 0.09551792200282885. Current best value is 0.1633295519305541 with parameters: {'num_neighbours': 12, 'shrink': 2}.[0m
11-Nov-20 17:06:08, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:06:08, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:06:08, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:06:09, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:06:09, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:06:13, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.14133172213480003}


11-Nov-20 17:06:41, replay, DEBUG: NDCG=0.14
[32m[I 2020-11-11 17:06:41,572][0m Finished trial#18 resulted in value: 0.14133172213480003. Current best value is 0.1633295519305541 with parameters: {'num_neighbours': 12, 'shrink': 2}.[0m
11-Nov-20 17:06:41, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:06:41, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:06:41, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:06:42, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:06:42, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:06:46, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.15605298651709917}


11-Nov-20 17:07:14, replay, DEBUG: NDCG=0.16
[32m[I 2020-11-11 17:07:14,367][0m Finished trial#19 resulted in value: 0.15605298651709917. Current best value is 0.1633295519305541 with parameters: {'num_neighbours': 12, 'shrink': 2}.[0m
11-Nov-20 17:07:14, replay, DEBUG: Лучшее значение метрики: 0.16
11-Nov-20 17:07:14, replay, DEBUG: Лучшие параметры: {'num_neighbours': 12, 'shrink': 2}


In [18]:
best_knn_params

{'num_neighbours': 12, 'shrink': 2}

### SLIM

In [19]:
scenario.recommender=MODELS['slim_']

best_slim_params = scenario.research(PARAM_GRID['slim_'],
    log,
    k=k,
    n_trials=budget
)
slim_results = scenario.experiment.results

11-Nov-20 17:07:14, replay, DEBUG: Деление лога на обучающую и тестовую выборку
11-Nov-20 17:07:15, replay, DEBUG: Длина трейна и теста: 99812 187
11-Nov-20 17:07:15, replay, DEBUG: Количество пользователей в трейне и тесте: 943, 187
11-Nov-20 17:07:15, replay, DEBUG: Количество объектов в трейне и тесте: 1681, 154
11-Nov-20 17:07:16, replay, DEBUG: Инициализация метрик
11-Nov-20 17:07:16, replay, DEBUG: Обучение и предсказание дополнительной модели
11-Nov-20 17:07:16, replay, DEBUG: Начало обучения PopRec
11-Nov-20 17:07:16, replay, DEBUG: Предварительная стадия обучения (pre-fit)
11-Nov-20 17:07:16, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:07:17, replay, DEBUG: Начало предикта PopRec
11-Nov-20 17:07:20, replay, DEBUG: Оптимизация параметров
11-Nov-20 17:07:20, replay, DEBUG: Количество попыток: 20
11-Nov-20 17:07:20, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:07:20, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:07:20, replay, DEBUG: Предварите

{10: 0.11256621768601842}


11-Nov-20 17:07:48, replay, DEBUG: NDCG=0.11
[32m[I 2020-11-11 17:07:48,384][0m Finished trial#0 resulted in value: 0.11256621768601842. Current best value is 0.11256621768601842 with parameters: {'beta': 0.06247182931704085, 'lambda_': 1.7882240290577447}.[0m
11-Nov-20 17:07:48, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:07:48, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:07:48, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:07:49, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:07:49, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:07:53, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.24875643630814828}


11-Nov-20 17:08:15, replay, DEBUG: NDCG=0.25
[32m[I 2020-11-11 17:08:15,567][0m Finished trial#1 resulted in value: 0.24875643630814828. Current best value is 0.24875643630814828 with parameters: {'beta': 0.0048078597244356445, 'lambda_': 0.05876956809966476}.[0m
11-Nov-20 17:08:15, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:08:15, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:08:15, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:08:16, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:08:16, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:08:20, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.21976455065855593}


11-Nov-20 17:08:41, replay, DEBUG: NDCG=0.22
[32m[I 2020-11-11 17:08:42,047][0m Finished trial#2 resulted in value: 0.21976455065855593. Current best value is 0.24875643630814828 with parameters: {'beta': 0.0048078597244356445, 'lambda_': 0.05876956809966476}.[0m
11-Nov-20 17:08:42, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:08:42, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:08:42, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:08:43, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:08:43, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:08:47, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.2272533928566179}


11-Nov-20 17:09:07, replay, DEBUG: NDCG=0.23
[32m[I 2020-11-11 17:09:08,139][0m Finished trial#3 resulted in value: 0.2272533928566179. Current best value is 0.24875643630814828 with parameters: {'beta': 0.0048078597244356445, 'lambda_': 0.05876956809966476}.[0m
11-Nov-20 17:09:08, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:09:08, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:09:08, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:09:09, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:09:09, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:09:13, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.21275621167914158}


11-Nov-20 17:09:34, replay, DEBUG: NDCG=0.21
[32m[I 2020-11-11 17:09:34,824][0m Finished trial#4 resulted in value: 0.21275621167914158. Current best value is 0.24875643630814828 with parameters: {'beta': 0.0048078597244356445, 'lambda_': 0.05876956809966476}.[0m
11-Nov-20 17:09:34, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:09:34, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:09:34, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:09:36, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:09:36, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:09:39, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.20802171132544933}


11-Nov-20 17:10:00, replay, DEBUG: NDCG=0.21
[32m[I 2020-11-11 17:10:00,888][0m Finished trial#5 resulted in value: 0.20802171132544933. Current best value is 0.24875643630814828 with parameters: {'beta': 0.0048078597244356445, 'lambda_': 0.05876956809966476}.[0m
11-Nov-20 17:10:00, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:10:00, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:10:00, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:10:02, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:10:02, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:10:05, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.21830610618220508}


11-Nov-20 17:10:26, replay, DEBUG: NDCG=0.22
[32m[I 2020-11-11 17:10:26,292][0m Finished trial#6 resulted in value: 0.21830610618220508. Current best value is 0.24875643630814828 with parameters: {'beta': 0.0048078597244356445, 'lambda_': 0.05876956809966476}.[0m
11-Nov-20 17:10:26, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:10:26, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:10:26, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:10:27, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:10:27, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:10:31, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.25682298783424334}


11-Nov-20 17:10:53, replay, DEBUG: NDCG=0.26
[32m[I 2020-11-11 17:10:53,531][0m Finished trial#7 resulted in value: 0.25682298783424334. Current best value is 0.25682298783424334 with parameters: {'beta': 1.0767151647010165, 'lambda_': 0.004001558568600958}.[0m
11-Nov-20 17:10:53, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:10:53, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:10:53, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:10:54, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:10:54, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:10:58, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.27021885403401874}


11-Nov-20 17:11:18, replay, DEBUG: NDCG=0.27
[32m[I 2020-11-11 17:11:18,719][0m Finished trial#8 resulted in value: 0.27021885403401874. Current best value is 0.27021885403401874 with parameters: {'beta': 0.4455599911925877, 'lambda_': 0.10152327312240496}.[0m
11-Nov-20 17:11:18, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:11:18, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:11:18, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:11:19, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:11:19, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:11:23, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.22529308154431055}


11-Nov-20 17:11:44, replay, DEBUG: NDCG=0.23
[32m[I 2020-11-11 17:11:45,216][0m Finished trial#9 resulted in value: 0.22529308154431055. Current best value is 0.27021885403401874 with parameters: {'beta': 0.4455599911925877, 'lambda_': 0.10152327312240496}.[0m
11-Nov-20 17:11:45, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:11:45, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:11:45, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:11:46, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:11:46, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:11:50, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.11314364026781273}


11-Nov-20 17:12:13, replay, DEBUG: NDCG=0.11
[32m[I 2020-11-11 17:12:13,329][0m Finished trial#10 resulted in value: 0.11314364026781273. Current best value is 0.27021885403401874 with parameters: {'beta': 0.4455599911925877, 'lambda_': 0.10152327312240496}.[0m
11-Nov-20 17:12:13, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:12:13, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:12:13, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:12:14, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:12:14, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:12:18, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.2716949663747603}


11-Nov-20 17:12:39, replay, DEBUG: NDCG=0.27
[32m[I 2020-11-11 17:12:39,721][0m Finished trial#11 resulted in value: 0.2716949663747603. Current best value is 0.2716949663747603 with parameters: {'beta': 1.9106522803590236, 'lambda_': 0.019999182491868488}.[0m
11-Nov-20 17:12:39, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:12:39, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:12:39, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:12:40, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:12:40, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:12:44, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.27381309716453434}


11-Nov-20 17:13:07, replay, DEBUG: NDCG=0.27
[32m[I 2020-11-11 17:13:07,539][0m Finished trial#12 resulted in value: 0.27381309716453434. Current best value is 0.27381309716453434 with parameters: {'beta': 1.663127403505271, 'lambda_': 0.019312079434170928}.[0m
11-Nov-20 17:13:07, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:13:07, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:13:07, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:13:08, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:13:08, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:13:12, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.2743165952393946}


11-Nov-20 17:13:35, replay, DEBUG: NDCG=0.27
[32m[I 2020-11-11 17:13:35,508][0m Finished trial#13 resulted in value: 0.2743165952393946. Current best value is 0.2743165952393946 with parameters: {'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}.[0m
11-Nov-20 17:13:35, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:13:35, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:13:35, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:13:36, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:13:36, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:13:41, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.27389256971709086}


11-Nov-20 17:14:03, replay, DEBUG: NDCG=0.27
[32m[I 2020-11-11 17:14:03,241][0m Finished trial#14 resulted in value: 0.27389256971709086. Current best value is 0.2743165952393946 with parameters: {'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}.[0m
11-Nov-20 17:14:03, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:14:03, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:14:03, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:14:04, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:14:04, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:14:08, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.25184921701529006}


11-Nov-20 17:14:29, replay, DEBUG: NDCG=0.25
[32m[I 2020-11-11 17:14:30,258][0m Finished trial#15 resulted in value: 0.25184921701529006. Current best value is 0.2743165952393946 with parameters: {'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}.[0m
11-Nov-20 17:14:30, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:14:30, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:14:30, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:14:31, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:14:31, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:14:35, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.19062397077019722}


11-Nov-20 17:14:57, replay, DEBUG: NDCG=0.19
[32m[I 2020-11-11 17:14:57,766][0m Finished trial#16 resulted in value: 0.19062397077019722. Current best value is 0.2743165952393946 with parameters: {'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}.[0m
11-Nov-20 17:14:57, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:14:57, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:14:57, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:14:59, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:14:59, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:15:03, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.25258825358218273}


11-Nov-20 17:15:23, replay, DEBUG: NDCG=0.25
[32m[I 2020-11-11 17:15:23,377][0m Finished trial#17 resulted in value: 0.25258825358218273. Current best value is 0.2743165952393946 with parameters: {'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}.[0m
11-Nov-20 17:15:23, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:15:23, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:15:23, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:15:24, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:15:24, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:15:28, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.266605038266237}


11-Nov-20 17:15:49, replay, DEBUG: NDCG=0.27
[32m[I 2020-11-11 17:15:49,478][0m Finished trial#18 resulted in value: 0.266605038266237. Current best value is 0.2743165952393946 with parameters: {'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}.[0m
11-Nov-20 17:15:49, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:15:49, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:15:49, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:15:50, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:15:50, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:15:54, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.27443151905234003}


11-Nov-20 17:16:14, replay, DEBUG: NDCG=0.27
[32m[I 2020-11-11 17:16:15,105][0m Finished trial#19 resulted in value: 0.27443151905234003. Current best value is 0.27443151905234003 with parameters: {'beta': 1.9347834982278882, 'lambda_': 0.011806526371156959}.[0m
11-Nov-20 17:16:15, replay, DEBUG: Лучшее значение метрики: 0.27
11-Nov-20 17:16:15, replay, DEBUG: Лучшие параметры: {'beta': 1.9347834982278882, 'lambda_': 0.011806526371156959}


In [20]:
all_results = knn_results.append(slim_results)

In [21]:
best_slim_params

{'beta': 1.9347834982278882, 'lambda_': 0.011806526371156959}

### RandomRec (чтобы проверить категориальный параметр)

In [22]:
RandomRec._search_space = dict()
RandomRec._search_space['distribution'] = {'type': 'categorical', 'args': ['popular_based', 'uniform']}

In [36]:
scenario.recommender=MODELS['random_rec_']

best_rr_params = scenario.research(PARAM_GRID['random_rec_'],
    log,
    k=k,
    n_trials=2
)
rr_results = scenario.experiment.results

11-Nov-20 17:23:53, replay, DEBUG: Деление лога на обучающую и тестовую выборку
11-Nov-20 17:23:55, replay, DEBUG: Длина трейна и теста: 99812 187
11-Nov-20 17:23:55, replay, DEBUG: Количество пользователей в трейне и тесте: 943, 187
11-Nov-20 17:23:56, replay, DEBUG: Количество объектов в трейне и тесте: 1681, 154
11-Nov-20 17:23:56, replay, DEBUG: Инициализация метрик
11-Nov-20 17:23:56, replay, DEBUG: Обучение и предсказание дополнительной модели
11-Nov-20 17:23:56, replay, DEBUG: Начало обучения PopRec
11-Nov-20 17:23:56, replay, DEBUG: Предварительная стадия обучения (pre-fit)
11-Nov-20 17:23:56, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:23:57, replay, DEBUG: Начало предикта PopRec
11-Nov-20 17:24:00, replay, DEBUG: Оптимизация параметров
11-Nov-20 17:24:00, replay, DEBUG: Количество попыток: 2
11-Nov-20 17:24:00, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:24:00, replay, DEBUG: Начало обучения RandomRec
11-Nov-20 17:24:00, replay, DEBUG: Основн

{10: 0.03371643897890196}


11-Nov-20 17:24:38, replay, DEBUG: NDCG=0.03
[32m[I 2020-11-11 17:24:38,501][0m Finished trial#0 resulted in value: 0.03371643897890196. Current best value is 0.03371643897890196 with parameters: {'distribution': 'popular_based'}.[0m
11-Nov-20 17:24:38, replay, DEBUG: -- Второй фит модели в оптимизации
11-Nov-20 17:24:38, replay, DEBUG: Начало обучения RandomRec
11-Nov-20 17:24:38, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:24:41, replay, DEBUG: -- Предикт модели в оптимизации
11-Nov-20 17:24:41, replay, DEBUG: Начало предикта RandomRec
11-Nov-20 17:24:50, replay, DEBUG: -- Подсчет метрики в оптимизации


{10: 0.030741882540491386}


11-Nov-20 17:25:19, replay, DEBUG: NDCG=0.03
[32m[I 2020-11-11 17:25:19,555][0m Finished trial#1 resulted in value: 0.030741882540491386. Current best value is 0.03371643897890196 with parameters: {'distribution': 'popular_based'}.[0m
11-Nov-20 17:25:19, replay, DEBUG: Лучшее значение метрики: 0.03
11-Nov-20 17:25:19, replay, DEBUG: Лучшие параметры: {'distribution': 'popular_based'}


In [37]:
all_results = all_results.append(rr_results)

In [38]:
best_rr_params

{'distribution': 'popular_based'}

## Результаты

In [39]:
all_results.sort_values('NDCG@10', ascending=False)

Unnamed: 0,HitRate@1,HitRate@5,HitRate@10,NDCG@10,NDCG@1,NDCG@5
"SLIM{'beta': 1.9347834982278882, 'lambda_': 0.011806526371156959}",0.106952,0.347594,0.497326,0.274432,0.106952,0.226848
best_slim_scenario,0.106952,0.347594,0.497326,0.274432,0.106952,0.226848
"SLIM{'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}",0.106952,0.347594,0.491979,0.274317,0.106952,0.227824
"SLIM{'beta': 1.8851075394684569, 'lambda_': 0.01342528450135674}",0.106952,0.342246,0.497326,0.273893,0.106952,0.22445
"SLIM{'beta': 1.663127403505271, 'lambda_': 0.019312079434170928}",0.106952,0.347594,0.491979,0.273813,0.106952,0.22759
"SLIM{'beta': 1.9106522803590236, 'lambda_': 0.019999182491868488}",0.101604,0.347594,0.481283,0.271695,0.101604,0.228423
"SLIM{'beta': 0.4455599911925877, 'lambda_': 0.10152327312240496}",0.117647,0.347594,0.454545,0.270219,0.117647,0.23658
"SLIM{'beta': 0.8732149707670739, 'lambda_': 0.10803703487597296}",0.106952,0.336898,0.459893,0.266605,0.106952,0.227561
"SLIM{'beta': 1.0767151647010165, 'lambda_': 0.004001558568600958}",0.096257,0.315508,0.475936,0.256823,0.096257,0.204856
"SLIM{'beta': 0.16259395873118712, 'lambda_': 0.046553318221315206}",0.112299,0.304813,0.449198,0.252588,0.112299,0.205515


## Проверка, что production работает ок

In [27]:
from replay.experiment import Experiment

In [28]:
train, test = user_random_splitter.split(log)
e = Experiment(test, {NDCG(): k_for_metrics, HitRate(): k_for_metrics})

### Предсказание с помощью сценария

In [29]:
best_slim_params

{'beta': 1.9347834982278882, 'lambda_': 0.011806526371156959}

In [30]:
scenario.recommender=MODELS['slim_']

recs = scenario.production(
    best_slim_params, 
    train,
    users=test.select("user_id").distinct().cache(), 
    items=test.select("item_id").distinct().cache(),
    k=10
)

e.add_result('best_slim_scenario', recs)

11-Nov-20 17:17:08, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:17:08, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:17:10, replay, DEBUG: Начало предикта SLIM
11-Nov-20 17:17:11, replay, DEBUG: Начало обучения PopRec
11-Nov-20 17:17:11, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:17:12, replay, DEBUG: Начало предикта PopRec


In [31]:
scenario.recommender=MODELS['knn_']

recs = scenario.production(
    best_knn_params, 
    train,
    users=test.select("user_id").distinct().cache(), 
    items=test.select("item_id").distinct().cache(),
    k=10
)

e.add_result('best_knn_scenario', recs)

11-Nov-20 17:17:32, replay, DEBUG: Начало обучения KNN
11-Nov-20 17:17:32, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:17:33, replay, DEBUG: Начало предикта KNN
11-Nov-20 17:17:35, replay, DEBUG: Начало обучения PopRec
11-Nov-20 17:17:35, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:17:35, replay, DEBUG: Начало предикта PopRec


In [32]:
all_results = all_results.append(e.results)

### Предсказание чистой моделью

In [33]:
best_slim_model = SLIM(**best_slim_params)
slim_pred = best_slim_model.fit_predict(train, 
                                        users=test.select("user_id").distinct().cache(),
                                        items=test.select("item_id").distinct().cache(),
                                        k=10)

11-Nov-20 17:17:58, replay, DEBUG: Начало обучения SLIM
11-Nov-20 17:17:58, replay, DEBUG: Предварительная стадия обучения (pre-fit)
11-Nov-20 17:17:59, replay, DEBUG: Основная стадия обучения (fit)
11-Nov-20 17:18:00, replay, DEBUG: Начало предикта SLIM


In [34]:
e.add_result('best_slim_model', slim_pred)



In [35]:
all_results.append(e.results).sort_values('NDCG@10', ascending=False)

Unnamed: 0,HitRate@1,HitRate@5,HitRate@10,NDCG@10,NDCG@1,NDCG@5
best_slim_model,0.106952,0.347594,0.497326,0.274432,0.106952,0.226848
best_slim_scenario,0.106952,0.347594,0.497326,0.274432,0.106952,0.226848
best_slim_scenario,0.106952,0.347594,0.497326,0.274432,0.106952,0.226848
"SLIM{'beta': 1.9347834982278882, 'lambda_': 0.011806526371156959}",0.106952,0.347594,0.497326,0.274432,0.106952,0.226848
"SLIM{'beta': 1.8799729122662445, 'lambda_': 0.016186199993327346}",0.106952,0.347594,0.491979,0.274317,0.106952,0.227824
"SLIM{'beta': 1.8851075394684569, 'lambda_': 0.01342528450135674}",0.106952,0.342246,0.497326,0.273893,0.106952,0.22445
"SLIM{'beta': 1.663127403505271, 'lambda_': 0.019312079434170928}",0.106952,0.347594,0.491979,0.273813,0.106952,0.22759
"SLIM{'beta': 1.9106522803590236, 'lambda_': 0.019999182491868488}",0.101604,0.347594,0.481283,0.271695,0.101604,0.228423
"SLIM{'beta': 0.4455599911925877, 'lambda_': 0.10152327312240496}",0.117647,0.347594,0.454545,0.270219,0.117647,0.23658
"SLIM{'beta': 0.8732149707670739, 'lambda_': 0.10803703487597296}",0.106952,0.336898,0.459893,0.266605,0.106952,0.227561


Все ок, метрики при подборе параметров, применении модели в сценарии и просто обучении с лучшими гиперпараметрами совпадают.