# Import

In [1]:
import sys

root_dir = '../../'
if root_dir not in sys.path:
    sys.path.append(root_dir)

import torch
from torch import nn, optim
import numpy as np
from sklearn.decomposition import TruncatedSVD
from scipy.sparse import csr_matrix

from modules import losses, models, samplers, regularizers, evaluators, trainers, datasets, distributions

# DataSet

In [2]:
dataset = datasets.ML100k()
n_user = dataset.n_user
n_item = dataset.n_item
train_set, test_set = dataset.implicit_feedback_data(tail_threshold=20)

# device setting
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
train_set = torch.LongTensor(train_set).to(device)
test_set = torch.LongTensor(test_set).to(device)

# Evaluator

In [3]:
# k
ks = [10, 50, 100]

# Accuracy
score_function_dict = {
    # "nDCG" : evaluators.ndcg,
    # "MAP" : evaluators.average_precision,
    "Recall": evaluators.recall
}
accuracy_evaluator = evaluators.AccuracyEvaluator(test_set, score_function_dict, ks)

# Unpopularity
unpopularity_evaluator = evaluators.UnpopularityEvaluator(test_set, ks)

# F1-Score (Recall-Unpopularity)
f1_score_evaluator = evaluators.F1ScoreEvaluator(test_set, ks)

# Coverage
coverage_evaluator = evaluators.CoverageEvaluator(test_set, ks)

# Hubness
hubness_evaluator = evaluators.HubnessEvaluator(test_set, ks)

# Sampler

In [4]:
sampler = samplers.BaseSampler(train_set, n_user, n_item, device=device, strict_negative=False)

# Model

In [5]:
# Hyperparameters
lr = 1e-3
n_dim = 50
n_batch = 256
n_epoch = 50
valid_per_epoch = 10
n_item_sample = 30
n_user_sample = 30

# distributiuons
dist1 = distributions.Empirical()
dist2 = distributions.Gaussian()
dist3 = distributions.Gamma()

# models
model0 = models.CollaborativeMetricLearning(n_user, n_item, n_dim).to(device)
model1 = models.MutualProximityCML(n_user, n_item, dist1, n_dim).to(device)
model2 = models.MutualProximityCML(n_user, n_item, dist2, n_dim).to(device)
model3 = models.MutualProximityCML(n_user, n_item, dist3, n_dim).to(device)

# learning late optimizer
optimizer0 = optim.Adam(model0.parameters(), lr=lr)
optimizer1 = optim.Adam(model1.parameters(), lr=lr)
optimizer2 = optim.Adam(model2.parameters(), lr=lr)
optimizer3 = optim.Adam(model3.parameters(), lr=lr)

# loss function
criterion = losses.SumTripletLoss(margin=1).to(device)

# trainer
trainer0 = trainers.BaseTrainer(model0, optimizer0, criterion, sampler)
trainer1 = trainers.BaseTrainer(model1, optimizer1, criterion, sampler)
trainer2 = trainers.BaseTrainer(model2, optimizer2, criterion, sampler)
trainer3 = trainers.BaseTrainer(model3, optimizer3, criterion, sampler)

# Accuracy

In [6]:
# train0
trainer0.fit(n_batch, n_epoch, accuracy_evaluator, valid_per_epoch)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:04<00:00, 223.80it/s]
epoch1 avg_loss:0.764: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 348.56it/s]
epoch2 avg_loss:0.538: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 347.62it/s]
epoch3 avg_loss:0.454: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 351.09it/s]
epoch4 avg_loss:0.387: 100%|████████████████████████████████████████████████████████████

In [7]:
# train3
trainer3.fit(n_batch, n_epoch, accuracy_evaluator, valid_per_epoch)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:08<00:00, 13.80it/s]
epoch1 avg_loss:0.759: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 322.64it/s]
epoch2 avg_loss:0.540: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 348.98it/s]
epoch3 avg_loss:0.448: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 349.15it/s]
epoch4 avg_loss:0.387: 100%|████████████████████████████████████████████████████████████

In [8]:
# CML
trainer0.valid_scores

Unnamed: 0,Recall@10,Recall@50,Recall@100,epoch,losses
0,0.006756,0.03273,0.061725,0,
0,0.20763,0.478779,0.610557,10,0.225478
0,0.247311,0.540344,0.698179,20,0.185379
0,0.251439,0.55096,0.706003,30,0.1794
0,0.257356,0.558464,0.711126,40,0.177977
0,0.254815,0.558485,0.714054,50,0.176218


In [9]:
# MPCML
trainer3.valid_scores

Unnamed: 0,Recall@10,Recall@50,Recall@100,epoch,losses
0,0.005054,0.031402,0.062467,0,
0,0.087711,0.315145,0.479366,10,0.222895
0,0.122944,0.383348,0.565935,20,0.186439
0,0.119754,0.391889,0.569857,30,0.179953
0,0.132106,0.398311,0.579372,40,0.176894
0,0.134427,0.409431,0.578143,50,0.174988


# Unpopularity

In [10]:
# train0
trainer0.fit(n_batch, n_epoch, unpopularity_evaluator, valid_per_epoch)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:05<00:00, 160.35it/s]
epoch1 avg_loss:0.176: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 334.40it/s]
epoch2 avg_loss:0.175: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 356.21it/s]
epoch3 avg_loss:0.176: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 348.63it/s]
epoch4 avg_loss:0.176: 100%|████████████████████████████████████████████████████████████

In [11]:
# train3
trainer3.fit(n_batch, n_epoch, unpopularity_evaluator, valid_per_epoch)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:07<00:00, 13.95it/s]
epoch1 avg_loss:0.175: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 341.37it/s]
epoch2 avg_loss:0.175: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 356.21it/s]
epoch3 avg_loss:0.175: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 356.22it/s]
epoch4 avg_loss:0.175: 100%|████████████████████████████████████████████████████████████

In [12]:
# CML
trainer0.valid_scores

Unnamed: 0,Unpopularity@10,Unpopularity@50,Unpopularity@100,epoch,losses
0,0.000171,0.003636,0.013086,0,
0,0.000181,0.003653,0.013106,10,0.176451
0,0.000196,0.003811,0.013503,20,0.17465
0,0.000196,0.003737,0.0133,30,0.175497
0,0.000216,0.003742,0.013257,40,0.174638
0,0.000189,0.003717,0.013132,50,0.174277


In [13]:
# MPCML
trainer3.valid_scores

Unnamed: 0,Unpopularity@10,Unpopularity@50,Unpopularity@100,epoch,losses
0,0.002732,0.017267,0.039381,0,
0,0.00277,0.017326,0.039479,10,0.17537
0,0.002686,0.01722,0.039261,20,0.174518
0,0.002718,0.017414,0.039595,30,0.17374
0,0.002757,0.017359,0.039462,40,0.17428
0,0.002756,0.017389,0.039707,50,0.173242


# F1-Force

In [14]:
# train0
trainer0.fit(n_batch, n_epoch, f1_score_evaluator, valid_per_epoch)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:09<00:00, 103.67it/s]
epoch1 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 337.29it/s]
epoch2 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 357.30it/s]
epoch3 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 348.97it/s]
epoch4 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████

In [15]:
# train3
trainer3.fit(n_batch, n_epoch, f1_score_evaluator, valid_per_epoch)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:11<00:00, 13.21it/s]
epoch1 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 338.52it/s]
epoch2 avg_loss:0.173: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 357.20it/s]
epoch3 avg_loss:0.175: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 348.88it/s]
epoch4 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████

In [16]:
# CML
trainer0.valid_scores

Unnamed: 0,F1-Score@10,F1-Score@50,F1-Score@100,epoch,losses
0,0.000291,0.006845,0.024229,0,
0,0.000345,0.00689,0.024478,10,0.174438
0,0.000318,0.006641,0.02384,20,0.174477
0,0.000341,0.006823,0.024314,30,0.173386
0,0.000289,0.006649,0.023667,40,0.173371
0,0.000331,0.006747,0.023979,50,0.172485


In [17]:
# MPCML
trainer3.valid_scores

Unnamed: 0,F1-Score@10,F1-Score@50,F1-Score@100,epoch,losses
0,0.003132,0.028196,0.067034,0,
0,0.002815,0.027639,0.06677,10,0.173436
0,0.00297,0.027965,0.066142,20,0.173134
0,0.002994,0.028205,0.0668,30,0.173471
0,0.002798,0.028088,0.066774,40,0.172886
0,0.00293,0.027555,0.065743,50,0.173279


# Coverage

In [18]:
# train0
trainer0.fit(n_batch, n_epoch, coverage_evaluator, valid_per_epoch)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:00<00:00, 1158.72it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:00<00:00, 1301.33it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:00<00:00, 1332.66it/s]
epoch1 avg_loss:0.172: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 360.77it/s]
epoch2 avg_loss:0.172: 100%|████████████████████████████████████████████████████████████

In [19]:
# train3
trainer3.fit(n_batch, n_epoch, coverage_evaluator, valid_per_epoch)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:02<00:00, 15.01it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:03<00:00, 14.95it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:03<00:00, 14.91it/s]
epoch1 avg_loss:0.172: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 342.03it/s]
epoch2 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████

In [20]:
# CML
trainer0.valid_scores

Unnamed: 0,coverage@10,coverage@50,coverage@100,epoch,losses
0,0.448276,0.718193,0.832937,0,
0,0.460166,0.718193,0.842449,10,0.172678
0,0.460166,0.705113,0.832937,20,0.173346
0,0.460761,0.705113,0.84126,30,0.172996
0,0.456599,0.711653,0.848395,40,0.173662
0,0.45541,0.711058,0.841855,50,0.173847


In [21]:
# MPCML
trainer3.valid_scores

Unnamed: 0,coverage@10,coverage@50,coverage@100,epoch,losses
0,0.709275,0.895363,0.951249,0,
0,0.718193,0.913793,0.951249,10,0.173938
0,0.720571,0.892985,0.949465,20,0.173355
0,0.711058,0.901308,0.952438,30,0.173017
0,0.70868,0.904281,0.950654,40,0.174527
0,0.706897,0.903686,0.950654,50,0.171663


# Hubness 

In [22]:
# train0
trainer0.fit(n_batch, n_epoch, hubness_evaluator, valid_per_epoch)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:00<00:00, 1144.28it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:00<00:00, 1312.42it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [00:00<00:00, 1287.38it/s]
epoch1 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 360.00it/s]
epoch2 avg_loss:0.174: 100%|████████████████████████████████████████████████████████████

In [23]:
# train3
trainer3.fit(n_batch, n_epoch, hubness_evaluator, valid_per_epoch)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:02<00:00, 14.99it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:03<00:00, 14.92it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 943/943 [01:03<00:00, 14.94it/s]
epoch1 avg_loss:0.173: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:00<00:00, 342.40it/s]
epoch2 avg_loss:0.173: 100%|████████████████████████████████████████████████████████████

In [24]:
# CML
trainer0.valid_scores

Unnamed: 0,hubness@10,hubness@50,hubness@100,epoch,losses
0,3.120049,2.643616,1.933049,0,
0,3.181922,2.602535,1.898136,10,0.174078
0,3.173601,2.620724,1.894326,20,0.173595
0,3.106788,2.597005,1.957825,30,0.17433
0,3.540532,2.549613,1.859178,40,0.172324
0,3.108336,2.535758,1.918693,50,0.173562


In [25]:
# MPCML
trainer3.valid_scores

Unnamed: 0,hubness@10,hubness@50,hubness@100,epoch,losses
0,1.160879,0.888966,0.681135,0,
0,1.122809,0.893163,0.693711,10,0.171919
0,1.158089,0.874889,0.686642,20,0.17311
0,1.055913,0.850157,0.647466,30,0.173003
0,1.112709,0.872243,0.676255,40,0.172332
0,1.129237,0.887297,0.688736,50,0.173384
