In [1]:
import numpy as np
import time
import pandas as pd
import torch
from FM_pytorch.fm import FactorizationMachineModel
from FM_pytorch.movielens import MovieLens1MDataset
from FM_pytorch.train import train,test,EarlyStopper
from torch.utils.data import DataLoader

# 获取数据集与模型

In [2]:
dataset=MovieLens1MDataset('./data/ml-1m/ratings.dat')
#field_dims = dataset.field_dims
#print(field_dims)
#offsets = np.array((0, *np.cumsum(field_dims)))   
model=FactorizationMachineModel(dataset.field_dims, embed_dim=16)

## 数据集拆分并用DataLoader加载

In [3]:
#按8:1:1比例拆分为训练集、验证集、测试集
train_length = int(len(dataset) * 0.8)
valid_length = int(len(dataset) * 0.1)
test_length = len(dataset) - train_length - valid_length
train_dataset, valid_dataset, test_dataset = torch.utils.data.random_split(
    dataset, (train_length, valid_length, test_length))

#利用DataLoader加载，每个batch_size=256
train_data_loader = DataLoader(train_dataset, batch_size=256, num_workers=0)
valid_data_loader = DataLoader(valid_dataset, batch_size=256, num_workers=0)
test_data_loader = DataLoader(test_dataset, batch_size=256, num_workers=0)

In [7]:
# 看一下数据
for b,label in iter(train_data_loader):
    print(b[:8,:])
    print(label[:8])
    break

tensor([[4168,  334],
        [ 888,  408],
        [2752, 3460],
        [3360,  706],
        [1168, 2087],
        [ 215, 2162],
        [2015, 1941],
        [2817, 3790]], dtype=torch.int32)
tensor([1., 0., 1., 0., 0., 0., 1., 0.])


# GPU

In [4]:
def try_gpu(i=0):  #@save
    #如果存在,则返回gpu(i),否则返回cpu()
    if torch.cuda.device_count() >= i + 1:
        return torch.device(f'cuda:{i}')
    return torch.device('cpu')

# 开始训练模型

In [None]:
device = try_gpu()   #torch.device('cpu') 
print(device)
model = model.to(device)
criterion = torch.nn.BCELoss()
optimizer = torch.optim.Adam(params=model.parameters(), lr=0.001, weight_decay=0.000001)
#num_trials:表示尝试num_trials次后，如果没有提升就提前终止训练
#save_path：表示每次最优模型的存放路径
early_stopper = EarlyStopper(num_trials=2, save_path='result/model_001.pt')
#开始训练
time_start = time.time() #开始计时
for epoch_i in range(100):
    
    train(model, optimizer, train_data_loader, criterion, device)
    auc_train = test(model, train_data_loader, device)
    auc_valid = test(model, valid_data_loader, device)
    auc_test = test(model, test_data_loader, device)
    print('第{}个epoch结束：'.format(epoch_i))
    print('训练集AUC:{}'.format(auc_train))
    print('验证集AUC:{}'.format(auc_valid))
    print('测试集AUC:{}'.format(auc_test))
    
    if not early_stopper.is_continuable(model, auc_valid):
        print('验证集上AUC的最高值是:{}'.format(early_stopper.best_accuracy))
        break
time_end = time.time()    #结束计时
time_c= time_end - time_start   #运行所花时间
print('用时', time_c, 's')

cpu


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:22<00:00, 137.04it/s, loss=0.587]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:05<00:00, 555.69it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 522.87it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 578.27it/s]


第0个epoch结束：
训练集AUC:0.7625305000070218
验证集AUC:0.7512329173006302
测试集AUC:0.7508223171237541


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:23<00:00, 132.03it/s, loss=0.541]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 448.40it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 522.72it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 458.98it/s]


第1个epoch结束：
训练集AUC:0.8000174313876252
验证集AUC:0.7848569657422645
测试集AUC:0.7844072654800838


100%|██████████████████████████████████████████████████████████████████| 3126/3126 [00:23<00:00, 131.74it/s, loss=0.53]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:05<00:00, 528.08it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 560.85it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 561.64it/s]


第2个epoch结束：
训练集AUC:0.8091416416286583
验证集AUC:0.7918019195820823
测试集AUC:0.7912620579850443


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:25<00:00, 121.99it/s, loss=0.522]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:05<00:00, 542.90it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 546.00it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 552.96it/s]


第3个epoch结束：
训练集AUC:0.8152735961895464
验证集AUC:0.7957324163944232
测试集AUC:0.7951901141011439


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 128.51it/s, loss=0.515]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:05<00:00, 541.24it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 549.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 549.07it/s]


第4个epoch结束：
训练集AUC:0.8222075173729044
验证集AUC:0.7998136735137468
测试集AUC:0.7992063018805784


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 128.22it/s, loss=0.507]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 502.06it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 545.90it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 525.78it/s]


第5个epoch结束：
训练集AUC:0.8301052392944221
验证集AUC:0.803948079192209
测试集AUC:0.8031993885345496


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 126.01it/s, loss=0.498]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 464.79it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 444.82it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 427.13it/s]


第6个epoch结束：
训练集AUC:0.8380444495423485
验证集AUC:0.807240718322381
测试集AUC:0.8063937513689026


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:27<00:00, 112.46it/s, loss=0.489]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 466.61it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 519.96it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 532.04it/s]


第7个epoch结束：
训练集AUC:0.8458799759265268
验证集AUC:0.8096178240895846
测试集AUC:0.8087800393976436


100%|██████████████████████████████████████████████████████████████████| 3126/3126 [00:25<00:00, 121.80it/s, loss=0.48]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 496.62it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 520.07it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 532.45it/s]


第8个epoch结束：
训练集AUC:0.8536626485204355
验证集AUC:0.8112615255413138
测试集AUC:0.810530008465604


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 127.71it/s, loss=0.471]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:05<00:00, 522.02it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 557.65it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 527.87it/s]


第9个epoch结束：
训练集AUC:0.861192065260819
验证集AUC:0.8122029626191594
测试集AUC:0.8116440877983702


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:26<00:00, 117.75it/s, loss=0.463]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 505.49it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 469.18it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 501.91it/s]


第10个epoch结束：
训练集AUC:0.8681908298095679
验证集AUC:0.8124687117476805
测试集AUC:0.8121066813820568


 59%|██████████████████████████████████████▋                          | 1858/3126 [00:15<00:10, 123.82it/s, loss=0.459]