In [1]:
import numpy as np
import pandas as pd
import torch
from FM_pytorch.fm import FactorizationMachineModel
from FM_pytorch.movielens import MovieLens1MDataset
from FM_pytorch.train import train,test,EarlyStopper
from torch.utils.data import DataLoader

# 获取数据集与模型

In [2]:
dataset=MovieLens1MDataset('./data/ml-1m/ratings.dat')
model=FactorizationMachineModel(dataset.field_dims, embed_dim=16)

## 数据集拆分并用DataLoader加载

In [3]:
#按8:1:1比例拆分为训练集、验证集、测试集
train_length = int(len(dataset) * 0.8)
valid_length = int(len(dataset) * 0.1)
test_length = len(dataset) - train_length - valid_length
train_dataset, valid_dataset, test_dataset = torch.utils.data.random_split(
    dataset, (train_length, valid_length, test_length))

#利用DataLoader加载，每个batch_size=256
train_data_loader = DataLoader(train_dataset, batch_size=256, num_workers=0)
valid_data_loader = DataLoader(valid_dataset, batch_size=256, num_workers=0)
test_data_loader = DataLoader(test_dataset, batch_size=256, num_workers=0)

# 开始训练模型

In [4]:
criterion = torch.nn.BCELoss()
optimizer = torch.optim.Adam(params=model.parameters(), lr=0.001, weight_decay=0.000001)
#num_trials:表示尝试num_trials次后，如果没有提升就提前终止训练
#save_path：表示每次最优模型的存放路径
early_stopper = EarlyStopper(num_trials=2, save_path='result/model_001.pt')
#开始训练
for epoch_i in range(100):
    train(model, optimizer, train_data_loader, criterion, device=None)
    auc_train = test(model, train_data_loader, device=None)
    auc_valid = test(model, valid_data_loader, device=None)
    auc_test = test(model, test_data_loader, device=None)
    print('第{}个epoch结束：'.format(epoch_i))
    print('训练集AUC:{}'.format(auc_train))
    print('验证集AUC:{}'.format(auc_valid))
    print('测试集AUC:{}'.format(auc_test))
    if not early_stopper.is_continuable(model, auc_valid):
        print('验证集上AUC的最高值是:{}'.format(early_stopper.best_accuracy))
        break


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:21<00:00, 148.14it/s, loss=0.586]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:05<00:00, 526.32it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 532.66it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 534.14it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第0个epoch结束：
训练集AUC:0.761337346750254
验证集AUC:0.7504960106255698
测试集AUC:0.7509538392619143


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:23<00:00, 133.09it/s, loss=0.541]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 491.23it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 436.85it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 480.31it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第1个epoch结束：
训练集AUC:0.8004126580441271
验证集AUC:0.7848761252400143
测试集AUC:0.7861434367542932


100%|██████████████████████████████████████████████████████████████████| 3126/3126 [00:23<00:00, 133.09it/s, loss=0.53]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 499.80it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 446.18it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 507.13it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第2个epoch结束：
训练集AUC:0.8097772990674375
验证集AUC:0.7919706546366834
测试集AUC:0.7933955974630814


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:25<00:00, 124.70it/s, loss=0.523]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 481.27it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 494.90it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 505.78it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第3个epoch结束：
训练集AUC:0.8156864918066368
验证集AUC:0.7957010259141771
测试集AUC:0.797276200672417


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 128.30it/s, loss=0.516]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 475.50it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 499.32it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 504.48it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第4个epoch结束：
训练集AUC:0.8220265422074045
验证集AUC:0.7992168868290255
测试集AUC:0.8009762346661002


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 126.31it/s, loss=0.508]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 489.50it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 499.33it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 498.72it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第5个epoch结束：
训练集AUC:0.8295660109102388
验证集AUC:0.8028944544109897
测试集AUC:0.8048634972204838


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 127.89it/s, loss=0.499]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 487.91it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 478.47it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 503.23it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第6个epoch结束：
训练集AUC:0.8377775489422399
验证集AUC:0.8062082926827296
测试集AUC:0.8083607667039356


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 127.57it/s, loss=0.489]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 478.68it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 503.84it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 497.43it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第7个epoch结束：
训练集AUC:0.8461767907909115
验证集AUC:0.808839826611434
测试集AUC:0.811128121007132


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 125.25it/s, loss=0.479]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 482.79it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 494.94it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 493.37it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第8个epoch结束：
训练集AUC:0.8544493139233199
验证集AUC:0.8107156611535271
测试集AUC:0.8131035686892872


100%|██████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 125.33it/s, loss=0.47]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 474.24it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 485.70it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 490.55it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第9个epoch结束：
训练集AUC:0.8623124524025287
验证集AUC:0.811821221715536
测试集AUC:0.8142684225602642


100%|██████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 125.97it/s, loss=0.46]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 461.92it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 491.80it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 493.05it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第10个epoch结束：
训练集AUC:0.8695526492902695
验证集AUC:0.812217307690317
测试集AUC:0.8146943805526952


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:24<00:00, 126.20it/s, loss=0.451]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 477.92it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 487.77it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 501.73it/s]
  0%|                                                                                         | 0/3126 [00:00<?, ?it/s]

第11个epoch结束：
训练集AUC:0.8759913682517481
验证集AUC:0.8120016744754306
测试集AUC:0.814482218355427


100%|█████████████████████████████████████████████████████████████████| 3126/3126 [00:25<00:00, 124.87it/s, loss=0.443]
100%|█████████████████████████████████████████████████████████████████████████████| 3126/3126 [00:06<00:00, 482.16it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 484.51it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 391/391 [00:00<00:00, 481.53it/s]

第12个epoch结束：
训练集AUC:0.881531818138633
验证集AUC:0.8113048227261324
测试集AUC:0.8137725086215388
验证集上AUC的最高值是:0.812217307690317



