# 内容说明
背景：之前自己手动实现 BPR 算法的整个过程，便于掌握算法的基本原理，但无法在整个数据集上使用，时间性能难以接受  
目的：希望在掌握原理之后借用Pytorch中的库，同时采取改进措施优化时间性能  
改进方向：  
1. 引入采样，因为遍历所有的[u, i, j]三元组复杂度为n_user\*n_item\*item，太过庞大
2. 分batch，同一个batch可以并行计算，极大改善时间性能
3. 调用Pytorch中自带的优化器  

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F

import pandas as pd
import random
import numpy as np
from collections import defaultdict

## 编写BPR类
1. init(): 初始化各个参数  
1) n_P：user数目加1，因为从1开始编号  
2) n_Q：item数目加1  
3) rated_dict：记录每个user已经评分的item编号集合  
4) lr：学习率  
5) lmbda：L2系数  
6) embed_size：嵌入维数  
7) batch_size：批大小  
8) P：user的参数矩阵   
9) Q：item的参数矩阵  
10) one_rated：字典，针对每个user，从已评分的item中随机选择一个，用于构造测试集。  
  
2. generate_train_batch()：生成批训练集，每一批样本数为batch_size  
1) 随机选择一个user编号，记录在u_batch中；  
2) 在该user已评分的item中，随机选择一个item编号，记录在i_batch中（注意不能选到one_rated中用于构造测试集的）；  
3) 在该user未评分的item中，随机选择一个item编号，记录在j_batch中；  
4) 返回编号列表u_batch, i_batch, j_batch，便于一批的并行计算；  

3. generate_test_batch()：生成批训练集，每一批对应一个user  
1) 针对编号为u的user  
2) one_rated中选择了编号为i的已评分item   
3) 遍历该用户未评分的item，记录编号到j_test中  
4) 返回编号列表u_test, i_test, j_test，便于一批的并行计算(每个u_test中的元素都是一样的，因为一个user为一批；每个i_test中的元素也是一样的，因为一个用户只选了一个已评分item记录在one_rated中)

4. compute_loss()：计算损失值之和。参数为u,i,j编号矩阵，三个矩阵维数相同。不用遍历样本，而是借助矩阵运算加速  
5. train(epochs)：训练，优化参数  
6. test()：在测试集上计算平均误差，看是否下降

In [50]:
class BPR():
    
    def __init__(self, n_P, n_Q, rated_dict, lr=0.005, lmbda=0.05, embed_size=10, batch_size=1000):
        
        # 常用参数
        self.n_P = n_P
        self.n_Q = n_Q
        self.lr = lr
        self.lmbda = lmbda
        self.embed_size = embed_size
        self.batch_size = batch_size
        
        # 评分相关的字典
        self.rated_dict = rated_dict  # 记录每个user已评分的item编号
        self.one_rated = dict()  # 从每个user已评分的item中随机选出来一个，用于训练集和测试集的构造
        for u, i_set in self.rated_dict.items():
            self.one_rated[u] = random.sample(self.rated_dict[u], 1)[0]
        
        # 参数矩阵
        self.P = nn.Parameter(torch.empty(self.n_P, self.embed_size))
        self.Q = nn.Parameter(torch.empty(self.n_Q, self.embed_size))
        nn.init.xavier_normal_(self.P.data)
        nn.init.xavier_normal_(self.Q.data)
        
    
    # 生成批训练集，批大小为batch_size
    def generate_train_batch(self):
        # 记录一批中<u,i,j>的编号
        u_batch = []
        i_batch = []
        j_batch = []
    
        # 生成batch_size大小的训练集
        for b in range(self.batch_size):
            # 随机选择u，即user_id
            u = random.sample(self.rated_dict.keys(), 1)[0]
            u_batch.append(u)
            # 随机选择i，即该user已评分过的一个item_id
            i = random.sample(self.rated_dict[u], 1)[0]
            while i == self.one_rated[u]:  # 防止正好选中了用于测试集的
                i = random.sample(self.rated_dict[u], 1)[0]
            i_batch.append(i)
            # 随机选择j，即该user未评分过的一个item_id
            j = random.randint(1, n_Q-1)  # 随机生成item_id
            while j in self.rated_dict[u]:  # 防止选到了已评分的
                j = random.randint(1, n_Q-1)
            j_batch.append(j)
        
        # 以矩阵方式返回批训练集
        return np.asarray(u_batch), np.asarray(i_batch), np.asarray(j_batch)
        

    # 生成批测试集，每一批对应一个user
    def generate_test_batch(self):
        for u in self.rated_dict.keys():  
            u_test = []
            i_test = []
            j_test = []
            i = self.one_rated[u]  # 随机抽取的一个已评分item
            for j in range(1, self.n_P):
                if not (j in self.rated_dict[u]):  # 获得该用户所有未评分过的item
                    u_test.append(u)
                    i_test.append(i)
                    j_test.append(j)
            yield np.asarray(u_test), np.asarray(i_test), np.asarray(j_test)
    
    
    # 给定u, i, j编号矩阵，计算总误差值
    def compute_loss(self, u_array, i_array, j_array):
        pu = self.P[u_array, :]
        qi = self.Q[i_array, :]
        qj = self.Q[j_array, :]
        xui = torch.mul(pu, qi).sum(dim=1)
        xuj = torch.mul(pu, qj).sum(dim=1)
        xuij = xui - xuj
        log = F.logsigmoid(xuij).sum()
        L2 = self.lmbda * (pu.norm(dim=1).pow(2).sum() + qi.norm(dim=1).pow(2).sum() + qj.norm(dim=1).pow(2).sum())
        loss = -log + L2
        return loss
    
    
    # 训练
    def train(self, epochs, samples):
        optimizer = optim.SGD([self.P, self.Q], lr=self.lr)
        # 多次迭代
        for k in range(epochs):
            sum_loss = 0
            # 每次迭代都有多次采样
            for n in range(1, samples):
                # 生成批训练集，计算损失值
                u_batch, i_batch, j_batch = self.generate_train_batch()
                loss = self.compute_loss(u_batch, i_batch, j_batch)
                sum_loss += loss
                # 优化参数
                optimizer.zero_grad()
                loss.backward()
                optimizer.step()
            avg_loss = sum_loss/(self.batch_size*n)
            # 计算测试误差
            test_loss = self.test()
            print('epoch %d：avg_loss = %.4f; test_loss = %.4f' % (k+1, avg_loss, test_loss))
    
    
    # 计算测试的平均误差
    def test(self):
        loss = 0
        n = 0
        for u_test, i_test, j_test in self.generate_test_batch():
            loss += self.compute_loss(u_test, i_test, j_test)
            n += len(u_test)
        return loss / n
    
    def see(self):
        return self.P, self.Q

In [10]:
# 定义函数，加载数据

def load_data(data_path):
    rated_dict = defaultdict(set)
    
    # 读取文件
    inter = pd.read_csv(data_path, delimiter='\t', engine='python')
    df = pd.DataFrame(inter)
    
    # user, item数目+1
    n_P = df['user_id:token'].max() + 1
    n_Q = df['item_id:token'].max() + 1
    
    # 遍历每一行评分数据
    for index, row in df.iterrows():
        u = row['user_id:token']
        i = row['item_id:token']
        rated_dict[u].add(i)
        
    # 返回user数目，item数目，评分字典
    return n_P, n_Q, rated_dict

## 2. 运行

In [54]:
# 加载数据，构造评分字典rated_dict
data_path = '../dataset/ml-100k/ml-100k.inter'
n_P, n_Q, rated_dict = load_data(data_path)

# 构造模型并训练
bpr = BPR(n_P, n_Q, rated_dict, lr=0.005, lmbda=0.05, embed_size=10, batch_size=1000)
bpr.train(epochs=10, samples=1000)

epoch 1：avg_loss = 0.6941; test_loss = 0.6931
epoch 2：avg_loss = 0.6679; test_loss = 0.6348
epoch 3：avg_loss = 0.5397; test_loss = 0.5975
epoch 4：avg_loss = 0.4872; test_loss = 0.5943
epoch 5：avg_loss = 0.4766; test_loss = 0.5871
epoch 6：avg_loss = 0.4727; test_loss = 0.5810
epoch 7：avg_loss = 0.4708; test_loss = 0.5762
epoch 8：avg_loss = 0.4697; test_loss = 0.5735
epoch 9：avg_loss = 0.4695; test_loss = 0.5722
epoch 10：avg_loss = 0.4693; test_loss = 0.5705
