In [1]:
import numpy as np

### 1. 均方误差 (MSE)

$$
\text{MSE} = \frac{1}{|A|} \sum_{(u,i) \in A} (r_{ui} - \hat{r_{ui}})^2
$$

其中：

- $|A|$ 表示评分矩阵中实际评分的数量。
- $r_{ui}$ 表示用户 `u` 对物品 `i` 的实际评分。
- $\hat{r_{ui}}$ MAE 是实际评分和预测评分的绝对误差的平均值。



MAE 是实际评分和预测评分的绝对误差的平均值。

In [4]:
def MSE(y_true, y_pred):
    return np.mean((np.array(y_true) - np.array(y_pred)) ** 2)

### 2. 均方根误差 (RMSE)

$$
\text{RMSE} = \sqrt{\frac{1}{|A|} \sum_{(u,i) \in A} (r_{ui} - \hat{r_{ui}})^2}
$$

RMSE 是 MSE 的平方根，用于保留与原评分尺度相同的单位。

In [7]:
def RMSE(y_true, y_pred):
    return MSE(y_true, y_pred) ** 0.5

### 3. 平均绝对误差 (MAE)

$$
\text{MAE} = \frac{1}{|A|} \sum_{(u,i) \in A} |r_{ui} - \hat{r_{ui}}|
$$

MAE 是实际评分和预测评分的绝对误差的平均值。

In [10]:
def MAE(y_true, y_pred):
    return np.mean(np.abs(np.array(y_true) - np.array(y_pred)))

### 4. 召回率 (Recall)

**召回率** (Recall) 是衡量模型从所有正样本中正确识别出的比例，反映了模型对正样本的敏感度。

公式如下：

$$
\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}}
$$

其中：
- $\text{TP}$（True Positives）：被预测为正且实际为正的样本数量。
- $\text{FN}$（False Negatives）：被预测为ositives）：被预测为正但实际为负的样本数量。

In [18]:
def recall4Set(test_set, pred_set):
    """
    计算召回率 (Recall)。
    
    输入:
    - test_set: set，测试集的正样本集合
    - pred_set: set，预测集的正样本集合

    输出:
    - float，召回率（Recall），范围 [0, 1]

    公式:
    Recall = |pred_set ∩ test_set| / |test_set|
    其中，|pred_set ∩ test_set| 表示预测为正且实际为正的样本数量（TP）。
    """
    # 计算交集中的正样本数量，并除以测试集中正样本的总数
    return len(pred_set & test_set) / len(test_set)

### 5. 精确率 (Precision)

**精确率** (Precision) 是衡量模型预测为正的样本中实际为正的比例，反映了模型对正样本预测的准确性。

公式如下：

$$
\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}}
$$

其中：
- $\text{TP}$（True Positives）：被预测为正且实际为正的样本数量。
- $\text{FP}$（False Positives）：被预测为正但实际为负的样本数量。

In [12]:
def percision4Set(test_pos_set, test_neg_set, pred_set):
    """
    计算精确率 (Precision)。
    
    输入:
    - test_pos_set: set，测试集的正样本集合
    - test_neg_set: set，测试集的负样本集合
    - pred_set: set，预测集的正样本集合

    输出:
    - float，精确率（Precision），范围 [0, 1]

    公式:
    Precision = TP / (TP + FP)
    其中:
    - TP（True Positives）: 预测为正且实际为正的样本数量
    - FP（False Positives）: 预测为正但实际为负的样本数量
    """
    # 计算TP：预测为正且实际为正的样本数量
    TP = len(pred_set & test_pos_set)
    # 计算FP：预测为正但实际为负的样本数量
    FP = len(pred_set & test_neg_set)

    p = TP / (TP + FP) if TP + FP > 0 else None
    # p = TP/len(pred_set) #若对模型严格一点可这么去算精确度

    return p