# [3] 物品-物品协同过滤（Item-Item Collaborative Filtering）

**学习顺序：第3个** - 学习最常用且最实用的协同过滤方法

通过找到与目标物品相似的其他物品，然后基于用户对这些相似物品的评分来预测。

## 为什么学这个？
- ✅ 这是实际应用中最常用的方法
- ✅ 理解可扩展性的重要性
- ✅ 学习推荐系统的工程实践

## 核心思想
- 相似的物品会收到相似的评分
- 如果用户对物品A的评分很高，且物品B与物品A相似，那么用户对物品B的评分也可能很高

In [1]:
# 确保导入项目本地的 matrix_factorization 模块
import sys
import os
project_root = os.path.abspath(os.path.join(os.getcwd(), '..'))
if project_root not in sys.path:
    sys.path.insert(0, project_root)

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from matrix_factorization import ItemItemCF

In [2]:
cols = ['user_id', 'item_id', 'rating', 'timestamp']
movie_data = pd.read_csv('../data/ml-100k/u.data', names=cols, sep='\t', usecols=[0, 1, 2], engine='python')

X = movie_data[['user_id', 'item_id']]
y = movie_data['rating']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [3]:
item_cf_model = ItemItemCF(min_rating=1, max_rating=5, n_neighbors=50, verbose=1)
item_cf_model.fit(X_train, y_train)

pred = item_cf_model.predict(X_test)
mse = mean_squared_error(y_test, pred)
rmse = mse ** 0.5
print(f"测试集 RMSE: {rmse:.4f}")

  X.loc[:, "item_id"] = X["item_id"].map(self.item_id_map)


测试集 RMSE: 1.1491
