In [6]:
import collections
import nbimporter
import basicSim
import userCF_01label
from tqdm import tqdm
import csv

In [8]:
def read_triples(file_path):
    """
    从指定文件中读取用户-物品-评分的三元组。
    
    参数：
        file_path (str): 指定文件路径，例如 'rating_index.tsv'。
        
    返回：
        list of tuples: 返回一个包含 (user, item, rating) 三元组的列表。
    """
    triples = []  # 初始化一个空列表用于存储三元组
    with open(file_path, 'r', newline='') as file:
        reader = csv.reader(file, delimiter='\t')  # 使用制表符分隔
        for row in reader:
            user, item, rating = map(int, row)  # 转换为整数类型
            triples.append((user, item, rating))  # 将三元组添加到列表中
    return triples

In [12]:
triples = read_triples("rating_index.tsv")
triples

[(195, 1273, 0),
 (185, 1, 0),
 (21, 735, 0),
 (243, 543, 0),
 (165, 717, 0),
 (297, 612, 1),
 (114, 941, 0),
 (252, 599, 1),
 (304, 571, 0),
 (5, 304, 0),
 (61, 5, 0),
 (285, 208, 1),
 (199, 644, 1),
 (209, 1174, 0),
 (223, 675, 0),
 (302, 980, 0),
 (121, 1468, 1),
 (193, 832, 0),
 (290, 1581, 1),
 (233, 808, 0),
 (118, 911, 1),
 (166, 652, 1),
 (298, 1213, 1),
 (290, 1158, 0),
 (307, 760, 1),
 (94, 1159, 0),
 (37, 877, 1),
 (101, 1507, 0),
 (62, 1392, 1),
 (159, 1517, 1),
 (49, 1029, 0),
 (300, 1483, 1),
 (224, 202, 1),
 (289, 117, 1),
 (96, 1300, 0),
 (156, 832, 1),
 (180, 276, 0),
 (277, 1137, 1),
 (275, 174, 0),
 (6, 865, 1),
 (9, 639, 1),
 (283, 1250, 1),
 (200, 1374, 0),
 (275, 251, 0),
 (286, 78, 1),
 (245, 1074, 1),
 (241, 679, 1),
 (248, 131, 1),
 (98, 150, 1),
 (177, 1341, 0),
 (250, 868, 1),
 (80, 732, 0),
 (259, 1310, 1),
 (24, 985, 1),
 (58, 1238, 1),
 (71, 838, 0),
 (86, 1489, 1),
 (289, 226, 1),
 (41, 1490, 1),
 (291, 967, 1),
 (114, 1316, 0),
 (19, 910, 0),
 (200, 234,

In [14]:
def getDict(triples):
    """
    将三元组数据转换为用户-物品和物品-用户字典。

    参数：
        triples (iterable): 一个三元组列表，每个三元组的形式为 (用户 ID, 物品 ID, 评分)。
                             例如：[(u1, i1, r1), (u2, i2, r2), ...]

    返回：
        tuple: 包含两个字典的元组：
            - user_items (defaultdict(dict)): 用户与物品及其评分的映射，结构为 {用户 ID: {物品 ID: 评分, ...}, ...}。
            - item_users (defaultdict(dict)): 物品与用户及其评分的映射，结构为 {物品 ID: {用户 ID: 评分, ...}, ...}。

    功能：
        该函数将输入的三元组数据转换为两个字典，便于快速访问用户对物品的评分以及物品对用户的评分。
    """
    
    user_items = collections.defaultdict(dict)
    item_users = collections.defaultdict(dict)
    for u,i,r in triples:
        user_items[u][i] = r
        item_users[i][u] = r
    return user_items, item_users