In [1]:
import pandas as pd
from apyori import apriori
import pyfpgrowth

In [2]:
def loadData():
    # 加载数据
    data = pd.read_excel('超市销售关联.xlsx') # 读取Excel文件中的数据
    inputList = data.values.tolist() # 将数据转换为列表格式
    # 定义商品的编号名称，用于替换 T 和 F 值
    header = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K'] # 商品编号
    itemList = [] # 存储转换后的商品列表
    # 遍历数据，逐行处理
    for item in inputList:
        cur = [] # 当前交易项的商品列表
        for i in range(len(item)):
            if item[i] == 'T': # 如果该项为 'T'，表示用户购买了该商品
                cur.append(header[i]) # 添加商品编号到当前交易项
        itemList.append(cur) # 将当前交易项添加到商品列表中
    return itemList # 返回处理后的商品交易数据

In [3]:
# 定义Apriori算法函数，最小支持度、最小置信度、最小提升度、最大项集长度
def apriori_method(data, min_support, min_confidence, min_lift, max_length):
    # 使用Apriori算法生成关联规则
    associate_rules = apriori(data, min_support = min_support,min_confidence = min_confidence, min_lift = min_lift, max_length = max_length)
    # 遍历生成的关联规则
    for rule in associate_rules:
        # 输出频繁项集和对应的支持度
        print("频繁项集 %s，支持度 %f" % (rule.items, rule.support))
        # 遍历频繁项集的关联关系，输出关联规则的详细信息(前提项集、结果项集、置信度、提升度)
        for item in rule.ordered_statistics:
            # 输出关联规则及其置信度和提升度
            print("%s -> %s, 置信度 %f 提升度 %f" %(item.items_base, item.items_add, item.confidence, item.lift)) 
        print() # 换行

In [6]:
# 定义FP-Growth算法函数
def fpgrowth_method(data, min_support, min_confidence):
    # 生成频繁项集
    patterns = pyfpgrowth.find_frequent_patterns(data, min_support)
    # 生成关联规则
    rules = pyfpgrowth.generate_association_rules(patterns, min_confidence)
    # 遍历规则，输出关联规则的详细信息（前提项集、结果项集、置信度）
    for i in rules:
        # 输出规则及其置信度
        print("%s -> %s 置信度 %f" % (i, rules[i][0], rules[i][1]))

In [7]:
if __name__ == "__main__":
    data = loadData() # 加载并处理数据
    # 设置Apriori和FP-Growth算法的参数
    min_support = 0.1 # 最小支持度阈值
    min_confidence = 0.5 # 最小置信度阈值
    min_lift = 0.0 # 最小提升度阈值
    max_length = 3 # 最大项集长度
    print('Apriori得到的关联规则')
    apriori_method(data, min_support, min_confidence, min_lift, max_length)
    print('FP-growth树得到的关联规则')
    fpgrowth_method(data, min_support, min_confidence) # 调用FP-Growth算法方法

Apriori得到的关联规则
频繁项集 frozenset({'A', 'J'})，支持度 0.189542
frozenset({'A'}) -> frozenset({'J'}), 置信度 0.514184 提升度 1.456856
frozenset({'J'}) -> frozenset({'A'}), 置信度 0.537037 提升度 1.456856

频繁项集 frozenset({'F', 'D'})，支持度 0.226144
frozenset({'D'}) -> frozenset({'F'}), 置信度 0.604895 提升度 1.595672
frozenset({'F'}) -> frozenset({'D'}), 置信度 0.596552 提升度 1.595672

频繁项集 frozenset({'G', 'D'})，支持度 0.218301
frozenset({'D'}) -> frozenset({'G'}), 置信度 0.583916 提升度 1.648324
frozenset({'G'}) -> frozenset({'D'}), 置信度 0.616236 提升度 1.648324

频繁项集 frozenset({'F', 'G'})，支持度 0.222222
frozenset({'F'}) -> frozenset({'G'}), 置信度 0.586207 提升度 1.654791
frozenset({'G'}) -> frozenset({'F'}), 置信度 0.627306 提升度 1.654791

频繁项集 frozenset({'H', 'K'})，支持度 0.188235
frozenset({'H'}) -> frozenset({'K'}), 置信度 0.533333 提升度 1.533835
frozenset({'K'}) -> frozenset({'H'}), 置信度 0.541353 提升度 1.533835

频繁项集 frozenset({'F', 'G', 'D'})，支持度 0.190850
frozenset({'D'}) -> frozenset({'F', 'G'}), 置信度 0.510490 提升度 2.297203
frozenset({'F'}) -> frozen