In [8]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
from networkx.algorithms import community

# 读取数据
df = pd.read_excel("handled_data2.xlsx")

# 预处理数据
df = df[['CustomerID', 'StockCode']]
df.drop_duplicates(inplace=True)

# 创建一个无向图
G = nx.Graph()

# 计算商品和客户的关系
product_customer = df.groupby('StockCode')['CustomerID'].apply(list)

# 为每个商品的顾客对创建边，并加上权重
for customers in product_customer:
    for i in range(len(customers)):
        for j in range(i + 1, len(customers)):
            if G.has_edge(customers[i], customers[j]):
                G[customers[i]][customers[j]]['weight'] += 1
            else:
                G.add_edge(customers[i], customers[j], weight=1)


In [9]:
# 计算社群
partition = community.louvain_communities(G, weight='weight')
print(f"检测到的社群数量: {len(partition)}")

检测到的社群数量: 4


In [10]:
# 可选：输出每个客户的社区
for node in G.nodes():
    for i, comm in enumerate(partition):
        if node in comm:
            print(f"客户 {node} 属于社群 {i + 1}")

客户 12583 属于社群 4
客户 16098 属于社群 3
客户 17967 属于社群 4
客户 13069 属于社群 4
客户 17677 属于社群 4
客户 15529 属于社群 4
客户 16795 属于社群 1
客户 12872 属于社群 2
客户 12682 属于社群 4
客户 14713 属于社群 4
客户 12731 属于社群 3
客户 14911 属于社群 1
客户 16701 属于社群 1
客户 16805 属于社群 1
客户 12867 属于社群 4
客户 14258 属于社群 4
客户 16122 属于社群 1
客户 17365 属于社群 1
客户 13246 属于社群 4
客户 12748 属于社群 1
客户 18069 属于社群 2
客户 12673 属于社群 4
客户 12510 属于社群 1
客户 12451 属于社群 4
客户 16395 属于社群 4
客户 12637 属于社群 4
客户 13230 属于社群 4
客户 17236 属于社群 2
客户 13148 属于社群 2
客户 12681 属于社群 4
客户 12754 属于社群 1
客户 17085 属于社群 2
客户 15382 属于社群 4
客户 17994 属于社群 4
客户 13870 属于社群 3
客户 15514 属于社群 1
客户 14769 属于社群 2
客户 17337 属于社群 1
客户 18079 属于社群 1
客户 14525 属于社群 2
客户 15547 属于社群 2
客户 17629 属于社群 4
客户 14189 属于社群 1
客户 15203 属于社群 4
客户 16551 属于社群 3
客户 16607 属于社群 1
客户 13717 属于社群 2
客户 15150 属于社群 1
客户 15974 属于社群 2
客户 15298 属于社群 4
客户 16460 属于社群 1
客户 14321 属于社群 2
客户 14535 属于社群 2
客户 18096 属于社群 1
客户 17870 属于社群 1
客户 13091 属于社群 1
客户 14904 属于社群 1
客户 16924 属于社群 4
客户 16712 属于社群 4
客户 17198 属于社群 2
客户 15021 属于社群 2
客户 16931 属于社群 1
客户 15026

In [12]:
partition[0]

{16385,
 16400,
 16406,
 16411,
 16422,
 16423,
 16433,
 16440,
 16442,
 12350,
 16454,
 16455,
 16460,
 16461,
 16463,
 16470,
 12374,
 16478,
 16479,
 16480,
 16482,
 12386,
 12391,
 16488,
 16491,
 16493,
 16495,
 16496,
 16499,
 16500,
 16505,
 12418,
 16518,
 12424,
 12427,
 12430,
 12432,
 16531,
 16532,
 12441,
 16546,
 12452,
 12453,
 16553,
 12461,
 16561,
 12465,
 16569,
 12474,
 16571,
 16574,
 12484,
 16582,
 16583,
 12488,
 12489,
 12497,
 16594,
 16595,
 16597,
 16602,
 16603,
 12508,
 12510,
 16607,
 16611,
 16613,
 16616,
 16619,
 12532,
 16629,
 12536,
 12540,
 16637,
 16638,
 12544,
 12546,
 16644,
 16648,
 16650,
 16655,
 16656,
 16657,
 12565,
 16666,
 12571,
 16668,
 16669,
 16671,
 12577,
 16674,
 16678,
 16681,
 16685,
 16686,
 16688,
 16690,
 12599,
 16697,
 12602,
 16698,
 16701,
 12607,
 12610,
 12611,
 16714,
 12618,
 16718,
 16719,
 16720,
 12628,
 16726,
 16727,
 16730,
 16732,
 16734,
 12638,
 16742,
 16743,
 16744,
 16753,
 16754,
 12660,
 16758,
 16759,


In [15]:
eigenvector = nx.eigenvector_centrality(G, weight='weight')

In [18]:
eigenvector

{12583: 0.01812581329063553,
 16098: 0.004487571236622635,
 17967: 0.006255546065256536,
 13069: 0.042388864056460876,
 17677: 0.03388382055207752,
 15529: 0.05528241992407729,
 16795: 0.008500653224263166,
 12872: 0.011531911299599776,
 12682: 0.03751072490074608,
 14713: 0.028073696766787108,
 12731: 0.019294688190449737,
 14911: 0.17839790371777303,
 16701: 0.012777405181133784,
 16805: 0.011137486026499334,
 12867: 0.03985486724733049,
 14258: 0.012505019929206405,
 16122: 0.003182913473607711,
 17365: 0.03544735478899287,
 13246: 0.019920745968595,
 12748: 0.17652159557496017,
 18069: 0.044034589131652695,
 12673: 0.007006170154750699,
 12510: 0.004500578898586872,
 12451: 0.03735556763540895,
 16395: 0.021912705606785477,
 12637: 0.03558295100362061,
 13230: 0.05898160855520673,
 17236: 0.015034086005218598,
 13148: 0.02755381228262915,
 12681: 0.04117523834016248,
 12754: 0.0045503400240793895,
 17085: 0.01629005495056531,
 15382: 0.03497210092670216,
 17994: 0.01079768957735461