In [1]:
import networkx as nx
import matplotlib.pyplot as plt

# Load the GraphML file
graph_file_path = 'social_network.graphml'


G = nx.read_graphml(graph_file_path)

# # Draw the graph
# plt.figure(figsize=(8, 8))
# nx.draw(G, with_labels=True, node_color='lightblue', font_weight='bold', node_size=3000, font_size=10, edge_color='gray')
# plt.show()
num_nodes = G.number_of_nodes()
num_edges = G.number_of_edges()

(num_nodes, num_edges)

(41547, 95393)

In [None]:
import networkx as nx
from networkx.algorithms import community
import pandas as pd


# Hàm tính toán chỉ số modularity và cộng đồng sử dụng Girvan-Newman
def girvan_newman(G):
    # Sử dụng Girvan-Newman để phân chia cộng đồng
    girvan_newman_generator = community.girvan_newman(G)

    # Tìm cộng đồng tốt nhất theo chỉ số modularity
    girvan_newman_partition = max(girvan_newman_generator, key=lambda partition: community.modularity(G, partition))

    # Tính toán modularity của cộng đồng tốt nhất
    modularity = community.modularity(G, girvan_newman_partition)
    num_communities = len(girvan_newman_partition)  # Số cộng đồng

    # In số cộng đồng và chỉ số modularity
    print(f"Số cộng đồng: {num_communities}")
    print(f"Modularity: {modularity}")

    # Lưu node và cộng đồng vào tệp Excel
    nodes = list(G.nodes)

    # Xây dựng dictionary để tìm cộng đồng của mỗi node
    node_community_mapping = {}
    for community_id, community_nodes in enumerate(girvan_newman_partition):
        for node in community_nodes:
            node_community_mapping[node] = community_id

    # Tạo DataFrame và lưu vào file Excel
    community_data = {
        'Node': nodes,
        'Community': [node_community_mapping[node] for node in nodes]
    }

    df_community = pd.DataFrame(community_data)
    df_community.to_excel('girvan_newman_output.xlsx', index=False)

    return girvan_newman_partition, modularity

# Chạy Girvan-Newman và lưu kết quả
girvan_newman_partition, modularity = girvan_newman(G)


In [None]:
# import networkx as nx
# import pandas as pd
# from community import community_louvain  # Louvain
# from networkx.algorithms.community import girvan_newman, label_propagation_communities

# from networkx.algorithms.community import modularity
# # # Thuật toán Louvain
# # def louvain_clustering(graph):
# #     # Chuyển đồ thị có hướng thành không hướng
# #     undirected_graph = graph.to_undirected()
# #     partition = community_louvain.best_partition(undirected_graph)
# #     return partition

# # Thuật toán Girvan-Newman (Không chỉ định k, tự động trích xuất cộng đồng)
# def girvan_newman_clustering(graph):
#     # Chuyển đồ thị có hướng thành không hướng
#     undirected_graph = graph.to_undirected()
#     comp = girvan_newman(undirected_graph)

#     # Tự động trích xuất cộng đồng
#     communities = []
#     for community in comp:
#         communities.append(community)

#     return communities

# # Thuật toán Label Propagation Algorithm (LPA)
# # def lpa_clustering(graph):
# #     # Chuyển đồ thị có hướng thành không hướng
# #     undirected_graph = graph.to_undirected()
# #     communities = list(label_propagation_communities(undirected_graph))
# #     return communities

# # # Tạo đồ thị ví dụ (G) ở đây. Bạn sẽ thay bằng đồ thị thực tế của mình
# # # Ví dụ:
# # # G = nx.karate_club_graph()

# # # Áp dụng các thuật toán
# # # Louvain
# # louvain_partition = louvain_clustering(G)
# # louvain_df = pd.DataFrame(list(louvain_partition.items()), columns=["Node", "Community"])

# # Girvan-Newman
# girvan_newman_partition = girvan_newman_clustering(G)
# girvan_newman_df = pd.DataFrame(
#     [(node, f"Community {i+1}") for i, community in enumerate(girvan_newman_partition) for node in community],
#     columns=["Node", "Community"]
# )
# undirected_graph = G.to_undirected()  # Đảm bảo đồ thị là không hướng
# modularity_value = modularity(undirected_graph, girvan_newman_partition)
# num_communities = len(girvan_newman_partition)


# # # LPA
# # lpa_partition = lpa_clustering(G)
# # lpa_df = pd.DataFrame(
# #     [(node, f"Community {i+1}") for i, community in enumerate(lpa_partition) for node in community],
# #     columns=["Node", "Community"]
# # )

# # Lưu kết quả vào các tệp Excel
# # louvain_file = "Louvain_Clustering_Directed.xlsx"
# girvan_newman_file = "Girvan_Newman_Clustering_Directed.xlsx"
# # lpa_file = "LPA_Clustering_Directed.xlsx"

# # louvain_df.to_excel(louvain_file, index=False, engine='openpyxl')
# girvan_newman_df.to_excel(girvan_newman_file, index=False, engine='openpyxl')
# # lpa_df.to_excel(lpa_file, index=False, engine='openpyxl')

# print(f"Files saved:  {girvan_newman_file}")
# print(f"Giá trị modularity của Girvan-Newman: {modularity_value:.4f}")
# print(f"Số lượng cộng đồng của Girvan-Newman: {num_communities}")
