In [4]:
# coding:utf-8
from igraph import *
import csv

In [2]:
# 社区：同一个社区内的节点之间的连接很紧密，不同社区
# 之间的连接比较稀疏。当两个社区之间存在节点的交集时，
# 称它们为重叠社区，否则为非重叠社区

# 社区发现算法：
# GN算法（O(n^3)）
# 边介数：对于任意一条边，经过该条边的最短路径的数量，就称为边介数
# GN算法运行过程：
# 1.计算网络中所有边的边介数
# 2.找到介数最大的边，并将它从图中移除 
# 3.重复以上步骤，直到满足一定条件（比如达到指定社区数量）

In [6]:
netPath = r'E:\python\PythonSpace\Git\Python\Igraph\Data\net.data'
edges = []
with open(netPath, 'r') as fr:
	for row in csv.reader(fr.read().splitlines()):
		u, v = [i for i in row]
		edges.append((u, v))
g = Graph.TupleList(edges, vertex_name_attr="point")
points = g.vs["point"]

In [7]:
# GN算法 - 边介数
btes = []
for p in zip(g.es(), g.edge_betweenness()):
	e = p[0].tuple
	btes.append({"edge": (points[e[0]], points[e[1]]), "bt": p[1]})
sorted(btes, key=lambda k: k["bt"], reverse=True)

[{'bt': 49.0, 'edge': ('7', '8')},
 {'bt': 33.0, 'edge': ('3', '7')},
 {'bt': 33.0, 'edge': ('7', '6')},
 {'bt': 33.0, 'edge': ('8', '9')},
 {'bt': 33.0, 'edge': ('8', '12')},
 {'bt': 12.0, 'edge': ('1', '3')},
 {'bt': 12.0, 'edge': ('2', '3')},
 {'bt': 12.0, 'edge': ('4', '6')},
 {'bt': 12.0, 'edge': ('5', '6')},
 {'bt': 12.0, 'edge': ('9', '10')},
 {'bt': 12.0, 'edge': ('9', '11')},
 {'bt': 12.0, 'edge': ('12', '13')},
 {'bt': 12.0, 'edge': ('12', '14')},
 {'bt': 1.0, 'edge': ('1', '2')},
 {'bt': 1.0, 'edge': ('4', '5')},
 {'bt': 1.0, 'edge': ('10', '11')},
 {'bt': 1.0, 'edge': ('13', '14')}]

In [8]:
communities = g.community_edge_betweenness()
print(communities)
print(g.vs["point"])

Dendrogram, 14 elements, 13 merges

0 1 2 3 4 5 6 7 11 12 13 8 9 10
| | | | | | | | |  |  |  | | |
| | | | | | | | |  `--'  | | |
| | | | | | | | |   |    | | |
| | | | | | | | `---'    | `-'
| | | | | | | |   |      |  | 
| | | | | `-' |   |      `--' 
| | | | |  |  |   |       |   
| `-' | `--'  |   |       |   
|  |  |  |    |   |       |   
`--'  `--'    `---'       |   
 |     |        |         |   
 `-----'        `---------'   
    |                |        
    `----------------'
['1', '2', '3', '7', '4', '5', '6', '8', '9', '10', '11', '12', '13', '14']


In [9]:
# 社区评价指标

# 模块度（[0, 1]）：对整个图的社区划分结果进行评价
# 基本思想：一个图中存在社区时任意两个节点之间存在边的概率要大于
# 不存在社区时任意两个节点之间存在边的概率

# 阻断率：对划分结果中的单个社区进行评价
# 该社区中与外界连通连通的边数比上当前社区中边的数量

In [None]:
# Louvain算法（O(n^3)）
# 基于模块度的启发式算法
# 比如从节点a开始，它与b,c,d三个节点连接
# 首先计算分别将b,c,d加入a所在的社区，计算加入后模块度的增量
# 然后选择增量最大的那个节点，加入a所在的社区

In [10]:
# LPA算法（近似于O(n)），但是该算法的稳定性不好，在工业界使用不多
# 该算法不需要预先知识，不用预先给定社区的数量，可以控制迭代次数来
# 划分节点类别

# 1.初始化每个节点，给其唯一标签 
# 2.对所有节点进行同步更新，对于任意一个节点，用它所有邻居中最多的标签对其更新
# 3.重复，直到收敛（该算法可能会不收敛）

In [1]:
# SLPA算法（LPA算法的改进版）