# Graph 基本介绍

## 1. 什么是图

**无向图**：节点之间的边没有指向  
**有向图**：节点之间的边具有指向  
**子图**  ：大图中的某一部分

1. 节点 <-> 点
2. 边
3. 度：节点上边的个数；  
出度：有向图中以该节点为起点的边的个数；  
入度：有向图中以该节点为终点的边的个数。

4. 连通图：无孤立节点  
无向图：任意两个节点可以通过一个或多个边进行连接；  
有向图：

5. 连通分量：无向图中的一个极大连通子图  
无向连通图的连通分量有且仅有一个，即其自身；  
无向非连通的有多个连通分量；

6. 有向图的连通性  
`1)` **强连通图**：对于有向图中的任意两个节点都可以相互到达  
`2)` **弱连通图**：对于有向图，若有至少一对节点不满足单向连通，但当成无向图看是连通的图  

7. 最短路径：两个节点之间，通过的最少的边数  
8. 图直径：图中两两节点之间最短路径的对大值  
9. 度中心性：$$度中心性= \frac{N_{degree}}{n-1}$$  
$n$，图中节点的数量  
$N_{degree}$，该节点的度。([LaTex](https://math.meta.stackexchange.com/questions/5020/mathjax-basic-tutorial-and-quick-reference))  

10. 特征向量中心性：对一个临界矩阵求它的特征值和特征向量，最大的特征值所对应的特征向量
$$A * x = \lambda * x$$
$A$，图的邻接矩阵；  
$x$，特征向量；  
$\lambda$，特征值  
11. 中介中心性(Betweenness Centrality) 
$$Betweenness = \frac{经过该节点的最短路径}{其余两两节点的最短路径}???$$
12. 连接中心性(Closeness):$$Closeness = \frac{n - 1}{节点到其它节点最短路径之和}$$
$n$，途中节点数目  
13. PageRank  
14. HITS

In [1]:
import numpy as np
import pandas as pd
import networkx as nx

In [3]:
# create a graph
edges = pd.DataFrame()
edges['sources'] = [1,1,1,2,2,3,3,4,4,5,5,5]
edges['targets'] = [2,4,5,3,1,2,5,1,5,1,3,4]
edges['weights'] = [1,1,1,1,1,1,1,1,1,1,1,1]

graph = nx.from_pandas_edgelist(edges, source='sources', target='targets', edge_attr='weights')

In [4]:
graph

<networkx.classes.graph.Graph at 0x7fdd6a5fe230>

In [5]:
print(graph)

Graph with 5 nodes and 6 edges


In [6]:
# degree
print(nx.degree(graph))

[(1, 3), (2, 2), (4, 2), (5, 3), (3, 2)]


In [7]:
# connected component
print(list(nx.connected_components(graph))) 

[{1, 2, 3, 4, 5}]


In [8]:
# diameter 
print(nx.diameter(graph))

2


In [9]:
# degree centrality
nx.degree_centrality(graph)

{1: 0.75, 2: 0.5, 4: 0.5, 5: 0.75, 3: 0.5}

In [10]:
# eigenvector centrality
nx.eigenvector_centrality(graph)

{1: 0.5298988890761731,
 2: 0.35775191431708964,
 4: 0.4271316779596084,
 5: 0.5298988890761731,
 3: 0.35775191431708964}

In [11]:
# betweenness
nx.betweenness_centrality(graph)

{1: 0.25, 2: 0.08333333333333333, 4: 0.0, 5: 0.25, 3: 0.08333333333333333}

In [12]:
# closeness centrality
nx.closeness_centrality(graph)

{1: 0.8,
 2: 0.6666666666666666,
 4: 0.6666666666666666,
 5: 0.8,
 3: 0.6666666666666666}

In [13]:
# PageRank
nx.pagerank(graph)

{1: 0.24369622576677993,
 2: 0.1722562971205864,
 4: 0.16809495422526696,
 5: 0.24369622576677993,
 3: 0.1722562971205864}

In [14]:
# HITS
nx.hits(graph)

  A = nx.adjacency_matrix(G, nodelist=list(G), dtype=float)


({1: 0.24059715204600776,
  2: 0.162434564716677,
  4: 0.19393656647463048,
  5: 0.24059715204600784,
  3: 0.16243456471667692},
 {1: 0.24059715204600787,
  2: 0.16243456471667692,
  4: 0.1939365664746304,
  5: 0.2405971520460078,
  3: 0.162434564716677})