In [31]:
import networkx as nx
import operator

Способы найти "важные" вершины:
    - по количеству соседей (degree centrality)
    - по близости к другим вершинам (closeness degree)
    - по тому, как они связывают другие вершины между собой

Выбор зависит от типа сети.

### Degree centrality

In [3]:
G = nx.karate_club_graph()
G = nx.convert_node_labels_to_integers(G, first_label=1)

In [4]:
degCent = nx.degree_centrality(G)

In [5]:
degCent[34]

0.5151515151515151

Degree centrality в направленном графе:
    - indegree centrality
    - outdegree centrality

In [None]:
indegCent = nx.in_degree_centrality(G)
outdegCent = nx.out_degree_centrality(G)

### Closeness centrality

- между любыми двумя вершинами есть путь

In [8]:
closeCent = nx.closeness_centrality(G)

In [11]:
closeCent[34]

0.55

In [19]:
(len(G.nodes())-1) / sum(nx.shortest_path_length(G, 34).values()) #по формуле

0.55

- Не между любыми двумя вершинами есть путь.

Option 1: учитывать только те вершины, в которые из v есть путь

In [None]:
nx.closeness_centrality(G, normalized=False)

Option 2:  учитывать долю вершин, в которые из v есть путь, от всех вершин

In [None]:
nx.closeness_centrality(G, normalized=True)

### Betweenness centrality

In [23]:
btwnCent = nx.betweenness_centrality(G, normalized=True, endpoints=False)

In [40]:
sorted(btwnCent.items(), key=operator.itemgetter(1), reverse=True)[0:5]

[(1, 0.43763528138528146),
 (34, 0.30407497594997596),
 (33, 0.145247113997114),
 (3, 0.14365680615680618),
 (32, 0.13827561327561325)]

Чтобы ускорить вычисление, можно задавать количество вершин в цикле:

In [28]:
btwnCent_approx10 = nx.betweenness_centrality(G, normalized=True, endpoints=False, k=10)

In [29]:
btwnCent_approx10[34]

0.2528816438191438

Приближенный результат вполне похож на точный:

In [39]:
sorted(btwnCent_approx10.items(), key=operator.itemgetter(1), reverse=True)[0:5]

[(1, 0.5072760341510342),
 (34, 0.2528816438191438),
 (33, 0.1270911495911496),
 (3, 0.10221771284271285),
 (2, 0.1005848665223665)]

In [None]:
btwnCent_approx10.items() #list of tuples [(key, value)]

Для двух подграфов можно найти наиболее важные для их связывания вершины:

In [41]:
btwnCent_subset = nx.betweenness_centrality_subset(G, [34, 33, 21, 30], [1, 4, 13, 11], 
                                                   normalized=True)

In [42]:
sorted(btwnCent_subset.items(), key=operator.itemgetter(1), reverse=True)[0:5]

[(1, 0.0067287457912457915),
 (34, 0.004163660413660414),
 (3, 0.003960738335738335),
 (14, 0.0037082130832130833),
 (33, 0.003412097162097162)]

Вместо важных вершин можно искать важные рёбра:

In [48]:
btwnCent_edge = nx.edge_betweenness_centrality(G, normalized=True)
btwnCent_edge[(31, 34)]

0.02681436210847975

In [49]:
btwnCent_edge_subset = nx.edge_betweenness_centrality_subset(G, [34, 33, 21, 30], [1, 4, 13, 11], 
                                                   normalized=True)

In [50]:
sorted(btwnCent_edge_subset.items(), key=operator.itemgetter(1), reverse=True)[0:5]

[((3, 33), 0.003727753727753727),
 ((1, 11), 0.0035650623885918),
 ((14, 34), 0.0034900829018476073),
 ((1, 9), 0.0028555866791160904),
 ((1, 32), 0.0028555866791160904)]

In [52]:
nx.hits(G) #алгоритм HITS

({1: 0.07141272875773573,
  2: 0.053427231205172614,
  3: 0.06371906453963268,
  4: 0.04242273710428976,
  5: 0.01526095969815266,
  6: 0.015966913494418547,
  7: 0.015966913494418547,
  8: 0.034343167206797434,
  9: 0.0456819251308063,
  10: 0.020625667757182626,
  11: 0.01526095969815266,
  12: 0.01061789150852051,
  13: 0.01692545078543599,
  14: 0.04549486406600547,
  15: 0.020370345842716076,
  16: 0.020370345842716076,
  17: 0.004748031841562519,
  18: 0.018561637031907358,
  19: 0.020370345842716076,
  20: 0.02971333389111539,
  21: 0.020370345842716076,
  22: 0.018561637031907358,
  23: 0.020370345842716076,
  24: 0.030156497528902444,
  25: 0.011460952230139869,
  26: 0.01189366439609368,
  27: 0.015182734341447207,
  28: 0.02681349412708363,
  29: 0.0263315057833753,
  30: 0.027111539646424865,
  31: 0.03510623798827733,
  32: 0.03837574188047834,
  33: 0.06200184647463986,
  34: 0.07500294214634279},
 {1: 0.07141272880870855,
  2: 0.05342723122870397,
  3: 0.0637190645558713

In [54]:
G_test = nx.DiGraph()
G_test.add_edges_from([('A', 'B'), ('B', 'A'), ('A', 'C'), ('C', 'D'), ('D', 'C')])

In [60]:
for i in [0.5, 0.9, 0.8, 0.95]:
    print(nx.pagerank(G_test, alpha=i)['C'])

0.3214282989501953
0.4390741390007211
0.3970582936941615
0.46639949368052747
