#### Задача
В файле links.txt находится список ссылок между страницами сайта ru.wikipedia.org, посвященных городам России. Каждая строка задает одну ссылку парой целочисленных идентификаторов, разделенных символом табуляции. Соответствие между идентификаторами и адресами страниц находятся в файле pages.txt. Найдите топ-10 страниц по каждой из центральностей (betweenness, closeness, eigenvector, pagerank) в этом фрагменте веб-графа.

In [2]:
import networkx as nx

def print_top_10(centrality_dict, page2link):
    sorted_top = sorted(centrality_dict.items(),
                        key=lambda x: x[1],
                        reverse=True)[:10]
    for vertex, value in sorted_top:
        print page2link[vertex], value

In [3]:
with open("links.txt") as f:
    G = nx.DiGraph()
    for line in f:
        u, v = line.strip().split('\t')
        G.add_edge(u, v)

page2link = dict()
with open("pages.txt") as f:
    for line in f:
        page, link = line.strip().split('\t')
        page2link[page] = link

In [4]:
P = nx.pagerank(G, alpha=0.85, max_iter=1000)
print "PageRank:"
print_top_10(P, page2link)

PageRank:
http://ru.wikipedia.org/wiki/Москва 0.0385447458087
http://ru.wikipedia.org/wiki/Санкт-Петербург 0.0303727401049
http://ru.wikipedia.org/wiki/Екатеринбург 0.0126568906911
http://ru.wikipedia.org/wiki/Казань 0.0120501146109
http://ru.wikipedia.org/wiki/Архангельск 0.00998461112708
http://ru.wikipedia.org/wiki/Самара 0.0099600075345
http://ru.wikipedia.org/wiki/Великий_Новгород 0.00923344059028
http://ru.wikipedia.org/wiki/Нижний_Новгород 0.00892318943952
http://ru.wikipedia.org/wiki/Волгоград 0.00828594344912
http://ru.wikipedia.org/wiki/Челябинск 0.00823630271556


In [5]:
bc = nx.betweenness_centrality(G)
print "Betweenness:"
print_top_10(bc, page2link)

Betweenness:
http://ru.wikipedia.org/wiki/Москва 0.157358489029
http://ru.wikipedia.org/wiki/Волгоград 0.0803208286466
http://ru.wikipedia.org/wiki/Санкт-Петербург 0.0768610397655
http://ru.wikipedia.org/wiki/Казань 0.0394242448136
http://ru.wikipedia.org/wiki/Екатеринбург 0.0364179778547
http://ru.wikipedia.org/wiki/Воронеж 0.0306215700538
http://ru.wikipedia.org/wiki/Пермь 0.029735896277
http://ru.wikipedia.org/wiki/Красноярск 0.0294115806862
http://ru.wikipedia.org/wiki/Калининград 0.0292686981507
http://ru.wikipedia.org/wiki/Великий_Новгород 0.0261107873622


In [6]:
cc = nx.closeness_centrality(G)
print "Closeness:"
print_top_10(cc, page2link)

Closeness:
http://ru.wikipedia.org/wiki/Королёв_(город) 0.22785130719
http://ru.wikipedia.org/wiki/Волгоград 0.22750990577
http://ru.wikipedia.org/wiki/Ногинск 0.220377519755
http://ru.wikipedia.org/wiki/Рязань 0.217848079069
http://ru.wikipedia.org/wiki/Казань 0.214766776678
http://ru.wikipedia.org/wiki/Воронеж 0.212899763196
http://ru.wikipedia.org/wiki/Волоколамск 0.211535401381
http://ru.wikipedia.org/wiki/Арзамас 0.210947639776
http://ru.wikipedia.org/wiki/Магнитогорск 0.210830479188
http://ru.wikipedia.org/wiki/Ульяновск 0.209608104792


In [7]:
ec = nx.eigenvector_centrality(G)
print "Eigenvector:"
print_top_10(ec, page2link)

Eigenvector:
http://ru.wikipedia.org/wiki/Москва 0.411699226627
http://ru.wikipedia.org/wiki/Санкт-Петербург 0.314437297929
http://ru.wikipedia.org/wiki/Казань 0.237369105166
http://ru.wikipedia.org/wiki/Самара 0.208711306459
http://ru.wikipedia.org/wiki/Екатеринбург 0.187242218426
http://ru.wikipedia.org/wiki/Уфа 0.181819487793
http://ru.wikipedia.org/wiki/Нижний_Новгород 0.169886852728
http://ru.wikipedia.org/wiki/Пермь 0.169221736824
http://ru.wikipedia.org/wiki/Саратов 0.161103043711
http://ru.wikipedia.org/wiki/Волгоград 0.161047623331
