# Библиотеки, функции

In [20]:
import graphlib.structures as struct
import graphlib.algorithms as alg
import graphlib.tools as tls

# Загрузка данных, количество ребер и вершин

In [8]:
%%time

G = struct.Digraph('Google')
with open('datasets/web-Google.txt', 'r') as f:
    for line in f:        
        u, v = line.split()
        G.add_edge(u, v)
        
print(G)

Ориентированный граф <Google> с 875713 вершинами and 5105039 ребрами
Wall time: 7.21 s


In [9]:
simple_graph = G.to_simple()
print(simple_graph)
print(f'Плотность графа: {tls.density(simple_graph)}')

Граф <неориентированный граф, лежащий в основе Google> с 875713 вершинами and 4322051 ребрами
Плотность графа: 4.627433740933122e-07


# Выделение компонент слабой связности, характеристики наибольшей компоненты

In [31]:
number, largest_index, wcc = alg.weakly_components(G, largest=True)
print(f'Число компонент слабой связности - {number}')

largest_weak_component = G.subgraph(nodes=wcc[largest_index])
print(f'Наибольшая компонента связности: {largest_weak_component.nodes_count} вершин и {largest_weak_component.edges_count} ребер')
print(f'Доля вершин в наибольшей компоненте слабой связности: {round(largest_weak_component.nodes_count / simple_graph.nodes_count, 3)}')

Число компонент слабой связности - 2746
Наибольшая компонента связности: 855802 вершин и 5066842 ребер
Доля вершин в наибольшей компоненте слабой связности: 0.977


# Выделение компонент сильной связности

In [28]:
scc = list(alg.strongly_components_tarjan(G))
print('Число компонент сильной связности: ', len(scc))

largest_strong_component = G.subgraph(nodes=list(max(scc, key=lambda elem: len(elem))))
print(f'Наибольшая компонента сильной связности состоит из {largest_strong_component.nodes_count} вершин и {largest_strong_component.edges_count} ребер')
print(f'Доля вершин в наибольшей компоненте слабой связности: {round(largest_strong_component.nodes_count / G.nodes_count, 3)}')

Число компонент сильной связности:  371764
Наибольшая компонента сильной связности состоит из 434818 вершин и 3419124 ребер
Доля вершин в наибольшей компоненте слабой связности: 0.497


# Мета-граф

# Метрические свойства наибольшей компоненты слабой связности: радиус, диаметр и 90 процентиль (approximation)

In [None]:
%%time
largest_component = largest_weak_component.to_simple()

diam = diameter_approximate(graph=largest_component,
                            number=500)
print(f'Диаметр наибольшей компоненты (приближенно): {diam}')

radius = radius_approximate(graph=largest_component,
                            number=500)
print(f'Радиус наибольшей компоненты (приближенно): {radius}')

percentile = geodesic_percentile_approximate(graph=largest_component,
                                             number=500,
                                             percent=90)
print(f'90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): {percentile}')