# Функции и библиотеки

In [1]:
import networkx as nx
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

# Загрузка данных, количество ребер и вершин; плотность

In [6]:
%%time


G = nx.DiGraph()
with open('../datasets/web-Google.txt', mode='r') as f:
    for line in f:
        u, v = line.split()
        G.add_edge(u, v)

Wall time: 17.6 s


In [7]:
print('Количество вершин: ', G.number_of_nodes())
print('Количество ребер: ', G.number_of_edges())
print('Плотность графа: ', nx.density(G))

Количество вершин:  875713
Количество ребер:  5105039
Плотность графа:  6.656960291514363e-06


# Количество компонент связности, характеристики наибольшей компоненты

In [4]:
%%time
cc_number = nx.number_connected_components(G)
largest_component = G.subgraph(nodes=max(nx.connected_components(G), key=len))

Wall time: 7.96 s


In [5]:
print(f'Число компонент связности - {cc_number}')
print(f'Наибольшая компонента состоит из {largest_component.number_of_nodes()} вершин ' \
      f'и {largest_component.number_of_edges()} ребер')

Число компонент связности - 2746
Наибольшая компонента состоит из 855802 вершин и 4291352 ребер


# Метрические характеристики графа: диаметр, радиус

In [22]:
%%time
diam = nx.diameter(largest_component)
radius = nx.radius(largest_component)

KeyboardInterrupt: 

In [23]:
print(f'Диаметр наибольшей компоненты - {diam}')
print(f'Радиус наибольшей компоненты - {radius}')

NameError: name 'diam' is not defined

# Функция вероятности для степени узла в графе
Минимальная, максимальная, средняя степень узла в графе. Надо построить функцию вероятности (можно в виде гистограммы относительных частот)

In [22]:
%%time
degrees = list(map(lambda elem: elem[1], list(G.degree())))
max_deg = max(degrees)
min_deg = min(degrees)
mean_deg = int(sum(degrees)/ len(degrees))

Wall time: 16 ms


In [23]:
print('Максимальная степень узла:', max(degrees))
print('Минимальная степень узла:', min(degrees))
print('Средняя степень узла:', int(sum(degrees)/len(degrees)))

Максимальная степень узла: 504
Минимальная степень узла: 1
Средняя степень узла: 21


# Число треугольников, глобальный и кластерный коэффициенты

In [31]:
%%time
n_of_triangles = sum(nx.triangles(G).values()) / 3

Wall time: 3.18 s


In [32]:
%%time
average_coef = nx.average_clustering(G)

Wall time: 3.06 s


In [33]:
print(f'Число треугольников в графе - {n_of_triangles}')
print(f'Средний кластерный коэффициент сети - {average_coef}')

Число треугольников в графе - 1351441.0
Средний кластерный коэффициент сети - 0.6305932411707943
