# Библиотеки

In [2]:
import os
import sys
module_path = os.path.abspath(os.path.join('..'))
if module_path not in sys.path:
    sys.path.append(module_path)

In [3]:
import graphlib.algorithms as alg
import graphlib.tools as tls
from graphlib.structures import Graph, Digraph

# Набор данных soc-wiki-Vote
## Загрузка

In [33]:
G = Digraph('soc-wiki-Vote')
with open('soc-wiki-Vote.txt', mode='r') as f:
    for line in f:
        u, v = line.split()
        G.add_edge(u, v)
print(G)

Ориентированный граф <soc-wiki-Vote> с 890 вершинами and 2914 ребрами


## Число компонент сильной и слабой связности и характеристики наибольших

In [34]:
number, largest_index, wcc = alg.weakly_components(G, largest=True)
print(f'Число компонент слабой связности - {number}')

largest_weak = G.subgraph(nodes=wcc[largest_index])
print('Наибольшая компонента слабой связности: ')
print(f'   -Вершин: {largest_weak.nodes_count}\n   -Ребер: {largest_weak.edges_count}')

Число компонент слабой связности - 1
Наибольшая компонента слабой связности: 
   -Вершин: 890
   -Ребер: 2914


In [35]:
scc = list(alg.strongly_components_tarjan(G))
print(f'Число компонент сильной связности - {len(scc)}')

largest_component_nodes = list(max(scc, key=lambda elem: len(elem)))
largest_strong = G.subgraph(nodes=largest_component_nodes)
print('Наибольшая компонента сильной связности: ')
print(f'   -Вершин: {largest_strong.nodes_count}\n   -Ребер: {largest_strong.edges_count}')

Число компонент сильной связности - 890
Наибольшая компонента сильной связности: 
   -Вершин: 1
   -Ребер: 0


## Перевод в простой граф

In [36]:
G = G.to_simple()

number, largest_index, components = alg.DFS_with_cc(G, largest=True)
largest_component = G.subgraph(nodes=components[largest_index])
print(G)

Граф <неориентированный граф, лежащий в основе soc-wiki-Vote> с 890 вершинами and 2914 ребрами


## Диаметр, перцентиль

In [37]:
print(f'Реальный диаметр: {tls.diameter(G)}')

Реальный диаметр: 13


In [38]:
diam, radius, percentile = tls.approximate_statistic(graph=largest_component, number=500, percent=90)
print(f'Диаметр наибольшей компоненты (приближенно): {diam}')
print(f'Радиус наибольшей компоненты (приближенно): {radius}')
print(f'90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): {percentile}')

Диаметр наибольшей компоненты (приближенно): 12
Радиус наибольшей компоненты (приближенно): 7
90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): 6


## Число треугольников, кластерные коэффициенты

In [39]:
n_of_triangles = tls.number_of_triangles(G)
average_cluster_coef = tls.average_clustering_coefficient(G)
global_cluster_coef = tls.global_clustering_coefficient(G)

print(f'Число треугольников (K_3) в графе: {n_of_triangles}')
print(f'Средний кластерный коэффициент сети: {average_cluster_coef}')
print(f'Глобальный кластерный коэффициент сети: {global_cluster_coef}')

Число треугольников (K_3) в графе: 2118
Средний кластерный коэффициент сети: 0.15117887310544095
Глобальный кластерный коэффициент сети: 0.12734998196175892


## Вычисление расстояния между парой вершин

In [32]:
help(alg.BFS_search)

Help on function BFS_search in module graphlib.algorithms.BFS:

BFS_search(graph, start_u, finish_v, length=False)
    Поиск в ширину для нахождения кратчайшего геодезического расстояния между двумя вершинами.
    
    Parameters:
    ----------
        graph : graphlib.structure.Graph
            неориентированный граф
        start_u : any
            стартовая вершина
        finish_v : any
            конечная вершина
        length : bool
            если True, то возвращает геодезического расстояние между вершинами
    
    Returns:
    ----------
        path: list
            путь от start_u до finish_v в виде списка вершин; если пути не обнаружено, то None
    
    Examples:
    ----------
        BFS_search(G, 'A', 'B') = ['A', 'C', 'D', 'B']
    
        BFS_search(G, 'A', 'B', length=True) = 3



In [40]:
# alg.BFS_search(G, start_u=, finish_v=, lenght=True)

# Набор данных email-Eu-core
## Загрузка

In [41]:
G = Digraph('email-Eu-core')
with open('email-Eu-core.txt', mode='r') as f:
    for line in f:
        u, v = line.split()
        G.add_edge(u, v)
print(G)

Ориентированный граф <email-Eu-core> с 1005 вершинами and 25571 ребрами


## Число компонент сильной и слабой связности и характеристики наибольших

In [42]:
number, largest_index, wcc = alg.weakly_components(G, largest=True)
print(f'Число компонент слабой связности - {number}')

largest_weak = G.subgraph(nodes=wcc[largest_index])
print('Наибольшая компонента слабой связности: ')
print(f'   -Вершин: {largest_weak.nodes_count}\n   -Ребер: {largest_weak.edges_count}')

Число компонент слабой связности - 20
Наибольшая компонента слабой связности: 
   -Вершин: 986
   -Ребер: 25552


In [43]:
scc = list(alg.strongly_components_tarjan(G))
print(f'Число компонент сильной связности - {len(scc)}')

largest_component_nodes = list(max(scc, key=lambda elem: len(elem)))
largest_strong = G.subgraph(nodes=largest_component_nodes)
print('Наибольшая компонента сильной связности: ')
print(f'   -Вершин: {largest_strong.nodes_count}\n   -Ребер: {largest_strong.edges_count}')

Число компонент сильной связности - 203
Наибольшая компонента сильной связности: 
   -Вершин: 803
   -Ребер: 24729


## Перевод в простой граф

In [44]:
G = G.to_simple()

number, largest_index, components = alg.DFS_with_cc(G, largest=True)
largest_component = G.subgraph(nodes=components[largest_index])
print(G)

Граф <неориентированный граф, лежащий в основе email-Eu-core> с 1005 вершинами and 16706 ребрами


## Диаметр, перцентиль

In [45]:
print(f'Реальный диаметр: {tls.diameter(G)}')

Реальный диаметр: 7


In [46]:
diam, radius, percentile = tls.approximate_statistic(graph=largest_component, number=500, percent=90)
print(f'Диаметр наибольшей компоненты (приближенно): {diam}')
print(f'Радиус наибольшей компоненты (приближенно): {radius}')
print(f'90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): {percentile}')

Диаметр наибольшей компоненты (приближенно): 7
Радиус наибольшей компоненты (приближенно): 4
90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): 3


## Число треугольников, кластерные коэффициенты

In [47]:
n_of_triangles = tls.number_of_triangles(G)
average_cluster_coef = tls.average_clustering_coefficient(G)
global_cluster_coef = tls.global_clustering_coefficient(G)

print(f'Число треугольников (K_3) в графе: {n_of_triangles}')
print(f'Средний кластерный коэффициент сети: {average_cluster_coef}')
print(f'Глобальный кластерный коэффициент сети: {global_cluster_coef}')

Число треугольников (K_3) в графе: 105461
Средний кластерный коэффициент сети: 0.3993549664221545
Глобальный кластерный коэффициент сети: 0.26739242877040204


## Вычисление расстояния между парой вершин

In [None]:
# alg.BFS_search(G, start_u=, finish_v=, lenght=True)

# Набор данных Middlebury
## Загрузка

In [17]:
G = Graph('Middlebury')
with open('socfb-Middlebury45.txt', mode='r') as f:
    for line in f:
        u, v = line.split()
        G.add_edge(u, v)
print(G)

Граф <Middlebury> с 3076 вершинами and 124610 ребрами


## Число компонент связности и характеристики наибольшей

In [18]:
number, largest_index, components = alg.DFS_with_cc(G, largest=True)
largest_component = G.subgraph(nodes=components[largest_index])

print(f'Количество компонент связности - {number}')
print(f'Наибольшая компонента связности: {largest_component.nodes_count} вершин и {largest_component.edges_count} ребер',)

Количество компонент связности - 4
Наибольшая компонента связности: 3070 вершин и 124607 ребер


## Диаметр, перцентиль

In [19]:
print(f'Реальный диаметр: {tls.diameter(G)}')

Реальный диаметр: 7


In [20]:
diam, radius, percentile = tls.approximate_statistic(graph=largest_component, number=500, percent=90)
print(f'Диаметр наибольшей компоненты (приближенно): {diam}')
print(f'Радиус наибольшей компоненты (приближенно): {radius}')
print(f'90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): {percentile}')

Диаметр наибольшей компоненты (приближенно): 6
Радиус наибольшей компоненты (приближенно): 4
90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): 3


## Число треугольников, кластерные коэффициенты

In [21]:
n_of_triangles = tls.number_of_triangles(G)
average_cluster_coef = tls.average_clustering_coefficient(G)
global_cluster_coef = tls.global_clustering_coefficient(G)

print(f'Число треугольников (K_3) в графе: {n_of_triangles}')
print(f'Средний кластерный коэффициент сети: {average_cluster_coef}')
print(f'Глобальный кластерный коэффициент сети: {global_cluster_coef}')

Число треугольников (K_3) в графе: 1119218
Средний кластерный коэффициент сети: 0.2815364516293035
Глобальный кластерный коэффициент сети: 0.21084112614327008


## Вычисление расстояния между парой вершин

In [None]:
# alg.BFS_search(G, start_u=, finish_v=, lenght=True)

# Набор данных Reed
## Загрузка

In [5]:
G = Graph('Reed')
with open('socfb-Reed98.txt', mode='r') as f:
    for line in f:
        u, v = line.split()
        G.add_edge(u, v)
print(G)

Граф <Reed> с 963 вершинами and 18812 ребрами


## Число компонент связности и характеристики наибольшей

In [6]:
number, largest_index, components = alg.DFS_with_cc(G, largest=True)
largest_component = G.subgraph(nodes=components[largest_index])

print(f'Количество компонент связности - {number}')
print(f'Наибольшая компонента связности: {largest_component.nodes_count} вершин и {largest_component.edges_count} ребер',)

Количество компонент связности - 1
Наибольшая компонента связности: 963 вершин и 18812 ребер


## Диаметр, перцентиль

In [7]:
print(f'Реальный диаметр: {tls.diameter(G)}')

Реальный диаметр: 6


In [8]:
diam, radius, percentile = tls.approximate_statistic(graph=largest_component, number=500, percent=90)
print(f'Диаметр наибольшей компоненты (приближенно): {diam}')
print(f'Радиус наибольшей компоненты (приближенно): {radius}')
print(f'90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): {percentile}')

Диаметр наибольшей компоненты (приближенно): 6
Радиус наибольшей компоненты (приближенно): 4
90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): 3


## Число треугольников, кластерные коэффициенты

In [9]:
n_of_triangles = tls.number_of_triangles(G)
average_cluster_coef = tls.average_clustering_coefficient(G)
global_cluster_coef = tls.global_clustering_coefficient(G)

print(f'Число треугольников (K_3) в графе: {n_of_triangles}')
print(f'Средний кластерный коэффициент сети: {average_cluster_coef}')
print(f'Глобальный кластерный коэффициент сети: {global_cluster_coef}')

Число треугольников (K_3) в графе: 97118
Средний кластерный коэффициент сети: 0.3179711600198445
Глобальный кластерный коэффициент сети: 0.22067090304549689


## Вычисление расстояния между парой вершин

In [11]:
# alg.BFS_search(G, start_u=, finish_v=, lenght=True)

# Набор данных CA-GrQc
## Загрузка

In [12]:
G = Graph('CA-GrQc')
with open('CA-GrQc.txt', mode='r') as f:
    for line in f:
        u, v = line.split()
        G.add_edge(u, v)
print(G)

Граф <CA-GrQc> с 5242 вершинами and 14496 ребрами


## Число компонент связности и характеристики наибольшей

In [13]:
number, largest_index, components = alg.DFS_with_cc(G, largest=True)
largest_component = G.subgraph(nodes=components[largest_index])

print(f'Количество компонент связности - {number}')
print(f'Наибольшая компонента связности: {largest_component.nodes_count} вершин и {largest_component.edges_count} ребер',)

Количество компонент связности - 355
Наибольшая компонента связности: 4158 вершин и 13428 ребер


## Диаметр, перцентиль

In [14]:
print(f'Реальный диаметр: {tls.diameter(G)}')

Реальный диаметр: 17


In [15]:
diam, radius, percentile = tls.approximate_statistic(graph=largest_component, number=500, percent=90)
print(f'Диаметр наибольшей компоненты (приближенно): {diam}')
print(f'Радиус наибольшей компоненты (приближенно): {radius}')
print(f'90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): {percentile}')

Диаметр наибольшей компоненты (приближенно): 16
Радиус наибольшей компоненты (приближенно): 9
90% процентиль геодезического расстояния в наибольшей компоненте (приближенно): 8


## Число треугольников, кластерные коэффициенты

In [16]:
n_of_triangles = tls.number_of_triangles(G)
average_cluster_coef = tls.average_clustering_coefficient(G)
global_cluster_coef = tls.global_clustering_coefficient(G)

print(f'Число треугольников (K_3) в графе: {n_of_triangles}')
print(f'Средний кластерный коэффициент сети: {average_cluster_coef}')
print(f'Глобальный кластерный коэффициент сети: {global_cluster_coef}')

Число треугольников (K_3) в графе: 48260
Средний кластерный коэффициент сети: 0.529635811052136
Глобальный кластерный коэффициент сети: 0.6298424741263426


## Вычисление расстояния между парой вершин

In [None]:
# alg.BFS_search(G, start_u=, finish_v=, lenght=True)