# Task with graphs

## Helping function and imports

This module allows you to generate graphs for further testing of algorithms. It was set at the beginning of work.

In [31]:
from itertools import combinations, groupby
import random
import networkx as nx
import matplotlib.pyplot as plt


# You can use this function to generate a random graph with 'num_of_nodes' nodes
# and 'completeness' probability of an edge between any two nodes
# If 'directed' is True, the graph will be directed
# If 'draw' is True, the graph will be drawn
def gnp_random_connected_graph(num_of_nodes: int,
                               completeness: int,
                               directed: bool = False,
                               draw: bool = False):
    """
    Generates a random graph, similarly to an Erdős-Rényi
    graph, but enforcing that the resulting graph is conneted (in case of undirected graphs)
    """

    if directed:
        G = nx.DiGraph()
    else:
        G = nx.Graph()
    edges = combinations(range(num_of_nodes), 2)
    G.add_nodes_from(range(num_of_nodes))

    for _, node_edges in groupby(edges, key=lambda x: x[0]):
        node_edges = list(node_edges)
        random_edge = random.choice(node_edges)
        if random.random() < 0.5:
            random_edge = random_edge[::-1]
        G.add_edge(*random_edge)
        for e in node_edges:
            if random.random() < completeness:
                G.add_edge(*e)

    for (u, v, w) in G.edges(data=True):
        w['weight'] = random.randint(0, 20)

    if draw:
        plt.figure(figsize=(10, 6))
        if directed:
            # draw with edge weights
            pos = nx.arf_layout(G)
            nx.draw(G, pos, node_color='lightblue',
                    with_labels=True,
                    node_size=500,
                    arrowsize=20,
                    arrows=True)
            labels = nx.get_edge_attributes(G, 'weight')
            nx.draw_networkx_edge_labels(G, pos, edge_labels=labels)

        else:
            nx.draw(G, node_color='lightblue',
                    with_labels=True,
                    node_size=500)

    return G

## Task 1.1.1. Prim algorithm

Модулі prim.py, kruskal.py містять по одній функції: prim_algo(), kruskal_algo() - відповідно. 
Ці функції дозволяють реалізувати роботу своїх алгоритмів, для знаходження від відстані від вказаної вершини, до решти вершин у графі, у якому кожне ребро має вагу.
На вхід, та на вихід у цих функціях подається граф у форматі nx.Graph, який генерує модуль generate_graph.py.

prim_algo() - функція, яка реалізовує роботу алгоритму Прима: створюються новий граф (у який буде записано результат), та змінна для збереження відвіданих вершин. Проходимось по графу, поки в heapq є ребра або поки ми не отримаємо всі вершини . При кожній ітерації, В дереві беремо найменшої ваги ребро. Якщо вершина вже в дереві, тоді пропускаємо ітерацію. Псля чого додаємо всі ребра від вершини до N до heapq.
(Процес описано в коментарях до кожного коду)

In [32]:
from heapq import heappush, heappop

def prim_algo(graph: nx.Graph, start=0):
    """This function applies Prim's algorithm to the given graph.

    Args:
        graph (nx.Graph): original graph
        start (int, optional): node where to start. Defaults to 0.

    Returns:
        nx.Graph: minimum spanning edges
    """
    visited = {start}
    tree = nx.Graph()

    # heapq -- data structure that always looks like SORTED list
    # and the first item is always the least
    heapq = []

    # initialize. add data to heapq
    for node, weight in graph.adj[start].items():
        weight = weight['weight']
        heappush(heapq, (weight, start, node))

    # while there's edges in heapq or not all nodes are in tree
    while heapq and len(visited) != graph.number_of_nodes():
        # get least edge
        weight, node1, node2 = heappop(heapq)

        # this node is already in tree
        if node2 in visited:
            continue

        tree.add_edge(node1, node2, weight=weight)
        visited.add(node2)

        # add all edges from node to N to heapq
        for node, weight in graph.adj[node2].items():
            if node in visited:
                continue

            weight = weight['weight']
            heappush(heapq, (weight, start, node))
        
    return tree

## Task 1.1.2. Kruskal algorithm

kruskal_algo() - функція модуля kruskal.py створена для реалізації алгоритму Крускала.
nx.Graph на вхід. Перетворюємо граф у зручний вигляд та сортуємо за вагою. Ітеруємось по сортованому графу, починаючи з найменшої ваги. Знайти в яких деревах перший і другий вузли.  Перевіряємо, чи вони на тих самих циклах. Якщо так, тоді пропускаємо ітерацію, щоб не утворювати цикл. Якщо ж ні, тоді добавляємо до результату та оновлюємо данні.

In [33]:
def kruskal_algo(graph: nx.Graph) -> nx.Graph:
    """make minimum spanning edges by Kruskal's algorithm

    Args:
        graph (nx.Graph): original graph

    Returns:
        nx.Graph: minimum spanning edges
    """
    trees = [set([i]) for i in graph.nodes()]

    # graph represented in (v1, v2, {'weight': w}) and sorted by weight
    graph = sorted(graph.edges(data=True), key=lambda x: x[2]['weight'])

    result = nx.Graph()

    while graph and len(trees) > 1:
        node1, node2, weight = graph.pop(0)
        weight = weight['weight']

        first_tree, second_tree = None, None

        # find in which trees the first and second nodes are
        for tree in trees:
            if node1 in tree:
                first_tree = tree

            if node2 in tree:
                second_tree = tree

            # found 1 and 2 trees
            if first_tree and second_tree:
                break

        # they are in the same trees,
        # so they would do a cycle if we connect them
        if first_tree == second_tree:
            continue

        # add to result
        result.add_edge(node1, node2, weight=weight)

        # extend first tree with the second by reference
        # (it will change anywhere)
        # and delete second tree
        first_tree.update(second_tree)
        del trees[trees.index(second_tree)]

    return result


## Comparison
Як ми можемо бачити з порівняння, яке наведено нижче, у якому було взято графи різних розмірів, та з різними параметрами, то алгоритм Прима працює дещо швидше, за алгоритм Крускала.
Також, алгоритми прописані нами працюють швидше вбудованих.

Також варто зазначити, що деколи значення різняться, оскільки потрапляють різні графи, на які йде дещо різна кількість часу. Зокрема, йдеться про графи із циклами відємної ваги.

In [34]:
from time import time
from networkx.algorithms import tree


for size in [5, 10, 20, 50, 100, 500]:
    graph = gnp_random_connected_graph(size, 0.8)

    start = time()
    prim_algo(graph)
    print(f"Own Prim algorithm with {size} nodes: {time() - start}s")

    start = time()
    tree.minimum_spanning_edges(graph, algorithm='prim')
    print(f"Networkx Prim algorithm with {size} nodes: {time() - start}s")
    print()
    
    start = time()
    kruskal_algo(graph)
    print(f"Own Kruskal algorithm with {size} nodes: {time() - start}s")

    start = time()
    tree.minimum_spanning_edges(graph, algorithm='kruskal')
    print(f"Networkx Kruskal algorithm with {size} nodes: {time() - start}s")
    print()

Own Prim algorithm with 5 nodes: 2.8848648071289062e-05s
Networkx Prim algorithm with 5 nodes: 5.9604644775390625e-06s

Own Kruskal algorithm with 5 nodes: 2.9802322387695312e-05s
Networkx Kruskal algorithm with 5 nodes: 2.1457672119140625e-06s

Own Prim algorithm with 10 nodes: 2.9087066650390625e-05s
Networkx Prim algorithm with 10 nodes: 9.5367431640625e-07s

Own Kruskal algorithm with 10 nodes: 3.600120544433594e-05s
Networkx Kruskal algorithm with 10 nodes: 7.152557373046875e-07s

Own Prim algorithm with 20 nodes: 0.00015687942504882812s
Networkx Prim algorithm with 20 nodes: 7.152557373046875e-07s

Own Kruskal algorithm with 20 nodes: 0.00010609626770019531s
Networkx Kruskal algorithm with 20 nodes: 1.1920928955078125e-06s

Own Prim algorithm with 50 nodes: 0.00041484832763671875s
Networkx Prim algorithm with 50 nodes: 1.9073486328125e-06s

Own Kruskal algorithm with 50 nodes: 0.0004951953887939453s
Networkx Kruskal algorithm with 50 nodes: 2.1457672119140625e-06s

Own Prim algor

## Task 1.2.1. Bellman-Ford

bellman_ford_algo() - функція модуля bellman_Ford.py, створена для реалізації алгоритму Белмана-Форда, для знаходження відстані між будь-якими двома вершинами у графі.

Як вхідні данні задається згенерований граф, та стартова вершина(за бажанням).
Спочатку, ініціалізувується довжину та встановлюється початок - 0. Потім створюється шлях. Після чого заходимо у цикл, у якому проходимо ітерацій скільки, скільки є вершин у графі - 1 (n-1). При кожні й ітерації, для кожного ребра порівнюємо поточний шлях і шлях до вершини + шлях від node1 до node2, якщо він більший за запропонований, тоді оновлюємо данні. В кінці робимо n-ну перевіру для того, щоб визначити наявність циклу з відємною вагою (якщо при ітерації данні змінилися, тоді він там наявний).

In [35]:
from math import inf

def bellman_ford_algo(
        graph: nx.Graph,
        start_vertex=0
    ) -> tuple[dict[int, list[int]], dict[int, int]]:
    """Bellman-Ford algorithm. Find the shortest way from selected node to
    every else

    Args:
        graph (nx.Graph): original graph
        start_vertex (int, optional): selected node. Defaults to 0.

    Returns:
        tuple[dict[int, list[int]], dict[int, int]]: 1st dict is the shortest 
            path to current node. 2nd element is lengths of shortest paths
    """
    nodes = graph.nodes
    edges = graph.edges(data=True)

    # initialize lengths and set start to 0
    lengths = {vertex: inf for vertex in nodes}
    lengths[start_vertex] = 0

    # initialize path
    path = {vertex: [] for vertex in nodes}
    path[start_vertex] = [start_vertex]

    # do n - 1 iterations
    for _ in range(len(nodes) - 1):
        # for every edge
        for node1, node2, weight in edges:
            weight = weight['weight']

            # compare current path and path to node1 + path from node1 to node2
            if lengths[node2] > (new_length := lengths[node1] + weight):
                lengths[node2] = new_length
                path[node2] = path[node1] + [node2]

    # control iteration. If smth changes -- there's negative cycle
    for node1, node2, weight in edges:
        weight = weight['weight']

        if lengths[node2] > lengths[node1] + weight:
            return None # because graph have negative cycle

    return path, lengths

## Bellman-Ford comparison

Наш алгоритм працює дещо повільніше за вбудований, особливо це видно на більшій кількості вершин.

Також варто зазначити, як у випадку з порівнянням Прима та Крускала, деколи значення різняться, оскільки потрапляють різні графи, на які йде дещо різна кількість часу. Зокрема, йдеться про графи із циклами відємної ваги.

In [36]:
for size in [5, 10, 20, 50, 100, 500]:
    graph = gnp_random_connected_graph(size, 0.8, True)

    start = time()
    bellman_ford_algo(graph)
    print(f"Own Bellman-Ford algorithm with {size} nodes: {time() - start}s")

    start = time()
    nx.single_source_bellman_ford(graph, 0)
    print(f"Networkx Bellman-Ford algorithm with {size} nodes: {time() - start}s")

    print()

Own Bellman-Ford algorithm with 5 nodes: 2.09808349609375e-05s
Networkx Bellman-Ford algorithm with 5 nodes: 2.574920654296875e-05s

Own Bellman-Ford algorithm with 10 nodes: 5.7697296142578125e-05s
Networkx Bellman-Ford algorithm with 10 nodes: 2.8848648071289062e-05s

Own Bellman-Ford algorithm with 20 nodes: 0.0003998279571533203s
Networkx Bellman-Ford algorithm with 20 nodes: 6.008148193359375e-05s

Own Bellman-Ford algorithm with 50 nodes: 0.00617218017578125s
Networkx Bellman-Ford algorithm with 50 nodes: 0.00027179718017578125s

Own Bellman-Ford algorithm with 100 nodes: 0.04587268829345703s
Networkx Bellman-Ford algorithm with 100 nodes: 0.000827789306640625s

Own Bellman-Ford algorithm with 500 nodes: 6.700303316116333s
Networkx Bellman-Ford algorithm with 500 nodes: 0.014615774154663086s



## Task 1.2.2. Floyd-Warshall

floyd_warshall() - функція модуля floyd_warshall.py, створена для реалізації алгоритму Флойда-Воршала, для знаходження відстані між будь-якими двома вершинами у графі.

Створюємо матрицю суміжності, та заповнюємо її комірки нескінечністями. Встановлюємо всі значення, та присвоюємо діагоналі значення 0-ів. 

Далі йде робота з матрицями: циклом проходимось по параметрах діагоналі матриці(k), фіксуємо рядок і стовбець які перетинаються на k-тому елементі, та для кожного з вибраних рядків перевіряємо порівнюємо значення яке вже знаходиться у комірці не фіксованої матриці, та значення утворене при додавання елементів з фіксованого рядка та стовбця, піля чого записуємо у комірку мінімальне з них. 

Після чого перевіряємо чи не змінилася діагогналь, якщо так, тоді у графі є цикл відємної ваги, й повертаємо повідомлення про це.

In [37]:
from math import inf

def floyd_warshall(graph: nx.Graph) -> list[list[int | float]] | None:
    """Floyd-Warshall algorithm

    Args:
        graph (nx.Graph): original graph

    Returns:
        list[list[int | float]] | None: distances
    """
    # create adjacency matrix
    nodes_count = len(graph.nodes)
    # init matrix with default value inf
    matrix = [[inf] * nodes_count for _ in range(nodes_count)]

    # set all values
    for edge in graph.edges(data=True):
        matrix[edge[0]][edge[1]] = edge[2]['weight']

    nodes_range = range(nodes_count)

    # set main diagonal to 0
    for i in nodes_range:
        matrix[i][i] = 0

    for k in nodes_range:
        for i in nodes_range:
            for j in nodes_range:
                matrix[i][j] = min(matrix[i][k] + matrix[k][j], matrix[i][j])

            if matrix[i][i] < 0:
                print("Negative cycle detected")
                return None

    return matrix


## Floyd-Warshall comparison

Наш алгоритм Флойда-Воршала працює 'чуть' повільніше за вбудований алгоритм.

Також варто зазначити, як і у попередніх випадках, що деколи результати різняться, оскільки потрапляють різні графи, на які йде дещо різна кількість часу. Зокрема, йдеться про графи із циклами відємної ваги.

In [38]:
for size in [5, 10, 20, 50, 100]:
    graph = gnp_random_connected_graph(size, 0.8, True)

    start = time()
    floyd_warshall(graph)
    print(f"Own Floyd-Warshall algorithm with {size} nodes: {time() - start}s")

    start = time()
    nx.floyd_warshall(graph)
    print(f"Networkx Floyd-Warshall algorithm with {size} nodes: {time() - start}s")

    print()

Own Floyd-Warshall algorithm with 5 nodes: 2.9087066650390625e-05s
Networkx Floyd-Warshall algorithm with 5 nodes: 3.2901763916015625e-05s

Own Floyd-Warshall algorithm with 10 nodes: 0.0001239776611328125s
Networkx Floyd-Warshall algorithm with 10 nodes: 0.00010704994201660156s

Own Floyd-Warshall algorithm with 20 nodes: 0.000881195068359375s
Networkx Floyd-Warshall algorithm with 20 nodes: 0.0006251335144042969s

Own Floyd-Warshall algorithm with 50 nodes: 0.013442039489746094s
Networkx Floyd-Warshall algorithm with 50 nodes: 0.008614301681518555s

Own Floyd-Warshall algorithm with 100 nodes: 0.10468912124633789s
Networkx Floyd-Warshall algorithm with 100 nodes: 0.05923199653625488s

