# TP 10 - Parcours et arbres couvrants

In [None]:
!pip install networkx[default] numpy matplotlib scipy
import random
import networkx as nx
from collections import deque
import matplotlib.pyplot as plt

Commencez par créer un graphe **connexe** aléatoire `G`, de type $G_{n,m}$, avec 10 sommets et 15 arêtes = n

In [None]:
def get_random_connected_graph(n, m):
    """
    Cette fonction génère un graphe aléatoire de type G(n,m) et s'assure qu'il soit connexe.

    :param n: Nombre de sommets
    :param m: Nombre d'arêtes
    :return: Un graphe aléatoire de type G(n,m) connexe
    """
    graph = nx.gnm_random_graph(n, m)
    while not nx.is_connected(graph):
        graph = nx.gnm_random_graph(n, m)
    return graph


G = get_random_connected_graph(10, 15)
nx.draw(G, with_labels=True)

## Exercice 1 : Parcours en largeur (BFS)
Ecrivez une fonction `BFSTraversal` qui prend en paramètre un graphe `G` et un sommet de départ `s`, et qui renvoie, sous forme d'une liste, l'ordre de parcours en largeur des sommets du graphe `G` (les voisins sont pris dans l'ordre croissant de leur numéro).

In [None]:
def BFSTraversal_nx(graph, s):
    """
    Cette fonction effectue un parcours en largeur (BFS) à partir d'un sommet donné dans un graphe donné.
    Elle utilise la fonction `bfs_edges` de Networkx pour obtenir la liste des arêtes parcourues.
    Elle sert ainsi de correction pour la version custom.

    :param graph: Le graphe dans lequel effectuer le parcours
    :param s: Le sommet de départ du parcours
    :return: Une liste contenant l'ordre de parcours des sommets visités.
    """
    lt = nx.bfs_edges(graph, source=s)
    traversal_order = [s]
    for edge in lt:
        traversal_order.append(edge[1])
    return traversal_order


def BFSTraversal(graph, s):
    """
    Cette fonction effectue un parcours en largeur (BFS) à partir d'un sommet donné dans un graphe donné.
    La fonction utilise une file pour gérer les sommets à explorer et un ensemble pour marquer les sommets visités.

    :param graph: Le graphe dans lequel effectuer le parcours
    :param s: Le sommet de départ du parcours
    :return: Une liste contenant l'ordre de parcours des sommets visités.
    """
    visited = {s}  # Ensemble pour marquer les sommets visités
    queue = deque([s])  # File pour gérer les sommets à explorer

    traversal_order = []  # Liste pour stocker l'ordre de parcours

    while queue:  # Tant que la file n'est pas vide
        vertex = queue.popleft()  # On récupère et retire le premier sommet de la file
        traversal_order.append(vertex)  # On ajoute le sommet à l'ordre de parcours

        for neighbor in graph[vertex]:  # On parcourt les voisins dans l'ordre d'itération
            if neighbor not in visited:  # Si le voisin n'a pas encore été visité
                visited.add(neighbor)  # On le marque comme visité
                queue.append(neighbor)  # On ajoute le voisin à la file

    return traversal_order

Testez votre fonction sur le graphe `G` créé au début du TP

In [None]:
print("NX : " + str(BFSTraversal_nx(G, 0)))
print("Me : " + str(BFSTraversal(G, 0)))

## Exercice 2 : Parcours en profondeur (DFS)
Adaptez la fonction `BFSTraversal` pour obtenir la fonction `DFSTraversal`, qui prend en paramètre un graphe `G` et un sommet de départ `s`, et qui renvoie, sous forme d'une liste, l'ordre de parcours en profondeur des sommets du graphe `G` (les voisins sont pris dans l'ordre croissant de leur numéro).

### Version 1 : itérative

In [None]:
def DFSTraversal_nx(graph, s):
    """
    Cette fonction effectue un parcours en profondeur (DFS) à partir d'un sommet donné dans un graphe donné.
    Elle utilise la fonction `dfs_edges` de Networkx pour obtenir la liste des arêtes parcourues.
    Elle sert ainsi de correction pour la version custom.

    :param graph: Le graphe dans lequel effectuer le parcours (networkx.Graph)
    :param s: Le sommet de départ du parcours (int)
    :return: Une liste contenant l'ordre de parcours des sommets visités (List[int]).
    """
    lt = nx.dfs_edges(graph, source=s)
    traversal_order = [s]
    for edge in lt:
        traversal_order.append(edge[1])
    return traversal_order


def DFSTraversal(graph, s):
    """
    Cette fonction effectue un parcours en profondeur (DFS) à partir d'un sommet donné dans un graphe donné.
    Elle utilise une pile pour gérer les sommets à visiter.

    :param graph: Le graphe dans lequel effectuer le parcours (networkx.Graph)
    :param s: Le sommet de départ du parcours (int)
    :return: Une liste contenant l'ordre de parcours des sommets visités (List[int]).
    """

    visited = []
    stack = [s]

    # Tant que la pile n'est pas vide, on continue le parcours
    while stack:
        node = stack.pop()  # On récupère et retire le sommet du dessus de la pile
        if node not in visited:
            visited.append(node)  # On marque le sommet comme visité
            # On ajoute les voisins du sommet actuel à la pile
            for neighbor in reversed(list(graph.neighbors(node))):
                stack.append(neighbor)

    return visited

Testez votre fonction sur le graphe `G` créé au début du TP

In [None]:
print("NX : " + str(DFSTraversal_nx(G, 0)))
print("Me : " + str(DFSTraversal(G, 0)))

### Version 2 : récursive
Modifiez la fonction précédente pour transformer `DFSTraversal` en une fonction **récursive** `DFSTraversalRec`. Quels paramètres doivent être ajoutés ?

In [None]:
def DFSTraversal_rec(graph, s):
    """
    Cette fonction effectue un parcours en profondeur (DFS) à partir d'un sommet donné dans un graphe donné.
    Elle utilise une approche récursive pour visiter tous les sommets accessibles à partir du sommet de départ.

    :param graph: Le graphe dans lequel effectuer le parcours (networkx.Graph)
    :param s: Le sommet de départ du parcours (int)
    :return: Une liste contenant l'ordre de parcours des sommets visités (List[int]).
    """

    def dfs_recursive(rec_graph, node, rec_visited):
        """
        Fonction récursive pour effectuer le parcours DFS.
        Cette fonction visite récursivement les voisins d'un sommet donné qui n'ont pas encore été visités.

        :param rec_graph: Le graphe dans lequel effectuer le parcours (networkx.Graph)
        :param node: Le sommet actuel à visiter (int)
        :param rec_visited: La liste des sommets déjà visités (List[int])
        """
        rec_visited.append(node)
        for neighbor in rec_graph.neighbors(node):
            if neighbor not in visited:
                dfs_recursive(rec_graph, neighbor, rec_visited)

    visited = []
    dfs_recursive(graph, s, visited)
    return visited

Testez votre fonction sur le graphe `G` créé au début du TP

In [None]:
print("NX : " + str(DFSTraversal_nx(G, 0)))
print("Me : " + str(DFSTraversal_rec(G, 0)))

## Exercice 3 : Connexité
**Question 1** : Donnez un moyen simple de générer un graphe **non connexe**, et mettez-la en oeuvre avec Networkx pour créer un graphe `H`.

**Réponse** :

In [None]:
def get_random_none_connected_graph(n, m):
    """
    Génère un graphe aléatoire non connexe de n sommets et m arêtes.

    :param n: nombre de sommets
    :param m: nombre d'arêtes
    :return: un graphe non connexe
    """
    graph = nx.gnm_random_graph(n, m)
    while nx.is_connected(graph):
        graph = nx.gnm_random_graph(n, m)
    return graph


H = get_random_none_connected_graph(10, 10)
nx.draw(H, with_labels=True)

**Question 2** : Appliquez la fonction `DFSTraversal` au graphe `H`. Que constatez-vous ?

In [None]:
print(" H NODES : " + str(len(H.nodes)) + "\t" + str(H.nodes))
print("      NX : " + str(len(DFSTraversal_nx(H, 0))) + "\t" + str(DFSTraversal_nx(H, 0)))
print("      Me : " + str(len(DFSTraversal(H, 0))) + "\t" + str(DFSTraversal(H, 0)))

**Réponse** :

En appliquant la fonction `DFSTraversal` au graphe non connexe H, nous constatons que le parcours en profondeur ne visite pas tous les sommets du graphe. Cela est dû au fait que le graphe est non connexe, c'est-à-dire qu'il existe au moins un sommet qui n'est pas atteignable à partir d'un autre sommet. Par conséquent, on ne peut donc pas traverser les composantes non connectées du graphe.

**Question 3** : Utilisez la fonction `DFSTraversal` pour écrire une fonction `isConnected(G)` qui renvoie `True` si `G` est connexe, et `False` sinon. Testez-la sur les graphes `G` et `H`.

In [None]:
def isConnected(graph):
    """
    Cette fonction renvoie True si le graphe G est connexe, et False sinon.

    :param graph: Le graphe à tester (networkx.Graph)
    :return: True si le graphe G est connexe, et False sinon (bool)
    """
    return len(DFSTraversal_nx(graph, list(graph.nodes)[0])) == len(graph.nodes)


print("G IS CONNECTED :\nMe: " + str(isConnected(G)) + "\t\tNX: " + str(nx.is_connected(G)))
print("H IS CONNECTED :\nMe: " + str(isConnected(H)) + "\t\tNX: " + str(nx.is_connected(H)))

**Question 4** : Utilisez la fonction `DFSTraversal` pour écrire une fonction `connectedComponents` qui renvoie la liste de *toutes* les composantes connexes d'un graphe. *Réfléchissez bien à la complexité algorithmique de la solution mise en oeuvre*.

In [None]:
def connectedComponents(graph):
    """
    Cette fonction renvoie la liste de toutes les composantes connexes d'un graphe en utilisant la fonction DFSTraversal.

    :param graph: Le graphe dans lequel trouver les composantes connexes (networkx.Graph)
    :return: Une liste de listes contenant les sommets de chaque composante connexe (List[List[int]]).
    """
    components = []
    visited = set()

    for node in graph.nodes():
        if node not in visited:
            traversal_order = DFSTraversal_nx(graph, node)
            components.append(sorted(traversal_order))
            visited.update(traversal_order)

    return components


print("G CONNECTED COMPONENTS :")
print("NX : " + str(list(nx.connected_components(H))))
print("Me : " + str(connectedComponents(H)))

**Réponse** :
Comme chaque sommet et chaque arête sont visités une fois, le parcours en profondeur a une complexité de O(V+E), où V est le nombre de sommets et E le nombre d'arêtes.

**Question 5** : Utilisez la fonction `connectedComponents` pour écrire une deuxième version de la fonction `isConnected(G)`. Laquelle des deux fonctions est à privilégier et pourquoi ?

In [None]:
def isConnected_v2(graph):
    """
    Cette fonction renvoie True si le graphe G est connexe, et False sinon.
    Elle utilise la fonction connectedComponents pour déterminer si le graphe est connexe.

    :param graph: Le graphe à tester (networkx.Graph)
    :return: True si le graphe G est connexe, et False sinon (bool)
    """
    components = connectedComponents(graph)
    return len(components) == 1


print("G IS CONNECTED :\nMe : " + str(isConnected_v2(G)) + "\t\tNX : " + str(nx.is_connected(G)))
print("H IS CONNECTED :\nMe : " + str(isConnected_v2(H)) + "\t\tNX : " + str(nx.is_connected(H)))

**Réponse** :

La fonction isConnected_v2 est à privilégier. En effet, elle utilise la fonction connectedComponents qui calcule la liste de toutes les composantes connexes d'un graphe en utilisant la fonction DFSTraversal. Elle utilise donc une méthode plus générale et plus fiable que la fonction isConnected qui utilise la fonction DFSTraversal pour ne tester que la connectivité du premier sommet de la liste des sommets du graphe, soit un sommet arbitraire. La fonction isConnected_v2 parcourt l'ensemble du graphe pour vérifier qu'il n'y a qu'une seule composante connexe. Ainsi, la fonction isConnected_v2 est plus générale, plus robuste et donne des résultats plus fiables que la fonction isConnected.

En termes de complexité algorithmique, les deux fonctions ont une complexité en temps de O(V+E), où V est le nombre de sommets et E le nombre d'arêtes du graphe. Cela est dû à l'utilisation de la fonction DFSTraversal qui a une complexité en temps de O(V+E) pour un graphe non-pondéré.

Cependant, la fonction isConnected_v2 a une complexité en espace légèrement plus élevée, car elle utilise la fonction connectedComponents qui stocke toutes les composantes connexes du graphe dans une liste de listes.

En termes de performance, cela dépend de la structure du graphe et de la manière dont les composantes connexes sont reliées. Si le graphe est fortement connecté, les deux fonctions devraient avoir des performances similaires. Cependant, si le graphe est faiblement connecté, la fonction isConnected peut être plus rapide car elle ne parcourt qu'un seul sommet, alors que la fonction connectedComponents peut être plus lente car elle doit parcourir tous les sommets pour déterminer toutes les composantes connexes.

## Question 4 : Algorithme de Kruskal
**Question 1** : Utilisez les fonctions existantes de NetworkX pour transformer `G` en un graphe **pondéré**, où chaque arête a un poids aléatoire compris entre `0` et `10`.

In [None]:
def graph_to_weighted(graph):
    """
    Cette fonction transforme un graphe non-pondéré en un graphe pondéré, où chaque arête a un poids aléatoire compris entre 0 et 10.

    :param graph: Le graphe à transformer (networkx.Graph)
    :return: Le graphe pondéré (networkx.Graph)
    """
    weighted_graph = nx.Graph()
    weighted_graph.add_nodes_from(graph.nodes)

    for u, v in graph.edges():
        # attribue le poids à l'arête (u, v)
        weighted_graph.add_edge(u, v, weight=random.randint(0, 10))

    return weighted_graph

W = graph_to_weighted(G)

pos = nx.spring_layout(G)
nx.draw(G, pos, with_labels=True)
# ajoute les poids des arêtes comme étiquettes
edge_labels = nx.get_edge_attributes(G, 'weight')
nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels)
plt.show()

**Question 2** : Implémentez l'algorithme de Kruskal dans une fonction `Kruskal(G)`. Cette fonction doit renvoyer la *liste des arêtes* constituant un arbre couvrant de poids minimum.

💡 Utilisez la fonction `is_forest` de Networkx pour détecter les cycles. 

In [None]:
def Kruskal(graph):
    """
    Cette fonction renvoie la liste des arêtes constituant un arbre couvrant de poids minimum en utilisant l'algorithme de Kruskal et la fonction is_forest de NetworkX pour détecter les cycles.

    :param graph: Le graphe pondéré (networkx.Graph)
    :return: La liste des arêtes constituant un arbre couvrant de poids minimum (list)
    """
    # Trier les arêtes du graphe par poids croissant
    sorted_edges = sorted(graph.edges(data=True), key=lambda x: x[2]['weight'])
    mst_edges = []

    for edge in sorted_edges:

        # Ajouter temporairement l'arête à l'arbre couvrant de poids minimum
        mst_edges.append(edge)

        # Créer un graphe temporaire avec les arêtes de l'arbre couvrant de poids minimum
        temp_graph = nx.Graph(mst_edges)

        # Vérifier si l'ajout de cette arête crée un cycle
        if not nx.is_forest(temp_graph):
            # Si l'ajout crée un cycle, retirer l'arête de l'ensemble
            mst_edges.remove(edge)

    return mst_edges


print("KRUSKAL :")
print("NX : " + str(sorted(nx.minimum_spanning_edges(W))))
print("\nMe : " + str(sorted(Kruskal(W))))

Testez votre fonction sur le graphe pondéré `G`, en affichant l'arbre couvrant obtenu (vous pouvez affichez seulement l'arbre, ou surligner les arêtes sur le graphe `G`).

In [None]:
mst_edges = Kruskal(W)
layout = nx.circular_layout(W)

# Dessine les arêtes du graphe original en gris
nx.draw_networkx_edges(W, layout, edge_color='gray')
# Dessine les arêtes de l'arbre couvrant en rouge
nx.draw_networkx_edges(W, layout, edgelist=mst_edges, edge_color='red')
# Dessine les nœuds
nx.draw_networkx_nodes(W, layout)
# Dessine les étiquettes des nœuds
nx.draw_networkx_labels(W, layout)

plt.axis('off')
plt.show()

## Exercice 5 : Algorithme de Prim
**Question 1** : implémentez l'algorithme de Prim, et testez-le sur le graphe pondéré `G`.

In [None]:
def Prim(graph):
    # Sélectionne un nœud arbitraire pour commencer l'arbre couvrant minimal
    start_node = list(graph.nodes())[0]
    mst_nodes = {start_node}
    mst_edges = []
    # Répète jusqu'à ce que tous les noeuds soient inclus
    while len(mst_nodes) < len(graph.nodes()):
        # Crée un ensemble pour stocker les arêtes candidates qui connectent un nœud à un nœud en dehors de l'arbre
        candidate_edges = set()
        for node in mst_nodes:
            for neighbor in graph.neighbors(node):
                if neighbor not in mst_nodes:
                    candidate_edges.add((node, neighbor, graph[node][neighbor]['weight']))
        # Sélectionne l'arête avec le poids le plus faible parmi les arêtes candidates
        min_edge = min(candidate_edges, key=lambda edge: edge[2])
        mst_nodes.add(min_edge[1])
        mst_edges.append((min_edge[0], min_edge[1]))
    return mst_edges


print("PRIM :")
print("NX : " + str(sorted(nx.minimum_spanning_edges(W, algorithm='prim', data=False))))
print("Me : " + str(sorted(Prim(W))))

## Exercice 6: détection de cycle dans un graphe
**Question 1** : Comment peut-on détecter les cycles dans un graphe à l'aide d'un parcours en profondeur ? Ecrivez la fonction `hasCycle(G)`.

In [None]:
def hasCycle_nx(graph):
    """
    Détecte la présence de cycles dans un graphe à l'aide de la fonction NetworkX `find_cycle`.
    Cette fonction est utilisée pour vérifier la fonction `hasCycle`.

    :param graph: Le graphe à explorer
    :return: True si un cycle est détecté, sinon False
    """
    try:
        nx.find_cycle(graph)
        return True
    except nx.NetworkXNoCycle:
        return False


def hasCycle(graph):
    """
    Détecte la présence de cycles dans un graphe en utilisant la recherche en profondeur (DFS).

    :param graph: Le graphe à explorer
    :return: True si un cycle est détecté, sinon False
    """

    def check_cycle(graph_hc, node_hc, visited_hc, parent):
        """
        Fonction récursive pour vérifier la présence de cycles en utilisant DFS.

        :param graph_hc: Le graphe à explorer
        :param node_hc: le nœud actuel à explorer
        :param visited_hc: un dictionnaire qui stocke l'état de visite des nœuds
        :param parent: le nœud parent du nœud actuel
        :return: True si un cycle est détecté, sinon False
        """
        # Marque le nœud actuel comme visité
        visited[node_hc] = True

        # Parcoure les voisins du nœud actuel
        for neighbor in graph_hc[node_hc]:
            # Si le voisin n'a pas encore été visité
            if not visited_hc[neighbor]:
                # Appel récursif pour explorer le voisin
                if check_cycle(graph_hc, neighbor, visited_hc, node_hc):
                    # Si on détecte un cycle, on retourne True
                    return True
            # Si le voisin a déjà été visité et qu'il n'est pas le parent du nœud actuel, il y a un cycle
            elif parent != neighbor:
                return True
        return False

    # dictionnaire d'état de visite des nœuds
    visited = {node: False for node in graph}

    for node in graph:
        if not visited[node]:
            # vérifie s'il y a un cycle
            if check_cycle(graph, node, visited, None):
                return True

    return False

Testez la fonction `hasCycle` sur le graphe `G` et sur un arbre aléatoire `T`:

In [None]:

# Test avec le graphe G
print("Graph G has cycle : \nMe : ", hasCycle(G), "\nNX : ", hasCycle_nx(G))

# Test avec un arbre aléatoire T
T = nx.random_tree(10)
print("\nGraph T has cycle : \nMe : ", hasCycle(T), "\nNX : ", hasCycle_nx(T))

**Question 2** : Ecrivez une fonction `isTree(G)` qui renvoie `True` si et seulement si `G` est un arbre.

In [None]:
def isTree(G):
    """
    Vérifie si un graphe non orienté est un arbre.
    Pour être un arbre, le graphe doit être connexe et ne pas contenir de cycles.

    :param G: un graphe non orienté représenté par un objet networkx.Graph
    :return: True si G est un arbre, sinon False
    """

    # Vérifier si le graphe est connexe
    if not isConnected(G) and not isConnected_v2(G):
        return False

    # Vérifier si le graphe ne contient pas de cycles
    if hasCycle(G):
        return False

    return True


def isTree_nx(graph):
    """
    Vérifie si un graphe non orienté est un arbre.
    Cette fonction est utilisée pour vérifier la fonction `isTree`.

    :param graph: un graphe non orienté représenté par un objet networkx.Graph
    :return: True si G est un arbre, sinon False
    """
    if not nx.is_connected(graph):
        return False

    if hasCycle_nx(graph):
        return False

    return True

In [None]:
print("Graph G is tree : \nMe : ", isTree(G), "\nNX : ", isTree_nx(G), nx.is_tree(G))
print("\nGraph T is tree : \nMe : ", isTree(T), "\nNX : ", isTree_nx(T), nx.is_tree(T))