# Serie 12
Ce document contient les différents exercices à réaliser. Veuillez compléter et rendre ces exercices pour la semaine prochaine.

Pour chaque exercice:
* implémentez ce qui est demandé
* commentez votre code
* expliquez **en français ou English** ce que vous avez codé dans la cellule correspondante


Dans vos explications à chacun des exercices, indiquez un pourcentage subjectif d'investissement de chaque membre du groupe. Des interrogations aléatoires en classe pourront être réalisées pour vérifier votre contribution/compréhension.


Les tentatives infructueuses, les explications, commentaires et analyses des échecs rapportent des points. Ne rendez pas copie-blanche, même si votre fonction n'est pas correcte.

## Exercice 1
Soit G, un graphe connexe, à arêtes pondérées. Un arbre couvrant de poids minimal (minimum spanning tree, MST) de G est un sous-graphe de G qui satisfait les propriétés suivantes:

* C'est un arbre, c'est-à-dire qu'il est connecté et n'a pas de cycles.
* Il est couvrant, c'est-à-dire qu'il contient tous les sommets de G.
* Il a un poids total des arêtes minimal parmi tous les arbres possibles.


Implémentez l'algorithme de Prim vu en cours pour calculer l'arbre couvrant de poids minimal (MST). L'algorithme de Prim est décrit par le pseudo-code suivant:



```
Choisissez un sommet arbitraire s;
Marquez s comme visité;
Repeat n-1 times {
	Soit {u, v} une arête avec le plus petit poids parmi toutes les arêtes
    où u est un sommet visité et v ne l'est pas;
	Marquez v comme visité;
	Ajoutez {u, v} dans l'arbre;
}
```

In [1]:
# Représente un sommet.
class Vertex:
    def __init__(self, name, payload = None):
        self.name = name
        self.payload = payload
        self.edges = []

    def connect(self, other_vertex, weight):
        edge = Edge(self, other_vertex, weight)
        self.edges.append(edge)
        other_vertex.edges.append(edge)

    def __str__(self):
        return f"({self.name}: {self.payload})"

    # Peut être étendue selon vos besoins pour l'algorithme de Prim.

# Représente une arête, connectant deux sommets.
class Edge:
    def __init__(self, left_vertex, right_vertex, weight):
        self.left_vertex = left_vertex
        self.right_vertex = right_vertex
        self.weight = weight
        self.part_of_mst = False

    # Marque cette arête comme faisant partie de l'arbre couvrant de poids minimal.
    def mark_as_part_of_mst(self):
        self.part_of_mst = True

    # Ne marque plus cette arête comme faisant partie de l'arbre couvrant de poids minimal.
    def unmark_as_part_of_mst(self):
        self.part_of_mst = False

    # Indique si l'arête fait partie de l'arbre couvrant de poids minimal.
    def is_part_of_mst(self):
        return self.part_of_mst

    def __str__(self):
        return f"{self.left_vertex} <=> {self.right_vertex} (weight: {self.weight})"

    # Peut être étendue selon vos besoins pour l'algorithme de Prim.
    # Ajout pour permettre la comparaison basée sur le poids
    def __lt__(self, other):
        return self.weight < other.weight

In [2]:
# Exécute l'algorithme de Prim sur une liste de sommets.
from heapq import heappush, heappop

# Retourne le poids de l'arbre couvrant de poids minimal.
def prim_algorithm(vertices: list[Vertex]) -> int:
    if not vertices:
        return 0

    visited = set()
    mst_weight = 0
    min_heap = []

    start_vertex = vertices[0]
    visited.add(start_vertex)

    for edge in start_vertex.edges:
        heappush(min_heap, (edge.weight, edge))

    while min_heap:
        weight, edge = heappop(min_heap)

        if edge.left_vertex in visited and edge.right_vertex in visited:
            continue  # Ignore les arêtes qui connectent uniquement des sommets déjà visités

        mst_weight += weight
        edge.mark_as_part_of_mst()

        # Déterminer le sommet non visité
        next_vertex = (
            edge.right_vertex if edge.left_vertex in visited else edge.left_vertex
        )

        visited.add(next_vertex)

        # Ajouter les nouvelles arêtes du sommet au tas
        for next_edge in next_vertex.edges:
            if next_edge.left_vertex not in visited or next_edge.right_vertex not in visited:
                heappush(min_heap, (next_edge.weight, next_edge))

        # Debugging: Afficher l'état actuel
        print(f"Selected edge: {edge}, current MST weight: {mst_weight}")

    return mst_weight


In [3]:
# Il s'agit du graphe illustré en début de série
u0 = Vertex("u0")
u1 = Vertex("u1")
u2 = Vertex("u2")
u3 = Vertex("u3")
u4 = Vertex("u4")

u0.connect(u1, 4)
u0.connect(u2, 4)
u0.connect(u3, 3)
u0.connect(u4, 6)
u1.connect(u2, 3)
u1.connect(u4, 7)
u2.connect(u3, 2)
u3.connect(u4, 5)

mst_weight = prim_algorithm([u0, u1, u2, u3, u4])
assert mst_weight == 13

Selected edge: (u0: None) <=> (u3: None) (weight: 3), current MST weight: 3
Selected edge: (u2: None) <=> (u3: None) (weight: 2), current MST weight: 5
Selected edge: (u1: None) <=> (u2: None) (weight: 3), current MST weight: 8
Selected edge: (u3: None) <=> (u4: None) (weight: 5), current MST weight: 13


In [4]:
# Graphe et arbre couvrant de poids minimal sur: https://www.youtube.com/watch?v=cplfcGZmX7I
a = Vertex("A")
b = Vertex("B")
c = Vertex("C")
d = Vertex("D")
e = Vertex("E")
f = Vertex("F")
g = Vertex("G")

a.connect(b, 2)
a.connect(c, 3)
a.connect(d, 3)
b.connect(c, 4)
b.connect(e, 3)
c.connect(d, 5)
c.connect(e, 1)
c.connect(f, 6)
d.connect(f, 7)
e.connect(f, 8)
f.connect(g, 9)

mst_weight = prim_algorithm([a, b, c, d, e, f, g])
assert mst_weight == 24

Selected edge: (A: None) <=> (B: None) (weight: 2), current MST weight: 2
Selected edge: (A: None) <=> (C: None) (weight: 3), current MST weight: 5
Selected edge: (C: None) <=> (E: None) (weight: 1), current MST weight: 6
Selected edge: (A: None) <=> (D: None) (weight: 3), current MST weight: 9
Selected edge: (C: None) <=> (F: None) (weight: 6), current MST weight: 15
Selected edge: (F: None) <=> (G: None) (weight: 9), current MST weight: 24


### Explications

Le code implémente l'algorithme de Prim en Python en utilisant les classes `Vertex` et `Edge` :

### Classes
- **Vertex** : Représente un sommet dans le graphe.
  - Attributs : `name` (nom du sommet), `payload` (données supplémentaires associées au sommet), et `edges` (liste des arêtes connectées à ce sommet).
  - Méthodes :
    - `connect` : Connecte ce sommet à un autre sommet avec un poids spécifié.
  
- **Edge** : Représente une arête entre deux sommets.
  - Attributs : `left_vertex` et `right_vertex` (les deux sommets connectés), `weight` (poids de l'arête), et `part_of_mst` (indique si l'arête fait partie du MST).
  - Méthodes :
    - `mark_as_part_of_mst` : Marque l'arête comme faisant partie du MST.
    - `unmark_as_part_of_mst` : Supprime l'arête du MST.
    - `__lt__` : Permet la comparaison des arêtes par poids, nécessaire pour le tas min.

### Fonction `prim_algorithm`
La fonction `prim_algorithm` implémente l'algorithme de Prim. Voici les étapes clés :
1. **Initialisation** :
   - Le premier sommet est choisi comme sommet de départ.
   - Un tas (min-heap) est utilisé pour gérer les arêtes par ordre de poids.
   - Tous les sommets connectés au sommet de départ sont ajoutés au tas.

2. **Sélection des arêtes** :
   - Tant que le tas n'est pas vide, l'arête de poids minimal est extraite.
   - Si l'arête relie un sommet non visité, elle est ajoutée au MST et le sommet est marqué comme visité.
   - Les nouvelles arêtes connectées au sommet visité sont ajoutées au tas.

3. **Retour** :
   - Le poids total du MST est retourné à la fin de l'algorithme.

### Exercice 1.1

Quelle est la complexité de votre implémentation de l'algorithme de Prim?

## Complexité de l'algorithme de Prim

La complexité de l'algorithme de Prim dépend de la structure de données utilisée pour gérer le tas min. Avec un tas binaire, la complexité de l'algorithme est la suivante :

- **Temps** : $(O(E \log E))$, où $(E)$ est le nombre d'arêtes dans le graphe. Cela est dû au fait que chaque arête est ajoutée et extraite du tas une seule fois. L'opération d'extraction et d'insertion dans un tas binaire prend $(O(\log E))$.
- **Espace** : $(O(V + E))$, où $(V)$ est le nombre de sommets et $(E)$ le nombre d'arêtes, car nous devons stocker tous les sommets, les arêtes et le tas min.

### Exercice 1.2


Vous devez tester votre implémentation en utilisant le fichier de données d'entrée fourni appelé `sda_graph.txt`. Le format du fichier d'entrée est le suivant:

```
Name_Of_City_k, State[Long,Lat] Population
distance_from_k-1 distance_from_k-2 …
distance_from_2 distance_from_1
Name_Of_AnotherCity ...
...
*End of file
```


Par exemple, Yakima a 49826 habitants, elle est à 1513 km de Yankton et à 2410 km de Youngstown.

Vous devez concevoir et mettre en œuvre une classe `City` selon les principes suivants:
1. Des tableaux unidimensionnels pour maintenir le nom, l'état, la latitude, la longitude et la population de chaque ville.
2. Un tableau à 2 dimensions pour maintenir les distances par paires entre les villes.

Vous êtes libre de choisir une conception différente si cela facilite votre implémentation, la rend plus efficace, etc. Les poids du graphique sont donnés par les distances entre chaque ville dans le fichier d'entrée.

L'output de l'algorithme MST doit être un fichier texte nommé `MST.out. Il doit énumérer les routes dans le MST résultant. Le format attendu de la sortie est le suivant :

```
...
Yankton SD, Sioux City IA
Saginaw MI, Traverse City MI
Traverse City MI, Sault Sainte Marie MI

Cost: 424242
```

La dernière ligne du fichier `MST.out` doit être son coût total. Inclure le fichier `MST.out` dans l'archive envoyée comme solution pour ce TP.

In [5]:
import heapq
import re
class City:
    def __init__(self, name, state, latitude, longitude, population):
        self.name = name
        self.state = state
        self.latitude = latitude
        self.longitude = longitude
        self.population = population
        self.distances = []  # Liste pour les distances vers d'autres villes

    def __str__(self):
        return f"{self.name} {self.state}, {self.latitude}, {self.longitude}, Population: {self.population}"


def read_input(file_name):
    cities = []
    with open(file_name, 'r') as file:
        lines = file.readlines()
        for line in lines:
            if line.strip() == "*End of file":
                break
            parts = line.split(',')
            if len(parts) > 1:
                name, state = parts[0].strip(), parts[1].strip()
                lat_lon = parts[2].strip().strip('[]').split(' ')
                latitude = float(lat_lon[0])
                longitude = float(lat_lon[1])
                population = int(parts[3].strip())

                city = City(name, state, latitude, longitude, population)
                cities.append(city)

    return cities

def write_output(mst, total_cost, file_name):
    with open(file_name, 'w') as file:
        file.write(f"Total cost: {total_cost}\n")
        file.write("MST:\n")
        for city, cost in mst:
            file.write(f"{city}: {cost}\n")

def main():
    # Read the city data from the input file
    cities = read_input('/home/gobi/Documents/MyMaster/HS2024/Structure de données/series/sda_graph.txt')

    # Apply Prim's algorithm to the cities
    mst, total_cost = prim_algorithm(cities)

    # Write the output to the MST.out file
    write_output(mst, total_cost, 'MST.out')






# A COMPLETER AVEC VOTRE CONCEPTION
# Vous devez:
#   1) Lire le fichier "sda_graph.txt"
#   2) appliquer l'algorithme de Prim
#   3) écrire dans le fichier "MST.out"

In [10]:
import re
from heapq import heappush, heappop

class City:
    def __init__(self, name, x, y):
        self.name = name
        self.x = x
        self.y = y
        self.neighbors = []

    def add_neighbor(self, neighbor, distance):
        self.neighbors.append((neighbor, distance))

    def __str__(self):
        return f"{self.name} ({self.x}, {self.y})"

def read_graph(file_name):
    cities = {}
    with open(file_name, 'r') as f:
        lines = f.readlines()
        for line in lines:
            # Extraire les informations de chaque ligne
            match = re.match(r"([^,]+, [A-Z]{2})\[(\d+),(\d+)](\d+)(.*)", line.strip())
            if match:
                city_name = match.group(1)
                x = int(match.group(2))
                y = int(match.group(3))
                city_distance = int(match.group(4))
                neighbors = match.group(5).strip().split()

                # Ajouter la ville et ses voisins
                if city_name not in cities:
                    cities[city_name] = City(city_name, x, y)
                city = cities[city_name]

                # Ajouter la distance de la ville à elle-même (si nécessaire)
                city.add_neighbor(city_name, city_distance)

                # Ajouter les voisins avec leur distance
                for i, neighbor_name in enumerate(neighbors):
                    neighbor_distance = int(neighbors[i])
                    city.add_neighbor(neighbor_name, neighbor_distance)
                    if neighbor_name not in cities:
                        cities[neighbor_name] = City(neighbor_name, 0, 0)
                    cities[neighbor_name].add_neighbor(city_name, neighbor_distance)

    return cities

from heapq import heappush, heappop

def prim_algorithm(cities):
    visited = set()  # Villes visitées
    mst_edges = []  # Liste des arêtes de l'arbre couvrant
    total_weight = 0  # Poids total de l'arbre couvrant

    # Choisir une ville de départ (ici la première de la liste)
    start_city = cities[0]  # Liste de villes, donc on prend la première
    visited.add(start_city.name)

    # Ajouter les voisins de la ville de départ dans la file de priorité
    edges = []  # Liste des arêtes sous forme (poids, ville1, ville2)
    for neighbor, distance in start_city.neighbors:
        heappush(edges, (distance, start_city.name, neighbor))

    while edges:
        # Sélectionner l'arête avec la distance la plus faible
        dist, city1, city2 = heappop(edges)

        if city2 not in visited:
            visited.add(city2)
            mst_edges.append((city1, city2, dist))
            total_weight += dist

            # Ajouter les voisins de la ville visitée (city2)
            for neighbor, distance in cities[city2].neighbors:
                if neighbor not in visited:
                    heappush(edges, (distance, city2, neighbor))

    return mst_edges, total_weight

# Exemple d'utilisation
cities = read_graph('/home/gobi/Documents/MyMaster/HS2024/Structure de données/series/sda_graph.txt')

# Affichage des villes et leurs voisins
for city_name, city in cities.items():
    print(f"{city_name}:")
    for neighbor, distance in city.neighbors:
        print(f"  -> {neighbor} avec distance {distance}")

# Calculer l'arbre couvrant minimal (MST)
mst_edges, mst_weight = prim_algorithm(list(cities.values()))

print(f"File de priorité : {edges}")

# Afficher les arêtes du MST et son poids total
print(f"MST Weight: {mst_weight}")
for city1, city2, dist in mst_edges:
    print(f"{city1} - {city2} avec une distance de {dist}")



Youngstown, OH:
  -> Youngstown, OH avec distance 115436
Yankton, SD:
  -> Yankton, SD avec distance 12011
Yakima, WA:
  -> Yakima, WA avec distance 49826
Worcester, MA:
  -> Worcester, MA avec distance 161799
Wisconsin Dells, WI:
  -> Wisconsin Dells, WI avec distance 2521
Winston-Salem, NC:
  -> Winston-Salem, NC avec distance 131885
Winnipeg, MB:
  -> Winnipeg, MB avec distance 564473
Winchester, VA:
  -> Winchester, VA avec distance 20217
Wilmington, NC:
  -> Wilmington, NC avec distance 139238
Wilmington, DE:
  -> Wilmington, DE avec distance 70195
Williston, ND:
  -> Williston, ND avec distance 13336
Williamsport, PA:
  -> Williamsport, PA avec distance 33401
Williamson, WV:
  -> Williamson, WV avec distance 5219
Wichita Falls, TX:
  -> Wichita Falls, TX avec distance 94201
Wichita, KS:
  -> Wichita, KS avec distance 279835
Wheeling, WV:
  -> Wheeling, WV avec distance 43070
West Palm Beach, FL:
  -> West Palm Beach, FL avec distance 63305
Wenatchee, WA:
  -> Wenatchee, WA avec d

NameError: name 'edges' is not defined

### Explications

<< A REMPLIR PAR L'ETUDIANT >>

## Exercice 2

🎄✨ Résolvez https://adventofcode.com/2023/day/11. Nommez l'algorithme que vous utiliserez et discutez de sa complexité. ✨🎄

In [7]:
# A COMPLETER AVEC VOTRE CONCEPTION

### Explications

<< A REMPLIR PAR L'ETUDIANT >>