**Team (Travail ensemble fifty-fifty)**:

**Ahonon Gobi Parfait** 

**Pellisier Mathias**



# Serie 12
Ce document contient les différents exercices à réaliser. Veuillez compléter et rendre ces exercices pour la semaine prochaine.

Pour chaque exercice:
* implémentez ce qui est demandé
* commentez votre code
* expliquez **en français ou English** ce que vous avez codé dans la cellule correspondante


Dans vos explications à chacun des exercices, indiquez un pourcentage subjectif d'investissement de chaque membre du groupe. Des interrogations aléatoires en classe pourront être réalisées pour vérifier votre contribution/compréhension.


Les tentatives infructueuses, les explications, commentaires et analyses des échecs rapportent des points. Ne rendez pas copie-blanche, même si votre fonction n'est pas correcte.

## Exercice 1
Soit G, un graphe connexe, à arêtes pondérées. Un arbre couvrant de poids minimal (minimum spanning tree, MST) de G est un sous-graphe de G qui satisfait les propriétés suivantes:

* C'est un arbre, c'est-à-dire qu'il est connecté et n'a pas de cycles.
* Il est couvrant, c'est-à-dire qu'il contient tous les sommets de G.
* Il a un poids total des arêtes minimal parmi tous les arbres possibles.


Implémentez l'algorithme de Prim vu en cours pour calculer l'arbre couvrant de poids minimal (MST). L'algorithme de Prim est décrit par le pseudo-code suivant:



```
Choisissez un sommet arbitraire s;
Marquez s comme visité;
Repeat n-1 times {
	Soit {u, v} une arête avec le plus petit poids parmi toutes les arêtes
    où u est un sommet visité et v ne l'est pas;
	Marquez v comme visité;
	Ajoutez {u, v} dans l'arbre;
}
```

In [19]:
# Représente un sommet.
class Vertex:
    def __init__(self, name, payload = None):
        self.name = name
        self.payload = payload
        self.edges = []

    def connect(self, other_vertex, weight):
        edge = Edge(self, other_vertex, weight)
        self.edges.append(edge)
        other_vertex.edges.append(edge)

    def __str__(self):
        return f"({self.name}: {self.payload})"

    # Peut être étendue selon vos besoins pour l'algorithme de Prim.

# Représente une arête, connectant deux sommets.
class Edge:
    def __init__(self, left_vertex, right_vertex, weight):
        self.left_vertex = left_vertex
        self.right_vertex = right_vertex
        self.weight = weight
        self.part_of_mst = False

    # Marque cette arête comme faisant partie de l'arbre couvrant de poids minimal.
    def mark_as_part_of_mst(self):
        self.part_of_mst = True

    # Ne marque plus cette arête comme faisant partie de l'arbre couvrant de poids minimal.
    def unmark_as_part_of_mst(self):
        self.part_of_mst = False

    # Indique si l'arête fait partie de l'arbre couvrant de poids minimal.
    def is_part_of_mst(self):
        return self.part_of_mst

    def __str__(self):
        return f"{self.left_vertex} <=> {self.right_vertex} (weight: {self.weight})"

    # Peut être étendue selon vos besoins pour l'algorithme de Prim.
    # Ajout pour permettre la comparaison basée sur le poids
    def __lt__(self, other):
        return self.weight < other.weight

In [20]:
# Exécute l'algorithme de Prim sur une liste de sommets.
from heapq import heappush, heappop

# Retourne le poids de l'arbre couvrant de poids minimal.
def prim_algorithm(vertices: list[Vertex]) -> int:
    if not vertices:
        return 0

    visited = set()
    mst_weight = 0
    min_heap = []

    start_vertex = vertices[0]
    visited.add(start_vertex)

    for edge in start_vertex.edges:
        heappush(min_heap, (edge.weight, edge))

    while min_heap:
        weight, edge = heappop(min_heap)

        if edge.left_vertex in visited and edge.right_vertex in visited:
            continue  # Ignore les arêtes qui connectent uniquement des sommets déjà visités

        mst_weight += weight
        edge.mark_as_part_of_mst()

        # Déterminer le sommet non visité
        next_vertex = (
            edge.right_vertex if edge.left_vertex in visited else edge.left_vertex
        )

        visited.add(next_vertex)

        # Ajouter les nouvelles arêtes du sommet au tas
        for next_edge in next_vertex.edges:
            if next_edge.left_vertex not in visited or next_edge.right_vertex not in visited:
                heappush(min_heap, (next_edge.weight, next_edge))

        # Debugging: Afficher l'état actuel
        print(f"Selected edge: {edge}, current MST weight: {mst_weight}")

    return mst_weight


In [21]:
# Il s'agit du graphe illustré en début de série
u0 = Vertex("u0")
u1 = Vertex("u1")
u2 = Vertex("u2")
u3 = Vertex("u3")
u4 = Vertex("u4")

u0.connect(u1, 4)
u0.connect(u2, 4)
u0.connect(u3, 3)
u0.connect(u4, 6)
u1.connect(u2, 3)
u1.connect(u4, 7)
u2.connect(u3, 2)
u3.connect(u4, 5)

mst_weight = prim_algorithm([u0, u1, u2, u3, u4])
assert mst_weight == 13

Selected edge: (u0: None) <=> (u3: None) (weight: 3), current MST weight: 3
Selected edge: (u2: None) <=> (u3: None) (weight: 2), current MST weight: 5
Selected edge: (u1: None) <=> (u2: None) (weight: 3), current MST weight: 8
Selected edge: (u3: None) <=> (u4: None) (weight: 5), current MST weight: 13


In [22]:
# Graphe et arbre couvrant de poids minimal sur: https://www.youtube.com/watch?v=cplfcGZmX7I
a = Vertex("A")
b = Vertex("B")
c = Vertex("C")
d = Vertex("D")
e = Vertex("E")
f = Vertex("F")
g = Vertex("G")

a.connect(b, 2)
a.connect(c, 3)
a.connect(d, 3)
b.connect(c, 4)
b.connect(e, 3)
c.connect(d, 5)
c.connect(e, 1)
c.connect(f, 6)
d.connect(f, 7)
e.connect(f, 8)
f.connect(g, 9)

mst_weight = prim_algorithm([a, b, c, d, e, f, g])
assert mst_weight == 24

Selected edge: (A: None) <=> (B: None) (weight: 2), current MST weight: 2
Selected edge: (A: None) <=> (C: None) (weight: 3), current MST weight: 5
Selected edge: (C: None) <=> (E: None) (weight: 1), current MST weight: 6
Selected edge: (A: None) <=> (D: None) (weight: 3), current MST weight: 9
Selected edge: (C: None) <=> (F: None) (weight: 6), current MST weight: 15
Selected edge: (F: None) <=> (G: None) (weight: 9), current MST weight: 24


### Explications

Le code implémente l'algorithme de Prim en Python en utilisant les classes `Vertex` et `Edge` :

### Classes
- **Vertex** : Représente un sommet dans le graphe.
  - Attributs : `name` (nom du sommet), `payload` (données supplémentaires associées au sommet), et `edges` (liste des arêtes connectées à ce sommet).
  - Méthodes :
    - `connect` : Connecte ce sommet à un autre sommet avec un poids spécifié.
  
- **Edge** : Représente une arête entre deux sommets.
  - Attributs : `left_vertex` et `right_vertex` (les deux sommets connectés), `weight` (poids de l'arête), et `part_of_mst` (indique si l'arête fait partie du MST).
  - Méthodes :
    - `mark_as_part_of_mst` : Marque l'arête comme faisant partie du MST.
    - `unmark_as_part_of_mst` : Supprime l'arête du MST.
    - `__lt__` : Permet la comparaison des arêtes par poids, nécessaire pour le tas min.

### Fonction `prim_algorithm`
La fonction `prim_algorithm` implémente l'algorithme de Prim. Voici les étapes clés :
1. **Initialisation** :
   - Le premier sommet est choisi comme sommet de départ.
   - Un tas (min-heap) est utilisé pour gérer les arêtes par ordre de poids.
   - Tous les sommets connectés au sommet de départ sont ajoutés au tas.

2. **Sélection des arêtes** :
   - Tant que le tas n'est pas vide, l'arête de poids minimal est extraite.
   - Si l'arête relie un sommet non visité, elle est ajoutée au MST et le sommet est marqué comme visité.
   - Les nouvelles arêtes connectées au sommet visité sont ajoutées au tas.

3. **Retour** :
   - Le poids total du MST est retourné à la fin de l'algorithme.

### Exercice 1.1

Quelle est la complexité de votre implémentation de l'algorithme de Prim?

## Complexité de l'algorithme de Prim

La complexité de l'algorithme de Prim dépend de la structure de données utilisée pour gérer le tas min. Avec un tas binaire, la complexité de l'algorithme est la suivante :

- **Temps** : $(O(E \log E))$, où $(E)$ est le nombre d'arêtes dans le graphe. Cela est dû au fait que chaque arête est ajoutée et extraite du tas une seule fois. L'opération d'extraction et d'insertion dans un tas binaire prend $(O(\log E))$.
- **Espace** : $(O(V + E))$, où $(V)$ est le nombre de sommets et $(E)$ le nombre d'arêtes, car nous devons stocker tous les sommets, les arêtes et le tas min.

### Exercice 1.2


Vous devez tester votre implémentation en utilisant le fichier de données d'entrée fourni appelé `sda_graph.txt`. Le format du fichier d'entrée est le suivant:

```
Name_Of_City_k, State[Long,Lat] Population
distance_from_k-1 distance_from_k-2 …
distance_from_2 distance_from_1
Name_Of_AnotherCity ...
...
*End of file
```


Par exemple, Yakima a 49826 habitants, elle est à 1513 km de Yankton et à 2410 km de Youngstown.

Vous devez concevoir et mettre en œuvre une classe `City` selon les principes suivants:
1. Des tableaux unidimensionnels pour maintenir le nom, l'état, la latitude, la longitude et la population de chaque ville.
2. Un tableau à 2 dimensions pour maintenir les distances par paires entre les villes.

Vous êtes libre de choisir une conception différente si cela facilite votre implémentation, la rend plus efficace, etc. Les poids du graphique sont donnés par les distances entre chaque ville dans le fichier d'entrée.

L'output de l'algorithme MST doit être un fichier texte nommé `MST.out. Il doit énumérer les routes dans le MST résultant. Le format attendu de la sortie est le suivant :

```
...
Yankton SD, Sioux City IA
Saginaw MI, Traverse City MI
Traverse City MI, Sault Sainte Marie MI

Cost: 424242
```

La dernière ligne du fichier `MST.out` doit être son coût total. Inclure le fichier `MST.out` dans l'archive envoyée comme solution pour ce TP.

In [23]:

from heapq import heappush, heappop

class City:
    def __init__(self, name, state, longitude, latitude, population):
        self.name = name
        self.state = state
        self.longitude = longitude
        self.latitude = latitude
        self.population = population

def read_cities_from_file(filename):
    cities = []
    distances = []
    
    with open(filename, 'r', encoding='utf-8') as f:
        lines = f.read().strip().split('\n')
    
    # Le fichier se termine par "*End of file"
    # On s'arrête juste avant cette ligne
    end_index = 0
    for i, line in enumerate(lines):
        if line.strip() == "*End of file":
            end_index = i
            break

    # Name_Of_City_k, State[Long,Lat] Population
    # Suivie de lignes décrivant les distances par rapport aux villes déjà lues.

    

    i = 0
    while i < end_index:
        line = lines[i].strip()
        if not line:
            i += 1
            continue
        # Extraction d'une ligne de ville :
        comma_index = line.find(',')
        city_name = line[:comma_index].strip()
        
        # La suite : " WA[46.60207,-120.5059] 49826"
        remainder = line[comma_index+1:].strip()  # "WA[46.60207,-120.5059] 49826"
        
        # Extraire l'état, la longitude, latitude et population
        # Trouver le premier espace pour séparer l'état des coordonnées
        space_index = remainder.find(' ')
        state_part = remainder[:space_index].strip()  # "WA[46.60207,-120.5059]"
        pop_part = remainder[space_index:].strip()    # "49826"

        # Extraire l'état et les coordonnées
        # Format de state_part: "WA[46.60207,-120.5059]"
        bracket_start = state_part.find('[')
        state = state_part[:bracket_start].strip()
        coords = state_part[bracket_start:].strip('[]') 
        long_str, lat_str = coords.split(',')
        longitude = float(long_str)
        latitude = float(lat_str)
        population = int(pop_part)

        city = City(city_name, state, longitude, latitude, population)
        city_index = len(cities)
        cities.append(city)

        # Maintenant, lire les distances par rapport aux villes déjà lues
        # Selon l’exemple : 
        # "distance_from_k-1 distance_from_k-2 …"
    
        
        # S’il y a k villes après lecture de celle-ci, elle devrait avoir k-1 distances.
        if city_index > 0:
            i += 1
            dist_line = lines[i].strip()
            city_distances = dist_line.split()
            city_distances = list(map(int, city_distances))
            # On a city_index = k, on devrait avoir k distances par rapport aux villes précédentes ?
            distances.append(city_distances)
        else:
            # Pour la première ville, pas de distances à lire
            distances.append([])

        i += 1

    # Maintenant, on a un tableaux distances qui contient pour chaque ville (à partir de la seconde),
    # les distances vers les villes précédentes.
    # On doit le transformer en une matrice NxN.
    n = len(cities)
    dist_matrix = [[0]*n for _ in range(n)]
    
    # distances[i] contient les distances de la ville i vers [0..i-1]
    # Il faut compléter symétriquement
    for i in range(n):
        for j in range(i):
            d = distances[i][j] if j < len(distances[i]) else distances[j][i]
            dist_matrix[i][j] = d
            dist_matrix[j][i] = d

    return cities, dist_matrix

def prim_with_matrix(dist_matrix):
    # Appliquer Prim sur une matrice NxN complète
    n = len(dist_matrix)
    if n == 0:
        return [], 0

    in_mst = [False]*n
    edge_count = 0
    in_mst[0] = True
    pq = []
    total_cost = 0
    mst_edges = []

    # Ajouter les arêtes du sommet 0
    for v in range(1, n):
        heappush(pq, (dist_matrix[0][v], 0, v))

    while pq and edge_count < n-1:
        w, u, v = heappop(pq)
        if not in_mst[v]:
            in_mst[v] = True
            mst_edges.append((u, v))
            total_cost += w
            edge_count += 1
            # Ajouter les nouvelles arêtes de v
            for x in range(n):
                if not in_mst[x]:
                    heappush(pq, (dist_matrix[v][x], v, x))
    
    return mst_edges, total_cost

def write_mst_output(filename, cities, mst_edges, total_cost):
    with open(filename, 'w', encoding='utf-8') as f:
        for (u,v) in mst_edges:
            city_u = cities[u]
            city_v = cities[v]
            # Format: "Yankton SD, Sioux City IA"
            f.write(f"{city_u.name} {city_u.state}, {city_v.name} {city_v.state}\n")
        f.write(f"\nCost: {total_cost}\n")


if __name__ == "__main__":
    # Lecture des données
    cities, dist_matrix = read_cities_from_file("sda_graph.txt")
    # Calcul du MST
    mst_edges, total_cost = prim_with_matrix(dist_matrix)
    # Écriture du MST
    write_mst_output("MST.out", cities, mst_edges, total_cost)
    print("MST computed and written to MST.out")


MST computed and written to MST.out


### Explications



### Explication de la solution

La solution implémente l’algorithme de Prim sur un ensemble de villes décrites dans le fichier `sda_graph.txt`.

1. **Lecture du fichier** :  
   On lit chaque ville (nom, état, coordonnées, population) puis on récupère les distances entre cette ville et les villes précédentes. Ces informations sont stockées dans :
   - Un tableau de `City` pour les métadonnées (nom, état, etc.).
   - Une matrice `dist_matrix` pour les distances entre toutes les paires de villes.

2. **Calcul du MST (Prim)** :  
   À partir de la matrice de distances, on applique Prim pour trouver l’arbre couvrant de poids minimal.  
   L’algorithme sélectionne à chaque étape l’arête la moins coûteuse reliant un sommet déjà inclus dans le MST à un sommet non encore inclus, jusqu’à ce que tous les sommets soient visités.

3. **Résultat (`MST.out`)** :  
   On écrit dans `MST.out` les routes sélectionnées (paires de villes) et le coût total du MST.



## Exercice 2

🎄✨ Résolvez https://adventofcode.com/2023/day/11. Nommez l'algorithme que vous utiliserez et discutez de sa complexité. ✨🎄

In [24]:
# A COMPLETER AVEC VOTRE CONCEPTION

class Universe:
    def __init__(self, grid):
        """
        Initialise l'univers à partir de la grille initiale.
        grid: liste de chaînes, chacune représentant une ligne du puzzle initial.
        """
        self.original_grid = grid
        self.expanded_grid = None
        self.galaxies = []  # liste de (r, c)
    
    def find_empty_lines_columns(self):
        """
        Identifie les lignes et colonnes sans galaxies dans original_grid.
        Retourne deux listes :
        - empty_rows: indices des lignes sans '#'
        - empty_cols: indices des colonnes sans '#'
        """
        # Notre TODO: Parcourir la grille et déterminer quelles lignes et colonnes sont vides.
        empty_rows = []
        empty_cols = []
        return empty_rows, empty_cols
    
    def expand_universe(self, empty_rows, empty_cols):
        """
        Construit expanded_grid à partir de original_grid en doublant
        les lignes et les colonnes identifiées comme vides.
        """
        # Notre TODO: Construire self.expanded_grid
        self.expanded_grid = []
        # Exemple de logique (à adapter):
        # Pour chaque ligne dans original_grid:
        #   - construire une nouvelle ligne avec les colonnes dupliquées si nécessaire
        #   - si la ligne est vide, la dupliquer également juste après.
        pass
    
    def find_galaxies(self):
        """
        Parcourt expanded_grid pour trouver les galaxies '#' et
        stocke leurs coordonnées dans self.galaxies.
        """
        # Notre TODO: Remplir self.galaxies avec (r,c) pour chaque '#'
        pass
    
    def bfs_from(self, start):
        """
        Effectue un BFS à partir de la position start (r,c) dans expanded_grid.
        Retourne un dictionnaire { (r,c): distance } ou un tableau 2D de distances.
        """
        # TODO: Implémenter un BFS standard sur une grille.
        from collections import deque
        distances = {}
        queue = deque()
        
        # Initialisation
        queue.append(start)
        distances[start] = 0
        
        # Mouvement possible : haut, bas, gauche, droite
        directions = [(1,0),(-1,0),(0,1),(0,-1)]
        
        while queue:
            r, c = queue.popleft()
            for dr, dc in directions:
                nr, nc = r+dr, c+dc
                if self.is_valid_cell(nr, nc) and (nr, nc) not in distances:
                    distances[(nr, nc)] = distances[(r, c)] + 1
                    queue.append((nr, nc))
        
        return distances
    
    def is_valid_cell(self, r, c):
        """
        Vérifie si la position (r, c) est dans les limites de expanded_grid et n'est pas un obstacle.
        Ici, pas d'obstacles autres que le fait de rester dans la grille, 
        puisque '#' (galaxie) et '.' (vide) sont tous accessibles.
        """
        if 0 <= r < len(self.expanded_grid) and 0 <= c < len(self.expanded_grid[0]):
            return True
        return False
    
    def compute_all_pairs_distances(self):
        """
        Calcule la distance minimale entre chaque paire de galaxies.
        Retourne une matrice distance_matrix[i][j] = distance entre galaxie i et galaxie j.
        """
        G = len(self.galaxies)
        distance_matrix = [[0]*G for _ in range(G)]
        
        for i in range(G):
            start_galaxy = self.galaxies[i]
            distances = self.bfs_from(start_galaxy)
            for j in range(G):
                if i != j:
                    dist_to_j = distances.get(self.galaxies[j], None)
                    distance_matrix[i][j] = dist_to_j if dist_to_j is not None else float('inf')
        
        return distance_matrix
    
    def compute_sum_of_distances(self, distance_matrix):
        """
        Calcule la somme des distances pour chaque paire distincte (i,j), i < j.
        """
        G = len(distance_matrix)
        total = 0
        for i in range(G):
            for j in range(i+1, G):
                total += distance_matrix[i][j]
        return total


# Fonction principale pour résoudre le puzzle
def solve():
    # Lecture de la grille d’entrée
    grid = [
        "....#....",
        "...###...",
        "....#....",
        ".........",
        "....#....",
        "...###...",
        "....#...."
    ]  # Exemple de grille, à remplacer par la grille réelle

    # 1. Créer l'univers
    universe = Universe(grid)

    # 2. Trouver les lignes et colonnes vides
    empty_rows, empty_cols = universe.find_empty_lines_columns()

    # 3. Étendre l'univers
    universe.expand_universe(empty_rows, empty_cols)

    # 4. Trouver les galaxies dans la grille étendue
    universe.find_galaxies()

    # 5. Calculer la matrice des distances entre galaxies
    distance_matrix = universe.compute_all_pairs_distances()

    # 6. Calculer la somme des distances
    total_distance = universe.compute_sum_of_distances(distance_matrix)

    print(total_distance)

if __name__ == "__main__":
    solve()


0


### Explications

 
La solution lit la grille, identifie les lignes et colonnes sans galaxies, puis génère une nouvelle grille agrandie. Elle localise toutes les galaxies et calcule les plus courts chemins entre chaque paire de galaxies à l’aide d’un parcours en largeur (BFS). Enfin, elle somme toutes ces distances et affiche le résultat.


**Discussion sur la complexité :**  
L’algorithme effectue un parcours en largeur (BFS) pour chaque galaxie afin de déterminer les distances aux autres galaxies. Sur une grille de taille N×M et G galaxies, chaque BFS est O(N×M), et répété G fois, donnant O(G×N×M). À cela s’ajoute la détection des lignes/colonnes vides et la construction de la grille étendue, également en O(N×M). Enfin, le calcul de la somme finale des distances est O(G²), ce qui est généralement négligeable par rapport au coût global du BFS. En résumé, la complexité est essentiellement O(G×N×M).