<img src="Images/Logo.png" alt="Logo NSI" style="float:right">

<h1 style="text-align:center">TP : Connexions dans une carte</h1>

Nous allons nous intéresser à un graphe tiré du monde réel, qui contient les villes de [France](Fichiers/france.csv) et de [Mayotte](Fichiers/mayotte.csv).  
Le sujet vous permettra de vous familiariser avec une réprésentation possible des graphes (par **liste d'adjacence**), et d'écrire quelques algorithmes classiques : **composantes connexes**, **recherche de chemins**.

## Aperçu du devoir

Voici quelques lignes de code permettant de récupérer les informations importantes des fichiers [france.csv](Fichiers/france.csv) et de [mayotte.csv](Fichiers/mayotte.csv) des cartes composées de villes, chacune munie d'un nom, d'une latitude et une longitude.

Dans l'exemple ci-dessous, nous nous intéressons aux villes de Mayotte.

In [None]:
import csv

# On récupère les données des fichiers csv
with open("Fichiers/mayotte.csv") as fichier:
    table_mayotte = list(csv.DictReader(fichier))
    print("Il y a", len(table_mayotte), "données pour Mayotte.")
    
with open("Fichiers/france.csv") as fichier:
    table_france = list(csv.DictReader(fichier))
    print("Il y a", len(table_france), "données pour la France.")

def formatte(tab: list) -> list:
    """Renvoie un dictionnaire après avoir validé et converti
    les valeurs associées aux clés du dictionnaire passé en paramètre"""
    nelle_table = []
    deja_vu_coord = set()
    deja_vu_nom = set()
    for ligne in tab:
        (x, y) = (ligne["LAT"], ligne["LONG"])
        nom = ligne["FULL_NAME"]
        # On ne garde que les villes principales
        # et celles qu'on n'a pas encore vues (en fonction des coordonnées ET du nom)
        if ligne["FC"] == 'P' and \
          ((x, y) not in deja_vu_coord) and \
          (nom not in deja_vu_nom): 
            latitude = float(ligne["LAT"])
            longitude = float(ligne["LONG"])
            assert -90.0 <= latitude <= 90.0, "problème latitude CSV"
            assert -180.0 <= longitude <= 180.0, "problème longitude CSV"
            deja_vu_coord.add((x, y))
            deja_vu_nom.add(nom)
            nelle_table.append({"nom" : nom, "latitude" : latitude, "longitude" : longitude})
    return nelle_table

carte_mayotte = formatte(table_mayotte)
print("Il y a", len(carte_mayotte), "villes différentes pour Mayotte")
carte_france = formatte(table_france)
print("Il y a", len(carte_france), "villes différentes pour la France")

In [None]:
carte_mayotte[0]

In [None]:
carte_france[0]

Ainsi pour chaque `ligne` (une ligne correspond à une ville) de `carte` :
* on obtient son nom par `ligne["nom"]`
* on obtient la latitude de la ville par `ligne["latitude"]`.
* on obtient la latitude de la ville par `ligne["longitude"]`.
* on obtient la distance entre 2 villes : `villeA` et `villeB` par `distance(villeA, villeB, carte)`

On récupère donc un tableau de dictionnaire, chaque dictionnaire correspond à une ville et les clés associées à une ville sont `"nom"`, `"latitude"` et `"longitude"`.

La fonction, ci-dessous, pourra nous être utile pour rechercher précisement le nom d'une ville.  

In [None]:
def recherche(prefixe: str, tab: list) -> list:
    """Renvoie la liste de toutes les villes commençant par prefixe.
    Indépendant de la casse."""
    taille = len(prefixe)
    return [ligne["nom"] for ligne in tab if ligne["nom"][:taille].lower() == prefixe.lower()]

In [None]:
recherche('ban', carte_mayotte)

Voici, maintenant quelques lignes de code qui pourront nous servir.

In [None]:
def coord_de(ville: str, tab: list) -> tuple:
    """Renvoie les coordonnées la la ville.
    La ville doit être correctement epelé!
    Renvoie None si aucune ligne ne correspond au nom ville"""
    for ligne in tab:
        if ligne["nom"] == ville:
            return (ligne["latitude"], ligne["longitude"])
    print("Le nom", ville, "n'existe pas")

In [None]:
coord_de('Accua', carte_mayotte)

In [None]:
from math import sqrt, pi

def distance(ville_src: str, ville_dest: str, tab: list) -> float:
    """Renvoie la distance, en m, entre la Ville Source et la Ville Destination.
    Utilise la distance ellipsoidale de Vincenty.
    Renvoie None si l'une des 2 villes n'est pas trouvée."""
    rayon = 6371000
    lat1, long1 = coord_de(ville_src, tab)
    lat2, long2 = coord_de(ville_dest, tab)
    if ((lat1, long1) == None) or ((lat2, long2) == None):
        return None
    return rayon * sqrt((lat1 - lat2) ** 2 + (long1 - long2) ** 2) / 180.0 * pi

In [None]:
distance('Accua', 'Rampe Cannelle', carte_mayotte)

## Le graphe
Les cartes de Mayotte et de France sont fournies. 
On récupère un tableau de dictionnaires `carte`.

Nous allons transformer ces cartes en graphe non-orienté de la manière suivante :
* les sommets sont des villes,
* deux villes sont reliées par une arête si elles sont distantes de moins de `min__dist` ; cette dernière distance paramètre donc le graphe.
Autrement dit, on peut se déplacer de ville en ville avec des *bottes de `min_dist` lieues*.  
Un tel graphe qui utilise les distances est dit **graphe euclidien**.

## Représentation
Pour simplifier au maximum les structures utilisées, vous allez recopier les villes dans un dictionnaire appelé `graphe`. 

Chaque clé du dictionnaire sera donc une ville et la valeur associée sera la liste de ses voisins.

In [None]:
def construit_graphe(carte: list, min_dist: float) -> dict:
    """Renvoie un graphe non orienté sous forme d'un dictionnaire.
    Chaque clé du dictionnaire est un sommet du graphe.
    La valeur associée est la liste des voisins de la ville.
    Une ville est voisine d'une autre si la distance entre les deux est inférieure à dist_min.
    """
    graphe = dict()
    pass

## Questions
Voici ce qui est demandé :

* de définir les fonctions qui construisent le graphe et le stockent dans la variable `villes`.
* d'écrire la fonction `composantes_connexes` qui compte le nombre de composantes connexes.
* d'écrire la fonction `relie` qui teste s'il existe un chemin entre deux villes.

In [None]:
def composantes_connexes(graphe: dict) -> int:
    """Renvoie le nombre de composantes connexes du graphe."""
    pass

In [None]:
def relie(ville1: str, ville2: str, graphe: dict) -> bool:
    """Vérifie s'il existe un chemin entre ville1 et ville2
    dans le graphe."""
    pass

Voici quelques tests pour la carte de Mayotte.

In [None]:
v1 = "Accua"
v2 = "Moutsamoudou"
v3 = "Bandraboua"
v4 = "Mambutzou"

In [None]:
villes_mayotte = construit_graphe(carte_mayotte, 1850.0)
assert composantes_connexes(villes_mayotte) == 31

assert relie(v1, v2, villes_mayotte) == False
assert relie(v1, v3, villes_mayotte) == False
assert relie(v2, v3, villes_mayotte) == False
assert relie(v2, v4, villes_mayotte) == False

In [None]:
villes_mayotte = construit_graphe(carte_mayotte, 2000.0)
assert composantes_connexes(villes_mayotte) == 24

assert relie(v1, v2, villes_mayotte) == False
assert relie(v1, v3, villes_mayotte) == False
assert relie(v2, v3, villes_mayotte) == False
assert relie(v2, v4, villes_mayotte) == False

In [None]:
villes_mayotte = construit_graphe(carte_mayotte, 3000.0)
assert composantes_connexes(villes_mayotte) == 4

assert relie(v1, v2, villes_mayotte) == False
assert relie(v1, v3, villes_mayotte) == True
assert relie(v2, v3, villes_mayotte) == False
assert relie(v2, v4, villes_mayotte) == False

In [None]:
villes_mayotte = construit_graphe(carte_mayotte, 3400.0)
assert composantes_connexes(villes_mayotte) == 2

assert relie(v1, v2, villes_mayotte) == False
assert relie(v1, v3, villes_mayotte) == True
assert relie(v2, v3, villes_mayotte) == False
assert relie(v2, v4, villes_mayotte) == True

In [None]:
villes_mayotte = construit_graphe(carte_mayotte, 4000.0)
assert composantes_connexes(villes_mayotte) == 1

assert relie(v1, v2, villes_mayotte) == True
assert relie(v1, v3, villes_mayotte) == True
assert relie(v2, v3, villes_mayotte) == True
assert relie(v2, v4, villes_mayotte) == True

## Optimisation
Voici une optimisation pour construire le graphe plus vite.  
Cette optimisation n'est pas nécessaire pour Mayotte, mais utile pour la France à cause du plus grand nombre de villes. L'idée de cette optimisation est que deux villes qui ont une latitude très différentes seront à une distance grande l'une de l'autre. En particulier, est calculé une valeur `lat_dist`; si la différence entre les latitudes de deux villes est plus grande que latDist, alors elles seront à une distance de plus de `min_dist`.  
A vous d'utiliser cette remarque, par exemple en triant le tableau villes.

In [None]:
R = 6371000
lat_dist = min_dist * 180.0 / pi / R

## Taille de la pile
La manière la plus simple de programmer la parcours en profondeur (DFS) est d'utiliser une fonction récursive. 

Dans le cas de la carte de France, le grand nombre de villes fait que la taille allouée par défaut pour la pile des appels récursifs peut être insuffisante. 

Vous pouvez paramétrer le la pile d'appels récursif à partir de la fonction `setrecursionlimit`.

Voici quelques tests pour la carte de France.

In [None]:
v1 = "Paris"
v2 = "Rouen"
v3 = "Ajaccio"
v4 = "Narbonne"
v5 = "La Testa"

In [None]:
villes_france = construit_graphe(carte_france, 2000.0)
assert composantes_connexes(villes_france) == 29437

assert relie(v1, v2, villes_france) == False
assert relie(v1, v3, villes_france) == False
assert relie(v1, v4, villes_france) == False
assert relie(v3, v5, villes_france) == False
assert relie(v1, v5, villes_france) == False

In [None]:
villes_france = construit_graphe(carte_france, 5000.0)
assert composantes_connexes(villes_france) == 2157

assert relie(v1, v2, villes_france) == True
assert relie(v1, v3, villes_france) == False
assert relie(v1, v4, villes_france) == False
assert relie(v3, v5, villes_france) == False
assert relie(v1, v5, villes_france) == False

In [None]:
villes_france = construit_graphe(carte_france, 7000.0)
assert composantes_connexes(villes_france) == 154

assert relie(v1, v2, villes_france) == True
assert relie(v1, v3, villes_france) == False
assert relie(v1, v4, villes_france) == False
assert relie(v3, v5, villes_france) == True
assert relie(v1, v5, villes_france) == False

In [None]:
villes_france = construit_graphe(carte_france, 12000.0)
assert composantes_connexes(villes_france) == 11

assert relie(v1, v2, villes_france) == True
assert relie(v1, v3, villes_france) == False
assert relie(v1, v4, villes_france) == True
assert relie(v3, v5, villes_france) == True
assert relie(v1, v5, villes_france) == False

## Source :
Coursera, *Conception et mise en œuvre d'algorithmes*, Ecole Polytechnique