In [1]:
# outil de géographie
!pip install geopy



In [2]:
# lire les fichiers xlsx
!pip install openpyxl



In [3]:
import pandas as pd
import unicodedata

# 1. Chargement de vos données de mobilité
df_mobilite = pd.read_excel("MOBILITE.xlsx", sheet_name="tableau commune")

# 2. Chargement de la base locale (déjà présente dans votre dossier ou Bucket)
df_datagouv = pd.read_csv("communes_data_gouv.csv", sep=',', low_memory=False)

# 3. Fonction de nettoyage pour garantir la fusion (Merge)
def nettoyer_nom(nom):
    if isinstance(nom, str):
        nom = nom.upper().strip()
        # Supprime les accents (ex: É -> E)
        nom = "".join(c for c in unicodedata.normalize('NFD', nom) if unicodedata.category(c) != 'Mn')
        return nom
    return nom

df_mobilite['Commune_Clean'] = df_mobilite['Commune'].apply(nettoyer_nom)

# --- ADAPTATION AUX COLONNES DU FICHIER ---
# Selon le fichier de data.gouv, les colonnes peuvent varier. 
# On cherche les colonnes de nom et de coordonnées.

# On nettoie la colonne nom du référentiel (souvent 'nom_commune' ou 'libelle_commune')
col_nom_ref = 'nom_commune' if 'nom_commune' in df_datagouv.columns else df_datagouv.columns[0]
df_datagouv['Nom_Clean'] = df_datagouv[col_nom_ref].apply(nettoyer_nom)

# Gestion des coordonnées GPS
if 'coordonnees_gps' in df_datagouv.columns:
    # Si c'est au format "48.11, -1.67", on sépare en deux
    df_datagouv[['lat', 'long']] = df_datagouv['coordonnees_gps'].str.split(',', expand=True).astype(float)
elif 'latitude' in df_datagouv.columns:
    df_datagouv = df_datagouv.rename(columns={'latitude': 'lat', 'longitude': 'long'})

# 4. Fusion des deux tableaux
df_merged = pd.merge(
    df_mobilite, 
    df_datagouv[['Nom_Clean', 'lat', 'long']], 
    left_on='Commune_Clean', 
    right_on='Nom_Clean', 
    how='left'
)

# 5. Nettoyage final (supprime les doublons de communes)
df_travail = df_merged.drop_duplicates(subset=['Commune']).drop(columns=['Commune_Clean', 'Nom_Clean'])

print(f"Nombre de lignes chargées : {len(df_travail)}")
print(df_travail.head())

# Vérification : Y a-t-il des communes sans coordonnées ?
manquants = df_travail[df_travail['lat'].isna()]
if not manquants.empty:
    print(f"\nAttention : {len(manquants)} communes n'ont pas été géocodées.")

Nombre de lignes chargées : 733
  Code postal                Commune        lat      long
0       35001                 ACIGNE  48.146401 -1.518798
1       14001                  ABLON  49.394251  0.286768
2       56001                ALLAIRE  47.639219 -2.176815
3       35002                AMANLIS  47.999822 -1.495562
4       53003  AMBRIERES LES VALLEES        NaN       NaN

Attention : 337 communes n'ont pas été géocodées.


In [4]:
!pip install -U googlemaps

Collecting googlemaps
  Downloading googlemaps-4.10.0.tar.gz (33 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Building wheels for collected packages: googlemaps
  Building wheel for googlemaps (setup.py): started
  Building wheel for googlemaps (setup.py): finished with status 'done'
  Created wheel for googlemaps: filename=googlemaps-4.10.0-py3-none-any.whl size=40749 sha256=004a3a0de28eac0ddd3ba7d8a949ec80d3ce5e61549cd0bef3935522c77f6cff
  Stored in directory: c:\users\yasmi\appdata\local\pip\cache\wheels\76\2a\24\5993a7b77c9a37b86f415096436a448c1babdd132066bdcb31
Successfully built googlemaps
Installing collected packages: googlemaps
Successfully installed googlemaps-4.10.0


  DEPRECATION: Building 'googlemaps' using the legacy setup.py bdist_wheel mechanism, which will be removed in a future version. pip 25.3 will enforce this behaviour change. A possible replacement is to use the standardized build interface by setting the `--use-pep517` option, (possibly combined with `--no-build-isolation`), or adding a `pyproject.toml` file to the source tree of 'googlemaps'. Discussion can be found at https://github.com/pypa/pip/issues/6334


In [5]:
import googlemaps

# 1. Configuration Client et Destinations
gmaps = googlemaps.Client(key='AIzaSyASIYevaoXZJewaYkmGrAmz8WEAv8m5Ghk')
PONTCHAILLOU = "48.118,-1.696"
SUD = "48.087,-1.652"

# --- AJOUT : Initialisation du budget ---
nb_elements = 0
prix_unitaire_element = 0.005  # Tarif officiel : 5$ les 1000

def calculer_trajet(origine, destination, mode):
    """Effectue l'appel API Distance Matrix."""
    try:
        result = gmaps.distance_matrix(origine, destination, mode=mode, language='fr')
        element = result['rows'][0]['elements'][0]
        
        if element['status'] == 'OK':
            distance = element['distance']['value'] / 1000  # km
            duree = element['duration']['value'] / 60      # min
            return round(distance, 2), round(duree, 1)
        return None, None
    except Exception:
        return None, None

results = []
print("Lancement des calculs d'itinéraires...")

# 2. Boucle de traitement
for index, row in df_travail.iterrows():
    origine = f"{row['lat']},{row['long']}"
    
    data = {
        'Commune': row['Commune'], 
        'lat': row['lat'],
        'long': row['long']
    }
    
    # Calculs pour les deux sites (Pontchaillou et Sud)
    for site_name, site_coords in [('PONT', PONTCHAILLOU), ('SUD', SUD)]:
        for mode_api, mode_label in [('driving', 'car'), ('bicycling', 'bike'), ('transit', 'transit')]:
            dist, time = calculer_trajet(origine, site_coords, mode_api)
            data[f'{site_name}_dist_{mode_label}'] = dist
            data[f'{site_name}_time_{mode_label}'] = time
            
            # --- AJOUT : On compte chaque élément calculé ---
            nb_elements += 1 

    results.append(data)
    
    # --- AJOUT : Rapport de budget toutes les 10 communes ---
    cout_cumule = nb_elements * prix_unitaire_element
    
    if len(results) % 10 == 0:
        print(f"\n--- Rapport Budget (Commune n°{len(results)}) ---")
        print(f"Éléments consommés : {nb_elements}")
        print(f"Coût estimé : {cout_cumule:.2f} $ / 200 $")
        
        if cout_cumule > 180:
            print("!!! ALERTE : Vous approchez de la limite des 200$ !!!")

    # Sauvegarde de secours toutes les 20 communes
    if len(results) % 20 == 0:
        pd.DataFrame(results).to_csv('MOBILITE_SAUVEGARDE_ETAPE.csv', index=False, sep=';')
        print(f">> Sauvegarde effectuée.")

# 3. Export final
df_final = pd.DataFrame(results)
df_final.to_csv('MOBILITE_RESULTATS_COMPLETS.csv', index=False, sep=';')
print(f"\nTraitement terminé ! Coût total final : {nb_elements * prix_unitaire_element:.2f} $")

Lancement des calculs d'itinéraires...

--- Rapport Budget (Commune n°10) ---
Éléments consommés : 60
Coût estimé : 0.30 $ / 200 $

--- Rapport Budget (Commune n°20) ---
Éléments consommés : 120
Coût estimé : 0.60 $ / 200 $
>> Sauvegarde effectuée.

--- Rapport Budget (Commune n°30) ---
Éléments consommés : 180
Coût estimé : 0.90 $ / 200 $

--- Rapport Budget (Commune n°40) ---
Éléments consommés : 240
Coût estimé : 1.20 $ / 200 $
>> Sauvegarde effectuée.

--- Rapport Budget (Commune n°50) ---
Éléments consommés : 300
Coût estimé : 1.50 $ / 200 $

--- Rapport Budget (Commune n°60) ---
Éléments consommés : 360
Coût estimé : 1.80 $ / 200 $
>> Sauvegarde effectuée.

--- Rapport Budget (Commune n°70) ---
Éléments consommés : 420
Coût estimé : 2.10 $ / 200 $

--- Rapport Budget (Commune n°80) ---
Éléments consommés : 480
Coût estimé : 2.40 $ / 200 $
>> Sauvegarde effectuée.

--- Rapport Budget (Commune n°90) ---
Éléments consommés : 540
Coût estimé : 2.70 $ / 200 $

--- Rapport Budget (Comm

In [6]:
# 1. Charger votre fichier de résultats
df_wide = pd.read_csv('MOBILITE_RESULTATS_COMPLETS.csv', sep=';')

# 2. On définit les sites et les modes que nous avons calculés
sites = ['PONT', 'SUD']
modes = ['car', 'bike', 'transit']

rows = []

# 3. On parcourt chaque ligne du fichier original
for index, row in df_wide.iterrows():
    # Pour chaque commune, on va créer 6 lignes (2 sites * 3 modes)
    for s in sites:
        for m in modes:
            # On construit les noms de colonnes dynamiquement
            col_dist = f"{s}_dist_{m}"
            col_time = f"{s}_time_{m}"
            
            # On crée le dictionnaire pour la nouvelle ligne
            new_row = {
                'Commune': row['Commune'],
                'lat': row['lat'],
                'long': row['long'],
                'Site': s,
                'Moyen_de_transport': m,
                'Distance_km': row.get(col_dist), # On récupère la valeur
                'Temps_min': row.get(col_time)    # On récupère la valeur
            }
            rows.append(new_row)

# 4. Création du nouveau DataFrame "Long"
df_long = pd.DataFrame(rows)

# 5. On supprime les lignes où le trajet n'a pas pu être calculé (NaN)
df_long = df_long.dropna(subset=['Distance_km', 'Temps_min'])

# 6. Sauvegarde du nouveau fichier
df_long.to_csv('MOBILITE_FINAL_LONG.csv', index=False, sep=';')

print("Transformation réussie !")
print(f"Ancien format : {len(df_wide)} lignes")
print(f"Nouveau format : {len(df_long)} lignes")
print("\nAperçu du résultat :")
print(df_long.head(6))

Transformation réussie !
Ancien format : 733 lignes
Nouveau format : 2075 lignes

Aperçu du résultat :
  Commune        lat      long  Site Moyen_de_transport  Distance_km  \
0  ACIGNE  48.146401 -1.518798  PONT                car        20.09   
1  ACIGNE  48.146401 -1.518798  PONT               bike        17.85   
2  ACIGNE  48.146401 -1.518798  PONT            transit        18.01   
3  ACIGNE  48.146401 -1.518798   SUD                car        15.00   
4  ACIGNE  48.146401 -1.518798   SUD               bike        17.76   
5  ACIGNE  48.146401 -1.518798   SUD            transit        21.64   

   Temps_min  
0       22.6  
1       57.4  
2       68.6  
3       15.0  
4       58.8  
5       72.5  


In [7]:
# 1. Chargement de la base carbone (Correction de l'erreur DtypeWarning)
df_carb = pd.read_csv('base-carboner.csv', low_memory=False)

# 2. Définition des Identifiants ADEME
ids_cibles = {
    'car': 21609,
    'bus': 21594,
    'train': 21735,
    'bike': 28331
}

# 3. Extraction des facteurs
factors = {}
for mode, identifiant in ids_cibles.items():
    mask = (df_carb["Identifiant de l'élément"] == identifiant) & (df_carb["Nom poste français"].isna())
    if not df_carb[mask].empty:
        valeur = df_carb.loc[mask, "Total poste non décomposé"].values[0]
        factors[mode] = round(valeur, 4)

# Ajustement pour le mode 'transit' (Moyenne Bus/Train) et Vélo classique
factors['transit'] = round((factors.get('bus', 0) + factors.get('train', 0)) / 2, 4)
factors['bike_classic'] = 0.0

# 4. Chargement de votre fichier format long (celui avec Site et Moyen_de_transport)
df_long = pd.read_csv('MOBILITE_FINAL_LONG.csv', sep=';')

# 5. Création de la colonne Facteur d'émission
# On mappe les valeurs du dictionnaire 'factors' sur la colonne 'Moyen_de_transport'
df_long['FE'] = df_long['Moyen_de_transport'].map(factors)

# 6. Calcul du CO2 annuel (Hypothèse : 210 jours de travail, Aller-Retour)
nb_jours = 210
df_long['CO2_annuel_kg'] = df_long['Distance_km'] * 2 * nb_jours * df_long['FE']

# 7. Sauvegarde finale
df_long.to_csv('MOBILITE_BILAN_CARBONE.csv', index=False, sep=';')

print("Calcul du bilan carbone terminé avec succès !")
print(df_long[['Commune', 'Site', 'Moyen_de_transport', 'FE', 'CO2_annuel_kg']].head(10))

Calcul du bilan carbone terminé avec succès !
  Commune  Site Moyen_de_transport      FE  CO2_annuel_kg
0  ACIGNE  PONT                car  0.2540     2143.20120
1  ACIGNE  PONT               bike  0.0110       82.46700
2  ACIGNE  PONT            transit  0.0814      615.72588
3  ACIGNE   SUD                car  0.2540     1600.20000
4  ACIGNE   SUD               bike  0.0110       82.05120
5  ACIGNE   SUD            transit  0.0814      739.82832
6   ABLON  PONT                car  0.2540    26625.19440
7   ABLON  PONT               bike  0.0110     1168.58280
8   ABLON  PONT            transit  0.0814    20170.92000
9   ABLON   SUD                car  0.2540    26597.45760
