# √âvolution des √âmissions des Transports Routiers : Analyse et Visualisation

L'√©tude des facteurs d'√©missions des diff√©rents modes de transport routier est cruciale pour comprendre l'impact environnemental des transports. Les donn√©es utilis√©es proviennent de l'ADEME (Agence de l'Environnement et de la Ma√Ætrise de l'√ânergie) et sont disponibles √† l'adresse https://data.ademe.fr/data-fair/api/v1/datasets/etude-facteurs-d'emissions-des-differents-modes-de-transport-routier/data-files/ADEME%20-%20FE_Transports%20routiers_v2.csv. Ce dataset contient des informations d√©taill√©es sur les √©missions de polluants atmosph√©riques de diff√©rents types de v√©hicules routiers, organis√©es par ann√©e, type de v√©hicule, type de carburant, conditions de roulage et niveaux d'√©missions de diff√©rents polluants.

L'objectif de cette analyse est de calculer la moyenne des √©missions de CO, HC, NOx et particules par type de v√©hicule et par ann√©e, en distinguant les types de roulage. Cela nous permettra de comprendre l'√©volution des √©missions des transports routiers et d'identifier les domaines o√π des am√©liorations sont n√©cessaires.


## M√©thodologie

La m√©thodologie utilis√©e consiste √† importer les donn√©es dans un notebook Jupyter, puis √† les analyser √† l'aide de requ√™tes SQL avec DuckDB. Les donn√©es sont ensuite visualis√©es sous forme de graphiques interactifs avec Plotly Express. La requ√™te SQL utilis√©e permet de calculer la moyenne des √©missions de polluants par type de v√©hicule et par ann√©e, en distinguant les types de roulage. Les r√©sultats sont ensuite tri√©s par ann√©e, type de v√©hicule et type de roulage.


## Analyse et Visualisation

Les r√©sultats de l'analyse sont pr√©sent√©s sous forme de graphiques qui montrent l'√©volution des √©missions moyennes par type de v√©hicule et contexte de roulage.


## R√©sultats

Les graphiques montrent que les √©missions de polluants varient consid√©rablement en fonction du type de v√©hicule, de l'ann√©e et des conditions de roulage. Les r√©sultats d√©taill√©s sont pr√©sent√©s dans les graphiques interactifs.


## Conclusion

Cette analyse a permis de comprendre l'√©volution des √©missions des transports routiers et d'identifier les domaines o√π des am√©liorations sont n√©cessaires. Les r√©sultats de cette √©tude peuvent √™tre utilis√©s pour √©clairer les d√©cisions politiques et les choix technologiques visant √† r√©duire l'impact environnemental des transports.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [2]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://data.ademe.fr/data-fair/api/v1/datasets/etude-facteurs-d'emissions-des-differents-modes-de-transport-routier/data-files/ADEME%20-%20FE_Transports%20routiers_v2.csv", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

‚úÖ Donn√©es charg√©es avec succ√®s


## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [3]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
  "Ann√©e", 
  "V√©hicule", 
  "Roulage", 
  AVG(CAST("CO (g/km)" AS DOUBLE)) AS avg_CO,
  AVG(CAST("HC (g/km)" AS DOUBLE)) AS avg_HC,
  AVG(CAST("NOx (g/km)" AS DOUBLE)) AS avg_NOx,
  AVG(CAST("Particules (g/km)" AS DOUBLE)) AS avg_particules
FROM 
  loaded_dataset
GROUP BY 
  "Ann√©e", 
  "V√©hicule", 
  "Roulage"
ORDER BY 
  "Ann√©e", 
  "V√©hicule", 
  "Roulage" """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

R√©sultats : 176 lignes


Unnamed: 0,Ann√©e,V√©hicule,Roulage,avg_CO,avg_HC,avg_NOx,avg_particules
0,2020,2RM,France,2.696,0.429,0.111,0.03
1,2020,2RM,Rural,3.438,0.4,0.123,0.029
2,2020,2RM,Urbain,1.572,0.458,0.09,0.031
3,2020,Autocar,France,1.315,0.092,3.502,0.055
4,2020,Autocar,Rural,0.984,0.072,2.534,0.043


## üìà Visualisation

La biblioth√®que principale utilis√©e est Plotly Express, qui est une surcouche de Plotly, id√©ale pour cr√©er des visualisations interactives complexes de mani√®re simple et intuitive. Plotly Express est adapt√©e ici pour repr√©senter l'√©volution des √©missions moyennes de polluants par type de v√©hicule et contexte de roulage, avec une grande interactivit√© et des options de personnalisation. Cela permet une lecture d√©taill√©e et comparative des donn√©es.

In [4]:
import pandas as pd
import duckdb as ddb
import plotly.express as px
import pandas as pd

fig = px.line(
    df.sort_values(['V√©hicule', 'Ann√©e']),
    x='Ann√©e',
    y=['avg_CO', 'avg_HC', 'avg_NOx', 'avg_particules'],
    color='V√©hicule',
    facet_col='Roulage',
    labels={
        'value': '√âmissions (g/km)',
        'variable': 'Polluant',
        'Ann√©e': '',
        'V√©hicule': 'Type&nbsp;v√©hicule',
        'Roulage': ''
    },
    title="√âvolution des √©missions moyennes par type v√©hicule et contexte de roulage",
    line_shape='spline',
    markers=True,
    hover_data={'Ann√©e': True, 'Roulage': True, 'V√©hicule': True}
)

fig.update_traces(patch={'hovertemplate': (
    '<b>%{fullData.name}</b><br>Ann√©e : %{x}<br>'
    '√âmissions : <b>%{y:.3f}</b> g/km<br>'
    'Roulage : %{customdata[0]}<extra></extra>'
)})

fig.for_each_annotation(lambda a: a.update(text=a.text.split('=')[-1]))

fig.update_layout(
    template='plotly_white',
    font=dict(family='Poppins', size=11),
    height=450,
    margin=dict(l=40, r=20, t=60, b=60),
    legend=dict(orientation='h', yanchor='bottom', y=-.2, x=.5, xanchor='center')
)

for axis in fig.select_xaxes():
    axis.update(tickmode='linear', tick0=2020, dtick=1)

dataviz = fig
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*

In [5]:

# --- Variables inject√©es par le script ---
FINAL_OBJECT_VARIABLE_NAME = 'dataviz'
OUTPUT_IMAGE_NAME = 'published\\notebooks\\duckit_analysis_20250808_163609.png'
OUTPUT_HTML_NAME = 'published\\notebooks\\duckit_analysis_20250808_163609.html'

# ===================================================================
# CELLULE INJECT√âE AUTOMATIQUEMENT (VERSION ROBUSTE)
# ===================================================================
import sys
import os
# On importe les modules n√©cessaires pour l'export au cas o√π
try:
    from bokeh.io import save as bokeh_save
except ImportError:
    bokeh_save = None

try:
    # On s'assure que le dossier de sortie existe
    output_dir = os.path.dirname(OUTPUT_IMAGE_NAME)
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)

    # On utilise globals().get() pour une r√©cup√©ration plus s√ªre
    final_object = globals().get(FINAL_OBJECT_VARIABLE_NAME)

    if final_object is None:
        # On l√®ve une NameError pour √™tre coh√©rent avec le code original
        raise NameError(f"name '{FINAL_OBJECT_VARIABLE_NAME}' is not defined")

    print(f"INFO: Variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e. Tentative d'exportation...")

    object_type = str(type(final_object))

    if 'plotly.graph_objs._figure.Figure' in object_type:
        print(f"--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.")
        # 1. Sauvegarde HTML pour l'interactivit√©
        print(f"--> Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.write_html(OUTPUT_HTML_NAME, include_plotlyjs='cdn')
        # 2. Sauvegarde PNG pour l'aper√ßu statique
        try:
            print(f"--> Tentative de sauvegarde PNG directe dans : {OUTPUT_IMAGE_NAME}")
            final_object.write_image(OUTPUT_IMAGE_NAME, scale=3, width=1200, height=800)
            print(f"--> Image Plotly sauvegard√©e avec succ√®s.")
        except Exception as e:
            print(f"AVERTISSEMENT: La sauvegarde directe en PNG a √©chou√© (kaleido est-il install√©?).", file=sys.stderr)
            print(f"   Erreur: {e}", file=sys.stderr)
            print(f"--> PLAN B: On va utiliser la capture d'√©cran du HTML √† la place.")
            # On cr√©e un fichier marqueur pour que le script de post-traitement prenne le relais
            with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
                f.write("plotly")
    elif 'folium.folium.Map' in object_type:
        print(f"--> D√©tect√© : Folium. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("folium")
    elif 'altair.vegalite' in object_type and hasattr(final_object, 'save'):
        print(f"--> D√©tect√© : Altair. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("altair")
    elif 'bokeh.plotting' in object_type and bokeh_save is not None:
        print(f"--> D√©tect√© : Bokeh. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        bokeh_save(final_object, filename=OUTPUT_HTML_NAME, title="")
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("bokeh")
    elif 'matplotlib.figure.Figure' in object_type:
        print(f"--> D√©tect√© : Matplotlib. Sauvegarde dans : {OUTPUT_IMAGE_NAME}")
        final_object.savefig(OUTPUT_IMAGE_NAME, dpi=300, bbox_inches='tight')
    else:
        print(f"AVERTISSEMENT: Type non support√© : {object_type}", file=sys.stderr)
except NameError:
    print(f"AVERTISSEMENT: Aucune variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e.", file=sys.stderr)
except Exception as e:
    print(f"ERREUR lors de l'exportation : {e}", file=sys.stderr)


INFO: Variable 'dataviz' trouv√©e. Tentative d'exportation...
--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.
--> Sauvegarde HTML dans : published\notebooks\duckit_analysis_20250808_163609.html
--> Tentative de sauvegarde PNG directe dans : published\notebooks\duckit_analysis_20250808_163609.png


--> Image Plotly sauvegard√©e avec succ√®s.
