# Analyse de la temp√©rature moyenne mensuelle et son lissage sur 60 mois


L'analyse pr√©sent√©e dans ce notebook se concentre sur l'√©tude de la temp√©rature moyenne mensuelle et de son lissage sur 60 mois √† partir d'un jeu de donn√©es m√©t√©orologiques exhaustif. Les donn√©es utilis√©es proviennent du site data.gouv.fr et sont accessibles √† l'URL : https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_64_previous-1950-2023_RR-T-Vent.csv.gz. Ce fichier contient des enregistrements quotidiens de diverses variables m√©t√©orologiques tels que les pr√©cipitations, la temp√©rature minimale, maximale et moyenne, ainsi que d'autres informations pertinentes collect√©es √† partir de plusieurs postes m√©t√©orologiques en France.


L'objectif de cette analyse est de calculer la temp√©rature moyenne mensuelle et d'appliquer un lissage sur 60 mois pour mettre en √©vidence les tendances √† long terme et les variations saisonni√®res. Nous utiliserons une requ√™te SQL sp√©cifique pour traiter les donn√©es et une visualisation graphique pour repr√©senter les r√©sultats de mani√®re claire et interactive.


## M√©thodologie


La m√©thodologie adopt√©e pour cette analyse comporte deux √©tapes principales : le traitement des donn√©es via une requ√™te SQL et la visualisation des r√©sultats √† l'aide d'une biblioth√®que graphique. La requ√™te SQL est con√ßue pour calculer la moyenne mensuelle de la temp√©rature moyenne (TM) et pour appliquer un lissage sur 60 mois √† ces moyennes mensuelles. Les r√©sultats sont ensuite export√©s vers un dataframe Pandas qui est utilis√© pour cr√©er une visualisation interactive avec Bokeh, repr√©sentant la temp√©rature moyenne mensuelle brute et la s√©rie liss√©e sur 60 mois.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [2]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_64_previous-1950-2023_RR-T-Vent.csv.gz", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

‚úÖ Donn√©es charg√©es avec succ√®s


## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [3]:
# Ex√©cution de la requ√™te
df = run_query(""" WITH 
-- Calcul de la moyenne mensuelle de TM
monthly_avg_tm AS (
    SELECT 
        CAST(SUBSTRING("AAAAMMJJ", 1, 6) AS INTEGER) AS yyyymm,
        AVG(CAST("TM" AS DOUBLE)) AS avg_tm
    FROM 
        loaded_dataset
    WHERE 
        "TM" IS NOT NULL AND "TM" != 'None'
    GROUP BY 
        yyyymm
),
-- Calcul du lissage sur 60 mois de la moyenne mensuelle de TM
smoothed_avg_tm AS (
    SELECT 
        yyyymm,
        avg_tm,
        AVG(avg_tm) OVER (ORDER BY yyyymm ROWS BETWEEN 29 PRECEDING AND 30 FOLLOWING) AS smoothed_tm
    FROM 
        monthly_avg_tm
)
SELECT 
    yyyymm,
    avg_tm AS tm_moyenne_mensuelle,
    smoothed_tm AS tm_lissage_60_mois
FROM 
    smoothed_avg_tm
ORDER BY 
    yyyymm """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

R√©sultats : 888 lignes


Unnamed: 0,yyyymm,tm_moyenne_mensuelle,tm_lissage_60_mois
0,195001,6.309677,13.249556
1,195002,10.043636,13.460054
2,195003,9.653226,13.513486
3,195004,10.645,13.552179
4,195005,15.209836,13.45864


## üìà Visualisation

La biblioth√®que principale utilis√©e est Bokeh, qui permet de cr√©er des visualisations interactives et √©l√©gantes. Bokeh est adapt√©e pour repr√©senter des donn√©es temporelles comme ici, avec des fonctionnalit√©s telles que le zoom et les infobulles interactives. Cela permet une exploration d√©taill√©e et intuitive des donn√©es.

In [4]:
import pandas as pd
import duckdb as ddb
import pandas as pd
from bokeh.plotting import figure
from bokeh.models import ColumnDataSource, HoverTool, LinearAxis, DatetimeTickFormatter
from bokeh.transform import factor_cmap
from bokeh.palettes import Spectral4
from datetime import datetime
import numpy as np

# Conversion des colonnes yyyymm en datetime
df['date'] = pd.to_datetime(df['yyyymm'].astype(str), format='%Y%m')

# Pr√©paration des donn√©es
source = ColumnDataSource(data=dict(
    date=df['date'],
    tm_moyenne_mensuelle=df['tm_moyenne_mensuelle'],
    tm_lissage_60_mois=df['tm_lissage_60_mois'],
    yyyymm=df['yyyymm'].astype(str)
))

# Cr√©ation de la figure avec un design √©l√©gant
dataviz = figure(
    title="√âvolution de la temp√©rature moyenne mensuelle et lissage sur 60 mois",
    width=1000, height=500,
    x_axis_label=None,
    y_axis_label='Temp√©rature (¬∞C)',
    tools="pan,box_zoom,wheel_zoom,reset",
    toolbar_location="above",
    sizing_mode="stretch_width"
)

# Configuration de l'axe Y avec des limites appropri√©es
dataviz.y_range.start = df['tm_moyenne_mensuelle'].min() - 2
dataviz.y_range.end = df['tm_moyenne_mensuelle'].max() + 2

# Ajout des courbes avec des styles distinctifs
dataviz.line(
    x='date', y='tm_moyenne_mensuelle',
    source=source,
    line_color='#BDBDBD',
    line_width=1,
    alpha=0.7,
    legend_label='Temp√©rature brute'
)

dataviz.line(
    x='date', y='tm_lissage_60_mois',
    source=source,
    line_color='#E53E3E',
    line_width=2,
    alpha=0.9,
    legend_label='Lissage sur 60 mois'
)

# Configuration de l'axe X pour afficher les dates de mani√®re lisible
dataviz.xaxis.formatter = DatetimeTickFormatter(
    years="%Y",
    months="%m/%Y"
)
dataviz.xaxis.axis_label_text_font_size = "12pt"
dataviz.yaxis.axis_label_text_font_size = "12pt"

# Infobulle interactive et d√©taill√©e
hover = HoverTool(
    tooltips=[
        ('Date', '@yyyymm'),
        ('Temp√©rature brute', '@tm_moyenne_mensuelle{0.00} ¬∞C'),
        ('Lissage 60 mois', '@tm_lissage_60_mois{0.00} ¬∞C')
    ],
    mode='vline',
    line_policy='nearest',
    point_policy='snap_to_data'
)
dataviz.add_tools(hover)

# Stylisation du titre et de la l√©gende
dataviz.title.text_font_size = "14pt"
dataviz.title.text_font = "Helvetica Neue"
dataviz.legend.location = "top_left"
dataviz.legend.label_text_font_size = "11pt"
dataviz.legend.background_fill_alpha = 0.8
dataviz.legend.border_line_color = None

# Ajout de la grille avec des styles subtils
dataviz.grid.grid_line_alpha = 0.3
dataviz.grid.grid_line_color = '#CCCCCC'

# Fond transparent
dataviz.background_fill_color = None
dataviz.border_fill_color = None
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*

In [5]:

# --- Variables inject√©es par le script ---
FINAL_OBJECT_VARIABLE_NAME = 'dataviz'
OUTPUT_IMAGE_NAME = 'published\\notebooks\\duckit_analysis_20250801_211423.png'
OUTPUT_HTML_NAME = 'published\\notebooks\\duckit_analysis_20250801_211423.html'

# ===================================================================
# CELLULE INJECT√âE AUTOMATIQUEMENT (VERSION ROBUSTE)
# ===================================================================
import sys
import os
# On importe les modules n√©cessaires pour l'export au cas o√π
try:
    from bokeh.io import save as bokeh_save
except ImportError:
    bokeh_save = None

try:
    # On s'assure que le dossier de sortie existe
    output_dir = os.path.dirname(OUTPUT_IMAGE_NAME)
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)

    # On utilise globals().get() pour une r√©cup√©ration plus s√ªre
    final_object = globals().get(FINAL_OBJECT_VARIABLE_NAME)

    if final_object is None:
        # On l√®ve une NameError pour √™tre coh√©rent avec le code original
        raise NameError(f"name '{FINAL_OBJECT_VARIABLE_NAME}' is not defined")

    print(f"INFO: Variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e. Tentative d'exportation...")

    object_type = str(type(final_object))

    if 'plotly.graph_objs._figure.Figure' in object_type:
        print(f"--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.")
        # 1. Sauvegarde HTML pour l'interactivit√©
        print(f"--> Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.write_html(OUTPUT_HTML_NAME, include_plotlyjs='cdn')
        # 2. Sauvegarde PNG pour l'aper√ßu statique
        try:
            print(f"--> Tentative de sauvegarde PNG directe dans : {OUTPUT_IMAGE_NAME}")
            final_object.write_image(OUTPUT_IMAGE_NAME, scale=3, width=1200, height=800)
            print(f"--> Image Plotly sauvegard√©e avec succ√®s.")
        except Exception as e:
            print(f"AVERTISSEMENT: La sauvegarde directe en PNG a √©chou√© (kaleido est-il install√©?).", file=sys.stderr)
            print(f"   Erreur: {e}", file=sys.stderr)
            print(f"--> PLAN B: On va utiliser la capture d'√©cran du HTML √† la place.")
            # On cr√©e un fichier marqueur pour que le script de post-traitement prenne le relais
            with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
                f.write("plotly")
    elif 'folium.folium.Map' in object_type:
        print(f"--> D√©tect√© : Folium. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("folium")
    elif 'altair.vegalite' in object_type and hasattr(final_object, 'save'):
        print(f"--> D√©tect√© : Altair. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("altair")
    elif 'bokeh.plotting' in object_type and bokeh_save is not None:
        print(f"--> D√©tect√© : Bokeh. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        bokeh_save(final_object, filename=OUTPUT_HTML_NAME, title="")
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("bokeh")
    elif 'matplotlib.figure.Figure' in object_type:
        print(f"--> D√©tect√© : Matplotlib. Sauvegarde dans : {OUTPUT_IMAGE_NAME}")
        final_object.savefig(OUTPUT_IMAGE_NAME, dpi=300, bbox_inches='tight')
    else:
        print(f"AVERTISSEMENT: Type non support√© : {object_type}", file=sys.stderr)
except NameError:
    print(f"AVERTISSEMENT: Aucune variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e.", file=sys.stderr)
except Exception as e:
    print(f"ERREUR lors de l'exportation : {e}", file=sys.stderr)


INFO: Variable 'dataviz' trouv√©e. Tentative d'exportation...
--> D√©tect√© : Bokeh. Sauvegarde HTML dans : published\notebooks\duckit_analysis_20250801_211423.html
--> Cr√©ation du marqueur de capture d'√©cran.


  bokeh_save(final_object, filename=OUTPUT_HTML_NAME, title="")
