# Analyse de la temp√©rature maximale annuelle en France : √âvolution et tendances

L'analyse pr√©sent√©e dans ce notebook se concentre sur l'√©volution des temp√©ratures maximales annuelles en France, en examinant les donn√©es quotidiennes de temp√©rature relev√©es dans diverses stations m√©t√©orologiques entre 1950 et 2023. Les donn√©es utilis√©es proviennent du fichier `Q_64_previous-1950-2023_RR-T-Vent.csv.gz`, disponible √† l'adresse https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_64_previous-1950-2023_RR-T-Vent.csv.gz. Ce fichier contient des informations m√©t√©orologiques quotidiennes, notamment les temp√©ratures minimales, maximales et moyennes, ainsi que les pr√©cipitations et la vitesse du vent.

L'objectif principal de cette analyse est de calculer la moyenne des 10 plus hautes temp√©ratures maximales par an et de tracer une courbe repr√©sentant cette moyenne sur la p√©riode √©tudi√©e. Cela permettra d'identifier les tendances et les variations dans les temp√©ratures maximales annuelles en France. L'analyse inclut √©galement un lissage sur 5 ans pour att√©nuer les fluctuations annuelles et une tendance lin√©aire pour visualiser l'√©volution globale.

## M√©thodologie

La m√©thodologie utilis√©e dans cette analyse implique plusieurs √©tapes cl√©s. Tout d'abord, les donn√©es sont charg√©es et filtr√©es pour ne conserver que les enregistrements avec des valeurs de temp√©rature maximale (`TX`) non nulles. Ensuite, une requ√™te SQL utilisant DuckDB est ex√©cut√©e pour calculer la moyenne des 10 plus hautes temp√©ratures maximales par an. Cette requ√™te implique une s√©lection des donn√©es quotidiennes avec des temp√©ratures maximales non nulles, un classement de ces temp√©ratures par ordre d√©croissant pour chaque ann√©e, et enfin, un calcul de la moyenne des 10 premi√®res valeurs pour chaque ann√©e. Les r√©sultats sont ensuite visualis√©s √† l'aide de Plotly pour cr√©er une courbe repr√©sentant la moyenne annuelle des 10 temp√©ratures maximales, ainsi qu'une courbe de lissage sur 5 ans et une tendance lin√©aire.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [2]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_64_previous-1950-2023_RR-T-Vent.csv.gz", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

‚úÖ Donn√©es charg√©es avec succ√®s


## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [3]:
# Ex√©cution de la requ√™te
df = run_query(""" WITH daily_max_temp AS (
  SELECT 
    CAST(SUBSTRING("AAAAMMJJ", 1, 4) AS INTEGER) AS year,
    CAST("TX" AS DOUBLE) AS tx_double
  FROM 
    loaded_dataset
  WHERE 
    "TX" IS NOT NULL AND "TX" != ''
),
top_10_temp_per_year AS (
  SELECT 
    year, 
    tx_double,
    ROW_NUMBER() OVER (PARTITION BY year ORDER BY tx_double DESC) AS row_num
  FROM 
    daily_max_temp
)
SELECT 
  year, 
  AVG(tx_double) AS avg_top_10_tx
FROM 
  top_10_temp_per_year
WHERE 
  row_num <= 10
GROUP BY 
  year
ORDER BY 
  year """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

R√©sultats : 74 lignes


Unnamed: 0,year,avg_top_10_tx
0,1950,37.66
1,1951,35.99
2,1952,35.37
3,1953,35.9
4,1954,34.39


## üìà Visualisation

La biblioth√®que principale utilis√©e est Plotly, qui est adapt√©e pour cr√©er des visualisations interactives de donn√©es. Plotly permet de repr√©senter les donn√©es de mani√®re claire et d√©taill√©e, avec des fonctionnalit√©s telles que le survol des donn√©es pour afficher des informations suppl√©mentaires. Cela rend la visualisation plus engageante et plus facile √† comprendre.

In [4]:
import pandas as pd
import duckdb as ddb
import plotly.graph_objects as go
import pandas as pd
import numpy as np

df = df.sort_values('year')

df['moyenne_mobile_5ans'] = df['avg_top_10_tx'].rolling(window=5, center=True).mean()

z = np.polyfit(df['year'], df['avg_top_10_tx'], 1)
p = np.poly1d(z)
df['tendance'] = p(df['year'])

dataviz = go.Figure()

dataviz.add_trace(go.Scatter(
    x=df['year'],
    y=df['avg_top_10_tx'],
    mode='lines+markers',
    name='Moyenne des 10 plus hautes Tx',
    line=dict(color='#d62728', width=2),
    hovertemplate='%{y:.2f} ¬∞C<br>ann√©e : %{x}<br>'
))

dataviz.add_trace(go.Scatter(
    x=df['year'],
    y=df['moyenne_mobile_5ans'],
    mode='lines',
    name='Lissage 5 ans',
    line=dict(color='steelblue', width=3),
    hovertemplate='%{y:.2f} ¬∞C<br>ann√©e : %{x}<br>'
))

dataviz.add_trace(go.Scatter(
    x=df['year'],
    y=df['tendance'],
    mode='lines',
    name='Tendance lin√©aire',
    line=dict(color='forestgreen', width=2, dash='dash'),
    hovertemplate='%{y:.2f} ¬∞C<br>ann√©e : %{x}<br>'
))

dataviz.update_layout(
    title=dict(
        text="Moyenne annuelle des 10 temp√©ratures maximales<br>avec lissage sur 5 ans et tendance",
        font=dict(size=16)
    ),
    xaxis_title='Ann√©e',
    yaxis_title='Temp√©rature (¬∞C)',
    hovermode='x unified',
    template='plotly_white',
    margin=dict(l=40, r=40, t=80, b=40),
    legend=dict(
        orientation='h',
        yanchor='bottom',
        y=-0.25,
        xanchor='center',
        x=0.5
    )
)
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*

In [5]:

# --- Variables inject√©es par le script ---
FINAL_OBJECT_VARIABLE_NAME = 'dataviz'
OUTPUT_IMAGE_NAME = 'published\\notebooks\\duckit_analysis_test.png'
OUTPUT_HTML_NAME = 'published\\notebooks\\duckit_analysis_test.html'

# ===================================================================
# CELLULE INJECT√âE AUTOMATIQUEMENT (VERSION ROBUSTE)
# ===================================================================
import sys
import os
# On importe les modules n√©cessaires pour l'export au cas o√π
try:
    from bokeh.io import save as bokeh_save
except ImportError:
    bokeh_save = None

try:
    # On s'assure que le dossier de sortie existe
    output_dir = os.path.dirname(OUTPUT_IMAGE_NAME)
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)

    # On utilise globals().get() pour une r√©cup√©ration plus s√ªre
    final_object = globals().get(FINAL_OBJECT_VARIABLE_NAME)

    if final_object is None:
        # On l√®ve une NameError pour √™tre coh√©rent avec le code original
        raise NameError(f"name '{FINAL_OBJECT_VARIABLE_NAME}' is not defined")

    print(f"INFO: Variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e. Tentative d'exportation...")

    object_type = str(type(final_object))

    if 'plotly.graph_objs._figure.Figure' in object_type:
        print(f"--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.")
        # 1. Sauvegarde HTML pour l'interactivit√©
        print(f"--> Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.write_html(OUTPUT_HTML_NAME, include_plotlyjs='cdn')
        # 2. Sauvegarde PNG pour l'aper√ßu statique
        try:
            print(f"--> Tentative de sauvegarde PNG directe dans : {OUTPUT_IMAGE_NAME}")
            final_object.write_image(OUTPUT_IMAGE_NAME, scale=3, width=1200, height=800)
            print(f"--> Image Plotly sauvegard√©e avec succ√®s.")
        except Exception as e:
            print(f"AVERTISSESEMENT: La sauvegarde directe en PNG a √©chou√© (kaleido est-il install√©?). L'image statique ne sera pas g√©n√©r√©e.", file=sys.stderr)
            print(f"   Erreur: {e}", file=sys.stderr)
    elif 'folium.folium.Map' in object_type:
        print(f"--> D√©tect√© : Folium. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur pour que le script de post-traitement sache qu'il s'agit de Folium
        with open(f"{OUTPUT_HTML_NAME}.is_folium", "w") as f:
            f.write("true")
    elif 'altair.vegalite' in object_type and hasattr(final_object, 'save'):
        print(f"--> D√©tect√© : Altair. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
    elif 'bokeh.plotting' in object_type and bokeh_save is not None:
        print(f"--> D√©tect√© : Bokeh. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        bokeh_save(final_object, filename=OUTPUT_HTML_NAME, title="")
    elif 'matplotlib.figure.Figure' in object_type:
        print(f"--> D√©tect√© : Matplotlib. Sauvegarde dans : {OUTPUT_IMAGE_NAME}")
        final_object.savefig(OUTPUT_IMAGE_NAME, dpi=300, bbox_inches='tight')
    else:
        print(f"AVERTISSEMENT: Type non support√© : {object_type}", file=sys.stderr)
except NameError:
    print(f"AVERTISSEMENT: Aucune variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e.", file=sys.stderr)
except Exception as e:
    print(f"ERREUR lors de l'exportation : {e}", file=sys.stderr)


INFO: Variable 'dataviz' trouv√©e. Tentative d'exportation...
--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.
--> Sauvegarde HTML dans : published\notebooks\duckit_analysis_test.html
--> Tentative de sauvegarde PNG directe dans : published\notebooks\duckit_analysis_test.png


--> Image Plotly sauvegard√©e avec succ√®s.
