# Cartographie des Pr√©cipitations du 9 Octobre 2024


L'objectif de cette analyse est de pr√©parer les donn√©es pour une carte du volume de pr√©cipitation par poste pour le 9 octobre 2024. Le fichier de donn√©es utilis√© provient du site data.gouv.fr et contient des donn√©es m√©t√©orologiques journali√®res relev√©es √† partir de diff√©rents postes m√©t√©orologiques. L'URL source est : https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_95_latest-2024-2025_RR-T-Vent.csv.gz. Ce fichier est particuli√®rement utile pour analyser les tendances climatiques et cartographier les donn√©es m√©t√©orologiques.


Les donn√©es incluent diverses mesures telles que les pr√©cipitations, les temp√©ratures minimales et maximales, la vitesse du vent, etc. Pour cette analyse, nous nous concentrerons sur les pr√©cipitations relev√©es le 9 octobre 2024. Nous utiliserons les champs `NUM_POSTE`, `LAT`, `LON`, et `RR` pour cr√©er une carte repr√©sentant le volume de pr√©cipitation par poste.


## M√©thodologie


La m√©thodologie utilis√©e pour cette analyse comporte plusieurs √©tapes. Tout d'abord, nous avons s√©lectionn√© les donn√©es pertinentes en utilisant une requ√™te SQL pour filtrer les donn√©es du 9 octobre 2024 et ne garder que celles de bonne qualit√© (`QRR = '1'`). Les donn√©es ont ensuite √©t√© trait√©es et visualis√©es √† l'aide de biblioth√®ques Python telles que `duckdb`, `pandas`, `plotly`, et `geopandas`. La visualisation finale est une carte interactive repr√©sentant le volume de pr√©cipitation par poste.


La carte est cr√©√©e en utilisant `plotly.express` et `geopandas` pour superposer les donn√©es de pr√©cipitation sur une carte du d√©partement 95. Les pr√©cipitations sont repr√©sent√©es par des cercles dont la taille et la couleur varient en fonction du volume de pr√©cipitation. Cette visualisation permet une compr√©hension facile et intuitive de la distribution des pr√©cipitations dans la r√©gion.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [2]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_95_latest-2024-2025_RR-T-Vent.csv.gz", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

‚úÖ Donn√©es charg√©es avec succ√®s


## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [3]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
  "NUM_POSTE",
  CAST("RR" AS DOUBLE) AS precipitation_volume,
  "LAT",
  "LON"
FROM 
  loaded_dataset
WHERE 
  CAST("AAAAMMJJ" AS VARCHAR) = '20241009'
  AND "QRR" = '1'  -- On ne garde que les donn√©es de pr√©cipitation de bonne qualit√©
ORDER BY 
  "NUM_POSTE" """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

R√©sultats : 6 lignes


Unnamed: 0,NUM_POSTE,precipitation_volume,LAT,LON
0,95078001,48.8,49.090333,2.0285
1,95088001,69.6,48.967333,2.427667
2,95492001,71.2,49.040333,2.406667
3,95527001,69.8,49.015167,2.534333
4,95580001,71.0,49.085667,2.550667


## üìà Visualisation

La biblioth√®que principale utilis√©e est Plotly, qui permet de cr√©er des visualisations interactives et personnalisables. Cette technologie est adapt√©e pour repr√©senter des donn√©es g√©ospatiales, comme dans ce cas, o√π des donn√©es de pr√©cipitation sont superpos√©es √† une carte. Plotly offre une grande flexibilit√© pour cr√©er des cartes interactives avec des informations d√©taill√©es.

In [4]:
import pandas as pd
import duckdb as ddb
import plotly.express as px
import plotly.graph_objects as go
import geopandas as gpd
import pandas as pd

df['LAT'] = df['LAT'].astype(float)
df['LON'] = df['LON'].astype(float)

url = 'https://france-geojson.gregoiredavid.fr/repo/departements.geojson'
deps = gpd.read_file(url)
deps = deps.to_crs(4326)
dep95 = deps[deps['code'] == '95']

fig = px.choropleth_mapbox(
    dep95,
    geojson=dep95.geometry,
    locations=dep95.index,
    color_discrete_sequence=['#f0f0f0'],
    opacity=0.4,
    center=dict(lat=49.0, lon=2.15),
    zoom=9.2,
    mapbox_style='carto-positron',
)

fig.add_trace(
    go.Scattermapbox(
        lat=df['LAT'],
        lon=df['LON'],
        mode='markers',
        marker=dict(
            size=df['precipitation_volume'] * 0.2,
            color=df['precipitation_volume'],
            colorscale='Blues',
            showscale=True,
            colorbar=dict(
                title="Pr√©cip.<br>(mm)",
                thickness=15,
                x=0.98,
                y=0.5,
                len=0.7
            )
        ),
        text=[f"Poste {n}<br>{v} mm" for n, v in zip(df['NUM_POSTE'], df['precipitation_volume'])],
        hovertemplate="%{text}<extra></extra>",
        showlegend=False,
    )
)

fig.update_layout(
    title=dict(
        text="Volume de pr√©cipitation par poste le 9 octobre 2024",
        x=0.5,
        font=dict(size=16, family='DejaVu Sans')
    ),
    annotations=[
        dict(
            text="Source : donn√©es station m√©t√©o IDF le 9/10/24",
            x=1,
            y=-0.02,
            showarrow=False,
            font=dict(size=11, color="gray"),
            xanchor='right'
        )
    ],
    margin=dict(l=0, r=0, t=50, b=0),
    height=700,
)

dataviz = fig
dataviz

  fig = px.choropleth_mapbox(



*scattermapbox* is deprecated! Use *scattermap* instead. Learn more at: https://plotly.com/python/mapbox-to-maplibre/



---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*

In [5]:

# --- Variables inject√©es par le script ---
FINAL_OBJECT_VARIABLE_NAME = 'dataviz'
OUTPUT_IMAGE_NAME = 'published\\notebooks\\duckit_analysis_20250804_065809.png'
OUTPUT_HTML_NAME = 'published\\notebooks\\duckit_analysis_20250804_065809.html'

# ===================================================================
# CELLULE INJECT√âE AUTOMATIQUEMENT (VERSION ROBUSTE)
# ===================================================================
import sys
import os
# On importe les modules n√©cessaires pour l'export au cas o√π
try:
    from bokeh.io import save as bokeh_save
except ImportError:
    bokeh_save = None

try:
    # On s'assure que le dossier de sortie existe
    output_dir = os.path.dirname(OUTPUT_IMAGE_NAME)
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)

    # On utilise globals().get() pour une r√©cup√©ration plus s√ªre
    final_object = globals().get(FINAL_OBJECT_VARIABLE_NAME)

    if final_object is None:
        # On l√®ve une NameError pour √™tre coh√©rent avec le code original
        raise NameError(f"name '{FINAL_OBJECT_VARIABLE_NAME}' is not defined")

    print(f"INFO: Variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e. Tentative d'exportation...")

    object_type = str(type(final_object))

    if 'plotly.graph_objs._figure.Figure' in object_type:
        print(f"--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.")
        # 1. Sauvegarde HTML pour l'interactivit√©
        print(f"--> Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.write_html(OUTPUT_HTML_NAME, include_plotlyjs='cdn')
        # 2. Sauvegarde PNG pour l'aper√ßu statique
        try:
            print(f"--> Tentative de sauvegarde PNG directe dans : {OUTPUT_IMAGE_NAME}")
            final_object.write_image(OUTPUT_IMAGE_NAME, scale=3, width=1200, height=800)
            print(f"--> Image Plotly sauvegard√©e avec succ√®s.")
        except Exception as e:
            print(f"AVERTISSEMENT: La sauvegarde directe en PNG a √©chou√© (kaleido est-il install√©?).", file=sys.stderr)
            print(f"   Erreur: {e}", file=sys.stderr)
            print(f"--> PLAN B: On va utiliser la capture d'√©cran du HTML √† la place.")
            # On cr√©e un fichier marqueur pour que le script de post-traitement prenne le relais
            with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
                f.write("plotly")
    elif 'folium.folium.Map' in object_type:
        print(f"--> D√©tect√© : Folium. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("folium")
    elif 'altair.vegalite' in object_type and hasattr(final_object, 'save'):
        print(f"--> D√©tect√© : Altair. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("altair")
    elif 'bokeh.plotting' in object_type and bokeh_save is not None:
        print(f"--> D√©tect√© : Bokeh. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        bokeh_save(final_object, filename=OUTPUT_HTML_NAME, title="")
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("bokeh")
    elif 'matplotlib.figure.Figure' in object_type:
        print(f"--> D√©tect√© : Matplotlib. Sauvegarde dans : {OUTPUT_IMAGE_NAME}")
        final_object.savefig(OUTPUT_IMAGE_NAME, dpi=300, bbox_inches='tight')
    else:
        print(f"AVERTISSEMENT: Type non support√© : {object_type}", file=sys.stderr)
except NameError:
    print(f"AVERTISSEMENT: Aucune variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e.", file=sys.stderr)
except Exception as e:
    print(f"ERREUR lors de l'exportation : {e}", file=sys.stderr)


INFO: Variable 'dataviz' trouv√©e. Tentative d'exportation...
--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.
--> Sauvegarde HTML dans : published\notebooks\duckit_analysis_20250804_065809.html
--> Tentative de sauvegarde PNG directe dans : published\notebooks\duckit_analysis_20250804_065809.png


--> Image Plotly sauvegard√©e avec succ√®s.
