# Cartographie de la Temp√©rature Moyenne des Postes M√©t√©o en France


Le pr√©sent notebook est consacr√© √† l'analyse et √† la visualisation des donn√©es m√©t√©orologiques issues de divers postes de mesure en France. Les donn√©es utilis√©es proviennent du fichier `Q_64_previous-1950-2023_RR-T-Vent.csv.gz`, disponible √† l'adresse https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_64_previous-1950-2023_RR-T-Vent.csv.gz. Ce fichier contient des informations m√©t√©orologiques recueillies √† partir de divers postes de mesure, notamment la temp√©rature, les pr√©cipitations, et la vitesse du vent.


L'objectif de cette analyse est de pr√©parer les donn√©es pour une carte repr√©sentant les postes de mesure avec leur temp√©rature moyenne respective. Cette visualisation permettra d'appr√©hender la r√©partition g√©ographique des temp√©ratures moyennes en France.


## M√©thodologie

La m√©thodologie employ√©e pour cette analyse comporte plusieurs √©tapes cl√©s. Tout d'abord, les donn√©es sont charg√©es et nettoy√©es. Ensuite, une requ√™te SQL est ex√©cut√©e via DuckDB pour agr√©ger les donn√©es par poste de mesure et calculer la moyenne de la temp√©rature moyenne (`TM`) pour chaque ann√©e. Les r√©sultats sont ensuite utilis√©s pour cr√©er une visualisation interactive sous forme de carte utilisant la biblioth√®que Folium. Les postes de mesure sont repr√©sent√©s par des cercles dont la couleur est fonction de la temp√©rature moyenne enregistr√©e.


Les donn√©es sont ainsi analys√©es et repr√©sent√©es de mani√®re √† offrir une vue d'ensemble claire et intuitive de la r√©partition des temp√©ratures moyennes en France. Cette visualisation facilite l'identification des tendances et des disparit√©s r√©gionales en mati√®re de temp√©rature.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [1]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://object.files.data.gouv.fr/meteofrance/data/synchro_ftp/BASE/QUOT/Q_64_previous-1950-2023_RR-T-Vent.csv.gz", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [2]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
  CAST(SUBSTRING("AAAAMMJJ", 1, 4) AS INTEGER) AS year,
  "NUM_POSTE",
  CAST("LON" AS DOUBLE) AS longitude,
  CAST("LAT" AS DOUBLE) AS latitude,
  AVG(CAST("TM" AS DOUBLE)) AS avg_TM
FROM 
  loaded_dataset
WHERE 
  "TM" IS NOT NULL
GROUP BY 
  "NUM_POSTE", "LON", "LAT", CAST(SUBSTRING("AAAAMMJJ", 1, 4) AS INTEGER)
ORDER BY 
  year """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

## üìà Visualisation

La biblioth√®que principale utilis√©e est Folium, qui est une surcouche de Leaflet.js permettant de cr√©er des cartes interactives. Cette technologie est adapt√©e pour repr√©senter des donn√©es g√©olocalis√©es avec des marqueurs et des informations associ√©es, comme c'est le cas ici avec les temp√©ratures moyennes par poste. Folium permet de cr√©er une visualisation interactive et intuitive.

In [3]:
import pandas as pd
import duckdb as ddb
import folium
import branca.colormap as cm

color_scale = cm.LinearColormap(colors=['dodgerblue', 'orangered'],
                                 index=[df['avg_TM'].min(), df['avg_TM'].max()],
                                 vmin=df['avg_TM'].min(), vmax=df['avg_TM'].max(),
                                 caption='Temp√©rature moyenne (¬∞C)')

# ordre croissant pour superposer les plus froid en-dessous
coords = df[['latitude', 'longitude', 'NUM_POSTE', 'avg_TM']].sort_values('avg_TM')

m = folium.Map(location=[coords.latitude.mean(), coords.longitude.mean()],
               tiles='CartoDB positron', zoom_start=8)

for _, row in coords.iterrows():
    folium.CircleMarker(
        location=[row.latitude, row.longitude],
        radius=6,
        color='black',
        weight=0.5,
        fillColor=color_scale(row.avg_TM),
        fillOpacity=0.85,
        popup=None,
        tooltip=f"<b>Poste&nbsp;n¬∞{int(row.NUM_POSTE)}</b><br>{row.avg_TM:.2f}¬∞C"
    ).add_to(m)

color_scale.add_to(m)

dataviz = m
dataviz.show()

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*