# Opendata meteofrance

## Présentation des données

Données climatologiques de toutes les stations de métropole et d'outre-mer depuis leur ouverture, pour tous les paramètres disponibles. Ces données ont subi un contrôle climatologique.

### Informations techniques

Les données quotidiennes sont proposées en téléchargement, par département, et par lots de période au format csv compressé
L'ensemble des paramètres est fourni pour l'ensemble des stations météorologiques
La mise à jour des fichiers est annuelle pour les historiques avant 1950, mensuelles pour les fichiers de 1950 jusqu'à l'année -2 et quotidiennes pour les deux dernières années

Sources:

* https://meteo.data.gouv.fr/datasets/6569b51ae64326786e4e8e1a

Data:

* [QUOT_departement_33_periode_1842-1949_RR-T-Vent](https://www.data.gouv.fr/fr/datasets/r/bd7854d9-548b-4b3c-bbaa-8586a7060dba)
* [QUOT_departement_33_periode_1950-2021_RR-T-Vent](https://www.data.gouv.fr/fr/datasets/r/b0e78f3d-9085-4d6d-a47d-6d942f5e9a54)
* [QUOT_departement_33_periode_2023-2024_RR-T-Vent](https://www.data.gouv.fr/fr/datasets/r/5f196a76-ba4f-4aa7-af28-eff6c8797b50)


### Q_descriptif_champs_RR-T-Vent.csv

```
NUM_POSTE   : numéro Météo-France du poste sur 8 chiffres
NOM_USUEL   : nom usuel du poste
LAT         : latitude, négative au sud (en degrés et millionièmes de degré)
LON         : longitude, négative à l’ouest de GREENWICH (en degrés et millionièmes de degré)
ALTI        : altitude du pied de l'abri ou du pluviomètre si pas d'abri (en m)
AAAAMMJJ    : date de la mesure (année mois jour)
RR          : quantité de précipitation tombée en 24 heures (de 06h FU le jour J à 06h FU le jour J+1). La valeur relevée à J+1 est affectée au jour J (en mm et 1/10)
TN          : température minimale sous abri (en °C et 1/10)
HTN         : heure de TN (hhmm)
TX          : température maximale sous abri (en °C et 1/10)
HTX         : heure de TX (hhmm)
TM          : moyenne quotidienne des températures horaires sous abri (en °C et 1/10)
TNTXM       : moyenne quotidienne (TN+TX)/2 (en °C et 1/10)
TAMPLI      : amplitude thermique quotidienne : écart entre TX et TN quotidiens (TX-TN) (en °C et 1/10)
TNSOL       : température quotidienne minimale à 10 cm au-dessus du sol (en °C et 1/10)
TN50        : température quotidienne minimale à 50 cm au-dessus du sol (en °C et 1/10)
DG          : durée de gel sous abri (T ≤ 0°C) (en mn)
FFM         : moyenne quotidienne de la force du vent moyenné sur 10 mn, à 10 m (en m/s et 1/10)
FF2M        : moyenne quotidienne de la force du vent moyenné sur 10 mn, à 2 m (en m/s et 1/10)
FXY         : maximum quotidien de la force maximale horaire du vent moyenné sur 10 mn, à 10 m (en m/s et 1/10)
DXY         : direction de FXY (en rose de 360)
HXY         : heure de FXY (hhmm)
FXI         : maximum quotidien de la force maximale horaire du vent instantané, à 10 m (en m/s et 1/10)
DXI         : direction de FXI (en rose de 360)
HXI         : heure de FXI (hhmm)
FXI2        : maximum quotidien de la force maximale horaire du vent instantané, à 2 m (en m/s et 1/10)
DXI2        : direction de FXI2 (en rose de 360)
HXI2        : heure de FXI2 (hhmm)
FXI3S       : maximum quotidien de la force maximale horaire du vent moyenné sur 3 s, à 10 m (en m/s et 1/10)
DXI3S       : direction de FXI3S (en rose de 360)
HXI3S       : heure de FXI3S (hhmm)

A chaque donnée est associé un code qualité (ex: T;QT) :
 9 : donnée filtrée (la donnée a passé les filtres/contrôles de premiers niveaux)
 0 : donnée protégée (la donnée a été validée définitivement par le climatologue)
 1 : donnée validée (la donnée a été validée par contrôle automatique ou par le climatologue)
 2 : donnée douteuse en cours de vérification (la donnée a été mise en doute par contrôle automatique)
 
```

## Calcul du nombre de jour "situation inhabituelle" pour le SIBA



```
Les notions de « fortes pluies » et d’ « inondation » manquant de précision et pouvant être sujettes à interprétation, il avait été proposé fin 2016, après une analyse statistique des situations rencontrées lors des différents épisodes pluvieux enregistrés de 2013 à 2016, que soit déclaré au niveau du Bassin d’Arcachon « situation inhabituelle » lorsque les précipitations cumulées sur 7 jours consécutifs dépassent 70 mm. 
```

[Source plainte adeba contre le siba](https://adeba.fr/index.php/2023/12/31/plainte-contre-le-siba-pour-pollution-des-eaux-du-bassin/)


## Objectif

Le but de cette feuille de calcul est de verifier le caractère inhabituel de 70mm de precipitation cumulées sur 7 jours consécutifs

In [45]:
import glob
import os

import pandas as pd

q_33_csv = glob.glob(os.path.join("data", "Q_33_*.csv"))

q_33_csv                   

['data/Q_33_1842-1949_RR-T-Vent.csv',
 'data/Q_33_latest-2023-2024_RR-T-Vent.csv',
 'data/Q_33_previous-1950-2021_RR-T-Vent.csv']

In [46]:
df = pd.concat((pd.read_csv(f, delimiter=";") for f in q_33_csv), ignore_index=True)

## Precipitations sur les 7 derniers jours

La somme sur les 7 derniers jours des precipitations.

In [47]:
from IPython.display import display
df['DATE'] = pd.to_datetime(df['AAAAMMJJ'], format='%Y%m%d')
df['YEAR'] = df['DATE'].dt.year
df_sorted = df[df['NOM_USUEL'].isin(["ARCACHON", "AUDENGE AGGLOMERATION", "ANDERNOS", "ARES", "CAP-FERRET"])].sort_values(by=['NOM_USUEL', 'DATE'])

df_sorted['SLIDING_RR7'] = df_sorted.groupby('NOM_USUEL')['RR'].rolling(window=7, min_periods=1).sum().reset_index(0, drop=True)

df_sorted.describe()



Unnamed: 0,NUM_POSTE,LAT,LON,ALTI,AAAAMMJJ,RR,QRR,TN,QTN,HTN,...,FXI3S,QFXI3S,DXI3S,QDXI3S,HXI3S,QHXI3S,QFXI2,DATE,YEAR,SLIDING_RR7
count,93536.0,93536.0,93536.0,93536.0,93536.0,93094.0,93095.0,60684.0,60684.0,19729.0,...,4634.0,4661.0,0.0,27.0,4634.0,4661.0,0.0,93536,93536.0,93152.0
mean,33093510.0,44.687795,-1.169036,5.006928,19557910.0,2.354111,1.257887,9.871861,3.382572,745.640681,...,12.288779,1.001716,,1.0,1230.307078,8.927912,,1956-03-22 07:40:10.571330816,1955.724074,16.465258
min,33009000.0,44.630667,-1.252,2.0,18820100.0,0.0,1.0,-13.8,1.0,0.0,...,3.5,1.0,,1.0,0.0,1.0,,1882-01-01 00:00:00,1882.0,0.0
25%,33011000.0,44.630667,-1.252,2.0,19260220.0,0.0,1.0,6.0,1.0,412.0,...,8.9,1.0,,1.0,536.0,9.0,,1926-02-21 00:00:00,1926.0,2.0
50%,33011000.0,44.663333,-1.15,4.0,19650910.0,0.0,1.0,10.0,1.0,534.0,...,11.0,1.0,,1.0,1410.0,9.0,,1965-09-08 12:00:00,1965.0,10.0
75%,33236000.0,44.77,-1.135,8.0,19871220.0,2.3,1.0,14.4,9.0,745.0,...,14.1,1.0,,1.0,1758.75,9.0,,1987-12-19 00:00:00,1987.0,24.0
max,33236000.0,44.77,-1.013333,8.0,20240100.0,121.1,9.0,25.3,9.0,2359.0,...,42.3,9.0,,1.0,2359.0,9.0,,2024-01-02 00:00:00,2024.0,176.0
std,108092.5,0.059284,0.073023,2.552615,391151.7,5.076927,1.413015,5.69832,3.658435,609.150578,...,5.11238,0.117179,,0.0,740.888733,0.75606,,,39.115189,19.137067


In [48]:
import plotly.express as px
import plotly.io as pio

fig = px.line(df_sorted, x='DATE', y='RR', color='NOM_USUEL', title='Precipitation sur le Bassin d\'Arcachon')
fig.update_layout(xaxis_title='Date', yaxis_title='Precipitation (mm)', legend_title='Station')
fig.show()

pio.write_image(fig, 'results/precipitation_ba.png')



### Commentaire sur les données

Les series temporelles de Météo-France autour du bassin d’Arcachon ne sont pas complètes sur les 141 ans de l'interval (1882-2023) cependant grace au 4 stations (Arcachon, Ares, Audenge, Cap-Ferret) il est possible de verifier la coherence des données et leur relative homogénéité.

Pour la suite de l'étude nous concentrerons notre attention sur la station du Cap-Ferret elle offre la série la plus complete sur le dernier siecle.

### Vérification des données 

Verification manuelle des donnée pour le `CAP-FERRET` en 2023.

#### Filtrage des données

Filtrage des données pour compter le nombre **d'evenment inabituel** par année.

In [52]:
df_filtered_cap_ferret_2023 = df_sorted[(df_sorted['NOM_USUEL'] == "CAP-FERRET") & (df_sorted['YEAR'] == 2023)][['DATE','RR', 'SLIDING_RR7']]

def highlight(row):
    if row['SLIDING_RR7'] >= 70:
        return ['background-color: yellow; color: #00008B'] * len(row)
    else:
        return [''] * len(row)

display(df_filtered_cap_ferret_2023.style.apply(highlight, axis=1))


Unnamed: 0,DATE,RR,SLIDING_RR7
715142,2023-01-01 00:00:00,2.4,32.6
715143,2023-01-02 00:00:00,0.0,23.1
715144,2023-01-03 00:00:00,0.2,15.9
715145,2023-01-04 00:00:00,0.0,3.2
715146,2023-01-05 00:00:00,0.0,2.8
715147,2023-01-06 00:00:00,0.0,2.6
715148,2023-01-07 00:00:00,16.3,18.9
715149,2023-01-08 00:00:00,3.4,19.9
715150,2023-01-09 00:00:00,0.4,20.3
715151,2023-01-10 00:00:00,1.4,21.5


In [53]:

df_filtered = df_sorted[df_sorted['SLIDING_RR7'] > 70]
days_count = df_filtered.groupby(['NOM_USUEL', 'YEAR']).size().reset_index(name='COUNT')

def highlight(row):
    if row['COUNT'] >= 10:
        return ['background-color: #FFDAB9; color: #00008B'] * len(row)
    else:
        return [''] * len(row)

display(days_count.style.apply(highlight, axis=1))


Unnamed: 0,NOM_USUEL,YEAR,COUNT
0,ARCACHON,1947,10
1,ARCACHON,1949,10
2,ARCACHON,1950,7
3,ARCACHON,1952,6
4,ARCACHON,1955,3
5,ARCACHON,1958,9
6,ARCACHON,1959,13
7,ARCACHON,1960,22
8,ARCACHON,1961,17
9,ARCACHON,1964,8


In [51]:
fig = px.bar(days_count, x='YEAR', y='COUNT', color='NOM_USUEL', facet_col='NOM_USUEL', facet_col_wrap=1, title='Nombre de jour avec plus de 70mm de précipitation cumulées sur 7j')
fig.update_layout(xaxis_title='Année', yaxis_title='Nombre de jour', legend_title='Station Metéo')
fig.update_layout(width=1200, height=1000)  # Set the width to full and increase the height
fig.show()
pio.write_image(fig, 'results/nb_days_plus_de70mm_par_7j_ba.png')


## Conclusion

Le graphique ci dessus montre que la définition `évenement inhabituel` retenue par le SIBA de 70mm de precipitation sur 7 jours glissant n'est en fait pas inhabituel. Depuis 1882 autour du bassin on peut observer plusieurs fois par décennie des années avec plus de 10 événements inhabituels. 

Il est également intéressant de remarquer que contrairement a certain element de language du SIBA le nombre de événement inhabituel par an n'a pas explosé dans la dernière décennie. Le record date de 1882 a AUDENGE avec 40 jours inhabituels.