# Analyse complète des données de vent ERA5 (France, Janv-Août 2022)

Ce notebook propose une analyse progressive des données de vent ERA5 pour la France entre janvier et août 2022.

## 1. Importation & Fusion des Données

- Chargement des fichiers CSV mensuels de janvier à août 2022.
- Fusion dans un seul DataFrame Pandas via pd.concat.
- Conversion de la colonne 'time' en datetime.
- Ajout de colonnes : 'mois', 'jour', 'heure' à partir de 'time'.

## 2. Exploration Basique

- Afficher la structure : df.shape, df.dtypes.
- Résumé statistique : df.describe().
- Vérification des valeurs manquantes : df.isna().sum().
- Distribution mensuelle et journalière : df['mois'].value_counts().
- Intervalle temporel : df['time'].min() à df['time'].max().
- Étendue géographique : latitude et longitude min/max.

## 3. Visualisations Simples

- Série temporelle de la vitesse moyenne quotidienne (wind_speed_10m).
- Boxplot de la vitesse par heure pour visualiser les cycles journaliers.
- Heatmap moyenne du vent à 10m sur la grille lat/lon.
- Histogramme des vitesses moyennes et rafales (gust).
- Nuage de points u10 vs v10 pour l'analyse directionnelle.

## 4. Analyse Temporelle Avancée

- Moyennes par heure, jour, semaine et mois pour détection de patterns.
- Rolling mean (ex. : sur 7 jours) pour lisser les tendances.
- Détection des journées les plus venteuses.
- Analyse fréquentielle (FFT) pour détecter les cycles ou régularités.

## 5. Analyse Spatiale Avancée

- Carte des rafales maximales par point (latitude, longitude).
- Écart-type spatial de la vitesse du vent pour identifier la variabilité.
- Clustering spatial (ex. KMeans) pour segmenter les zones homogènes.
- Visualisation par animation temporelle des cartes (option Plotly).

## 6. Analyse des Événements Extrêmes

- Extraction des observations avec gust > 20 m/s.
- Cartographie des rafales extrêmes dans l’espace et le temps.
- Top 10 des jours les plus venteux (max gust).
- Corrélation entre rafales, heure de la journée et localisation.

## 7. Modélisation & Machine Learning

- ACP sur les variables vectorielles du vent (u, v, gust).
- Clustering spatio-temporel pour détecter des motifs météo.
- Régression : prédire wind_speed_10m à partir de u, v, heure, lat/lon.
- Classification des journées : calme / normale / rafales.

In [None]:
# Chargement des bibliothèques
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import glob
import os

# Configuration des graphiques
plt.style.use('seaborn-darkgrid')
%matplotlib inline