# Analyse météorologique - Projet Data Science ESEO E3e

Ce notebook contient les étapes d'analyse exploratoire des données météo horaires pour trois départements : 05, 21 et 29.  
Les données ont été nettoyées en amont dans le dossier `clean_data/`.

---

## Imports

On importe les bibliothèques nécessaires à l’analyse (Pandas, Numpy, Seaborn, etc.).

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os, sys

sns.set_theme(style="whitegrid")

---
## Positionnement du répertoire racine

Ce bloc permet d'assurer que le notebook est exécuté depuis la **racine du projet**, même s'il est physiquement dans un sous-dossier (`notebooks/`).

In [2]:
if 'project_root' not in globals():
    project_root = os.path.abspath("..")
    os.chdir(project_root)
    sys.path.append(project_root)

---
## Chargement des données nettoyées

Les fichiers nettoyés ont été prétraités avec `scripts/nettoyage.py`.  
On les charge ici dans un DataFrame unique par département.

In [3]:
df_05 = pd.concat([
    pd.read_csv(os.path.join("clean_data", "05", file)) for file in os.listdir(os.path.join("clean_data", "05"))
], ignore_index=True)

In [4]:
df_21 = pd.concat([
    pd.read_csv(os.path.join("clean_data", "21", file)) for file in os.listdir(os.path.join("clean_data", "21"))
], ignore_index=True)

In [5]:
df_29 = pd.concat([
    pd.read_csv(os.path.join("clean_data", "29", file)) for file in os.listdir(os.path.join("clean_data", "29"))
], ignore_index=True)

## Statistiques de base

Pour chaque variable, on calcule les indicateurs descriptifs classiques : min, max, médiane, moyenne, écart-type…


In [6]:
from scripts.utils import statistiques_base

for col in ["T", "U", "FF", "RR1", "N"]:
    print(f"Statistiques pour {col} :")
    print(statistiques_base(df_05[col].dropna()))

Statistiques pour T :
{'min': -29.2, 'Q1': 0.5, 'médiane': 6.6, 'Q3': 13.4, 'max': 41.0, 'moyenne': 7.209562595974611, 'écart-type': 9.358990691633702, 'écart-type relatif': 129.81357144827626}
Statistiques pour U :
{'min': 1.0, 'Q1': 48.0, 'médiane': 69.0, 'Q3': 87.0, 'max': 100.0, 'moyenne': 66.17126625396168, 'écart-type': 23.090891600344488, 'écart-type relatif': 34.89564717066607}
Statistiques pour FF :
{'min': 0.0, 'Q1': 0.8, 'médiane': 1.6, 'Q3': 3.1, 'max': 36.0, 'moyenne': 2.1893267731670005, 'écart-type': 2.0596658222967816, 'écart-type relatif': 94.07758803028494}
Statistiques pour RR1 :
{'min': 0.0, 'Q1': 0.0, 'médiane': 0.0, 'Q3': 0.0, 'max': 60.7, 'moyenne': 0.09460411857714612, 'écart-type': 0.580102105467079, 'écart-type relatif': 613.1890600450206}
Statistiques pour N :
{'min': 0.0, 'Q1': 1.0, 'médiane': 4.0, 'Q3': 8.0, 'max': 9.0, 'moyenne': 4.219106186714733, 'écart-type': 3.307316099436752, 'écart-type relatif': 78.38902253398939}
