In [None]:
from datetime import date
import matplotlib.pyplot as plt
import meteostat as ms

# Specify location and time range
POINT = ms.Point(38.8512, -77.0402, 4)   # Try with your location
START = datetime(2013, 1, 1)
END = datetime(2013, 3, 31, 23, 59)


# Get nearby weather stations
stations = ms.stations.nearby(POINT, limit=4)

# Get daily data & perform interpolation
ts = ms.hourly(stations, START, END)
df = ms.interpolate(ts, POINT).fetch()


# 4. Feature Engineering : Création de tes variables spécifiques

# Création du DataFrame propre
df_weather = pd.DataFrame()
df_weather['dteday'] = df.index
df_weather['hr'] = df.index.hour
df_weather['temp'] = df['temp'].values # Température en °C
df_weather['hum'] = df['rhum'].values # Humidité relative
df_weather['windspeed'] = df['wspd'].values # Vitesse du vent en km/h

# Calcul approximatif de la température ressentie (ATemp)
# Formule simple basée sur Température et Vent (Wind Chill) ou Humidité
# Ici on utilise une approximation standard pour l'exemple
# atemp = T + 0.33 * e - 0.7 * v - 4.0 (Formule simplifiée, sinon Heat Index)
# Pour faire simple ici, on garde une corrélation forte avec la Temp
df_weather['atemp'] = df['temp'].values # À affiner si besoin de formule précise

# 5. Le Challenge : Mapper les codes météo (COCO) vers ton échelle 1-4
# Meteostat utilise les codes COCO : https://dev.meteostat.net/formats.html#weather-condition-codes
# 1-6: Clear/Cloudy | 7-9: Mist/Fog | 10-16: Rain | 17-27: Storm/Snow

def map_weathersit(coco_code):
    if pd.isna(coco_code):
        return 2 # Valeur par défaut si manquant (souvent nuageux)
    
    code = int(coco_code)
    
    # Catégorie 1: Clear, Few clouds, Partly cloudy
    if code in [1, 2, 3]: 
        return 1
    # Catégorie 2: Mist + Cloudy
    elif code in [4, 5, 6, 7, 8, 9]: 
        return 2
    # Catégorie 3: Light Snow, Light Rain
    elif code in [10, 11, 12, 13, 14, 15, 16, 17, 18]: 
        return 3
    # Catégorie 4: Heavy Rain, Ice, Thunderstorm
    elif code in [19, 20, 21, 22, 23, 24, 25, 26, 27]: 
        return 4
    else:
        return 2

#df_weather['weathersit'] = df['coco'].apply(map_weathersit)

# Vérification des données
print("\nAperçu des données :")
print(df_weather[['dteday', 'temp', 'hum']].head())

# print("\nDistribution des Weathersit :")
# print(df_weather['weathersit'].value_counts().sort_index())

# 6. Sauvegarde
output_file = 'washington_weather_2013_Q1.csv'
df_weather.to_csv(output_file, index=False)
print(f"\nFichier sauvegardé avec succès : {output_file}")




# Plot line chart including average, minimum and maximum temperature
#df.plot(y=[ms.Parameter.TEMP, ms.Parameter.TMIN, ms.Parameter.TMAX])

In [None]:
<a id="1-problem"></a>
## 1. Explication du problème de machine learning
> *Description du problème que vous souhaitez résoudre.*

---

<a id="2-data-presentation"></a>
## 2. Présentation du jeu de données
> *Origine, contexte et description des données.*

---

<a id="3-eda"></a>
## 3. Exploration du jeu de données
> *Analyse descriptive, statistiques, visualisations.*

---

<a id="4-cleaning"></a>
## 4. Data cleaning et imputation de données manquantes
> *Nettoyage et gestion des NA si nécessaire.*

---

<a id="5-feature-engineering"></a>
## 5. Feature Engineering
> *Explication de la démarche et des variables créées (lags, moyennes mobiles, date, etc.).*

---

<a id="6-preprocessing"></a>
## 6. Préparation des données pour être fournies à un modèle ML/DL
> *Normalisation, Split Train/Test/Val, formatage des séquences.*

---

<a id="7-model-selection"></a>
## 7. Sélection de différents modèles
> *Critères de sélection, métriques choisies (RMSE, MAE...), baselines.*

---

<a id="8-evaluation"></a>
## 8. Évaluation de la performance des modèles
> *Recherche d'hyperparamètres, contrôle de l’overfitting, comparaison sur différents horizons.*

---

<a id="9-discussion"></a>
## 9. Discussion autour de la performance des modèles
> *Analyse critique des résultats.*

---

<a id="10-conclusion"></a>
## 10. Synthèse et conclusions
> *Résumé et pistes d’améliorations envisagées.*