In [None]:
import pandas as pd
from pymongo import MongoClient
import matplotlib.pyplot as plt
import seaborn as sns
from windrose import WindroseAxes

# Connexion à MongoDB
client = MongoClient("mongodb://root:example@localhost:27017/?authSource=admin")  # Remplacez par votre URI MongoDB
db = client["weather_db"]  # Nom de la base de données
collection = db["forecast_data"]  # Nom de la collection

# Lecture des données depuis MongoDB
cursor = collection.find()  # Filtres si nécessaire
df = pd.DataFrame(list(cursor))  # Conversion en DataFrame

# Nettoyage des données (par exemple, suppression de l'_id si inutile)
if "_id" in df.columns:
    df.drop(columns=["_id"], inplace=True)

# Aperçu des données
print(df.head())
print(df.info())

# Nettoyage des données
df = df.drop_duplicates()
df = df.dropna()


In [None]:
import pandas as pd

# Charger les données
file_path = 'forecast_data.csv'
df = pd.read_csv(file_path)

# Afficher un aperçu des données
print(df.head())
print(df.info())

In [5]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
from sklearn.preprocessing import MinMaxScaler
import numpy as np
import pandas as pd
import json

# Filtrer les données pour la ville spécifique
ville_name = 'Rabat'
df_ville = df[df['ville'] == ville_name]

# Normaliser les données de température
scaler = MinMaxScaler(feature_range=(0, 1))
df_ville['température_scaled'] = scaler.fit_transform(df_ville[['température']])

# Préparer les données pour LSTM
def create_dataset(data, time_step=1):
    X, y = [], []
    for i in range(len(data) - time_step - 1):
        X.append(data[i:(i + time_step), 0])
        y.append(data[i + time_step, 0])
    return np.array(X), np.array(y)

# Préparer les données d'entrée pour LSTM
time_step = 10
dataset = df_ville['température_scaled'].values
dataset = dataset.reshape(-1, 1)

# Vérifier si le dataset a assez de points de données
if len(dataset) > time_step:
    X, y = create_dataset(dataset, time_step)

    # Reshaper X pour l'entrainement LSTM
    X = X.reshape(X.shape[0], X.shape[1], 1)

    # Diviser en train et test
    train_size = int(len(X) * 0.8)
    X_train, X_test = X[:train_size], X[train_size:]
    y_train, y_test = y[:train_size], y[train_size:]
else:
    raise ValueError("Le dataset n'a pas assez de points de données pour créer des séquences.")

# Créer le modèle LSTM
model = Sequential()
model.add(LSTM(units=50, return_sequences=True, input_shape=(time_step, 1)))
model.add(LSTM(units=50, return_sequences=False))
model.add(Dense(units=1))

# Compiler et entraîner le modèle
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(X_train, y_train, epochs=20, batch_size=32)

# Prédire les valeurs sur le jeu de test
predictions = model.predict(X_test)
predictions = scaler.inverse_transform(predictions)

# Générer JSON pour les prédictions du jeu de test
test_results = [
    {
        "date": str(df_ville['temps_formaté'].iloc[-len(y_test) + i]),
        "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
        "température_prévue": float(predictions[i])
    }
    for i in range(len(y_test))
]

test_results_json = json.dumps(test_results, indent=4, ensure_ascii=False)
print("Prédictions sur le jeu de test :")
print(test_results_json)

# Prédire pour les 30 prochains jours (1 mois) pour la ville
last_sequence = dataset[-time_step:].reshape(1, time_step, 1)

future_predictions = []
for _ in range(30):  # 30 jours
    next_pred = model.predict(last_sequence)
    future_predictions.append(next_pred[0, 0])
    last_sequence = np.append(last_sequence[:, 1:, :], next_pred.reshape(1, 1, 1), axis=1)

# Inverser la normalisation pour les prédictions futures
future_predictions = scaler.inverse_transform(np.array(future_predictions).reshape(-1, 1))

# Créer des dates futures
last_date = pd.to_datetime(df_ville['temps_formaté'].iloc[-1])
future_dates = [last_date + pd.Timedelta(days=i) for i in range(1, 31)]

# Générer JSON pour les prédictions futures
future_predictions_json_data = [
    {
        "date": future_dates[i].strftime('%Y-%m-%d'),
        "température_prévue": float(future_predictions[i])
    }
    for i in range(len(future_predictions))
]

future_predictions_json = json.dumps(future_predictions_json_data, indent=4, ensure_ascii=False)
print("Prédictions futures (30 prochains jours) :")
print(future_predictions_json)


Epoch 1/20


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_ville['température_scaled'] = scaler.fit_transform(df_ville[['température']])
  super().__init__(**kwargs)


[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 9ms/step - loss: 0.0189
Epoch 2/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step - loss: 0.0096
Epoch 3/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 14ms/step - loss: 0.0082
Epoch 4/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step - loss: 0.0074
Epoch 5/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step - loss: 0.0083
Epoch 6/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step - loss: 0.0073
Epoch 7/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step - loss: 0.0064
Epoch 8/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - loss: 0.0053
Epoch 9/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 13ms/step - loss: 0.0050
Epoch 10/20
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 12ms/step - loss: 0.0057
Epoch 11/20


  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température_prévue": float(predictions[i])
  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température_prévue": float(predictions[i])
  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température_prévue": float(predictions[i])
  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température_prévue": float(predictions[i])
  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température_prévue": float(predictions[i])
  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température_prévue": float(predictions[i])
  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température_prévue": float(predictions[i])
  "température_réelle": float(scaler.inverse_transform(y_test.reshape(-1, 1))[i]),
  "température

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 43ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 62ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 41ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 46ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 91ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 76ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 133ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 163ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 136ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 93ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m

  "température_prévue": float(future_predictions[i])


In [6]:
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import LSTM, Dense
from sklearn.preprocessing import MinMaxScaler
import numpy as np
import pandas as pd
import json
import pickle
import os
from datetime import datetime

# Créer un dossier pour sauvegarder les modèles s'il n'existe pas
save_directory = 'saved_models'
if not os.path.exists(save_directory):
    os.makedirs(save_directory)

# Générer un nom de fichier avec la date
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
model_name = f"temperature_model_rabat_{timestamp}"

# Filtrer les données pour la ville spécifique
ville_name = 'Rabat'
df_ville = df[df['ville'] == ville_name]

# Normaliser les données de température
scaler = MinMaxScaler(feature_range=(0, 1))
df_ville['température_scaled'] = scaler.fit_transform(df_ville[['température']])

# Préparer les données pour LSTM
def create_dataset(data, time_step=1):
    X, y = [], []
    for i in range(len(data) - time_step - 1):
        X.append(data[i:(i + time_step), 0])
        y.append(data[i + time_step, 0])
    return np.array(X), np.array(y)

# Paramètres du modèle
time_step = 10
dataset = df_ville['température_scaled'].values
dataset = dataset.reshape(-1, 1)

# Vérifier si le dataset a assez de points de données
if len(dataset) > time_step:
    X, y = create_dataset(dataset, time_step)
    X = X.reshape(X.shape[0], X.shape[1], 1)
    train_size = int(len(X) * 0.8)
    X_train, X_test = X[:train_size], X[train_size:]
    y_train, y_test = y[:train_size], y[train_size:]
else:
    raise ValueError("Le dataset n'a pas assez de points de données pour créer des séquences.")

# Créer et entraîner le modèle LSTM
model = Sequential()
model.add(LSTM(units=50, return_sequences=True, input_shape=(time_step, 1)))
model.add(LSTM(units=50, return_sequences=False))
model.add(Dense(units=1))
model.compile(optimizer='adam', loss='mean_squared_error')
history = model.fit(X_train, y_train, epochs=20, batch_size=32, validation_split=0.1)

# Sauvegarder le modèle et ses composants
model_path = os.path.join(save_directory, f"{model_name}.h5")
scaler_path = os.path.join(save_directory, f"{model_name}_scaler.pkl")
metadata_path = os.path.join(save_directory, f"{model_name}_metadata.json")

# Sauvegarder le modèle
model.save(model_path)

# Sauvegarder le scaler
with open(scaler_path, 'wb') as scaler_file:
    pickle.dump(scaler, scaler_file)

# Sauvegarder les métadonnées
metadata = {
    'ville': ville_name,
    'date_creation': datetime.now().isoformat(),
    'parametres': {
        'time_step': time_step,
        'train_size': train_size,
        'epochs': 20,
        'batch_size': 32
    },
    'performance': {
        'loss_final': float(history.history['loss'][-1]),
        'val_loss_final': float(history.history['val_loss'][-1])
    }
}

with open(metadata_path, 'w', encoding='utf-8') as metadata_file:
    json.dump(metadata, metadata_file, indent=4, ensure_ascii=False)

# Fonction pour charger et utiliser le modèle
def load_saved_model(model_directory, model_name):
    """
    Charge un modèle sauvegardé et ses composants
    """
    model = load_model(os.path.join(model_directory, f"{model_name}.h5"))
    
    with open(os.path.join(model_directory, f"{model_name}_scaler.pkl"), 'rb') as scaler_file:
        scaler = pickle.load(scaler_file)
    
    with open(os.path.join(model_directory, f"{model_name}_metadata.json"), 'r', encoding='utf-8') as metadata_file:
        metadata = json.load(metadata_file)
    
    return model, scaler, metadata

def predict_temperature(model, scaler, new_data, time_step=10):
    """
    Fait une prédiction avec le modèle chargé
    """
    scaled_data = scaler.transform(new_data.reshape(-1, 1))
    sequence = scaled_data[-time_step:].reshape(1, time_step, 1)
    prediction = model.predict(sequence)
    return scaler.inverse_transform(prediction)[0, 0]

# Exemple d'utilisation du modèle sauvegardé
print(f"\nModèle sauvegardé sous : {model_path}")
print(f"Scaler sauvegardé sous : {scaler_path}")
print(f"Métadonnées sauvegardées sous : {metadata_path}")

# Pour charger et utiliser le modèle plus tard :
"""
# Exemple de chargement et utilisation
loaded_model, loaded_scaler, loaded_metadata = load_saved_model(save_directory, model_name)
new_data = np.array([20, 22, 21, 23, 22, 24, 23, 25, 24, 26])  # 10 dernières températures
prediction = predict_temperature(loaded_model, loaded_scaler, new_data)
print(f"Température prédite : {prediction}°C")
"""

Epoch 1/20


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_ville['température_scaled'] = scaler.fit_transform(df_ville[['température']])
  super().__init__(**kwargs)


[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 57ms/step - loss: 0.0254 - val_loss: 0.0201
Epoch 2/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 20ms/step - loss: 0.0103 - val_loss: 0.0080
Epoch 3/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 17ms/step - loss: 0.0093 - val_loss: 0.0101
Epoch 4/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 13ms/step - loss: 0.0081 - val_loss: 0.0086
Epoch 5/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 17ms/step - loss: 0.0078 - val_loss: 0.0082
Epoch 6/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 13ms/step - loss: 0.0068 - val_loss: 0.0087
Epoch 7/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 16ms/step - loss: 0.0066 - val_loss: 0.0081
Epoch 8/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step - loss: 0.0063 - val_loss: 0.0096
Epoch 9/20
[1m12/12[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m




Modèle sauvegardé sous : saved_models\temperature_model_rabat_20250120_005420.h5
Scaler sauvegardé sous : saved_models\temperature_model_rabat_20250120_005420_scaler.pkl
Métadonnées sauvegardées sous : saved_models\temperature_model_rabat_20250120_005420_metadata.json


'\n# Exemple de chargement et utilisation\nloaded_model, loaded_scaler, loaded_metadata = load_saved_model(save_directory, model_name)\nnew_data = np.array([20, 22, 21, 23, 22, 24, 23, 25, 24, 26])  # 10 dernières températures\nprediction = predict_temperature(loaded_model, loaded_scaler, new_data)\nprint(f"Température prédite : {prediction}°C")\n'

In [7]:
# Import des bibliothèques nécessaires
from tensorflow.keras.models import load_model
import numpy as np
import os
import json
import pickle
import pandas as pd
from datetime import datetime, timedelta

def test_saved_model(save_directory):
    """
    Test complet du modèle sauvegardé
    """
    # 1. Trouver le modèle le plus récent
    model_files = [f for f in os.listdir(save_directory) if f.endswith('.h5')]
    if not model_files:
        raise ValueError("Aucun modèle trouvé dans le dossier.")
    
    latest_model = max(model_files, key=lambda x: os.path.getctime(os.path.join(save_directory, x)))
    model_name = latest_model.replace('.h5', '')
    
    print(f"Test du modèle : {model_name}")
    
    # 2. Charger le modèle et ses composants
    try:
        model = load_model(os.path.join(save_directory, f"{model_name}.h5"))
        
        with open(os.path.join(save_directory, f"{model_name}_scaler.pkl"), 'rb') as scaler_file:
            scaler = pickle.load(scaler_file)
            
        with open(os.path.join(save_directory, f"{model_name}_metadata.json"), 'r', encoding='utf-8') as metadata_file:
            metadata = json.load(metadata_file)
            
        print("\n✅ Chargement réussi du modèle, du scaler et des métadonnées")
        print("\nMétadonnées du modèle :")
        print(json.dumps(metadata, indent=2, ensure_ascii=False))
        
    except Exception as e:
        print(f"❌ Erreur lors du chargement : {str(e)}")
        return
    
    # 3. Tester des prédictions
    print("\nTest des prédictions...")
    
    # Créer des données de test (exemple avec 10 températures)
    test_temperatures = np.array([22, 23, 24, 25, 23, 22, 24, 25, 26, 25])
    
    try:
        # Normaliser les données
        scaled_data = scaler.transform(test_temperatures.reshape(-1, 1))
        
        # Préparer la séquence
        sequence = scaled_data.reshape(1, len(test_temperatures), 1)
        
        # Faire la prédiction
        prediction = model.predict(sequence)
        
        # Dénormaliser la prédiction
        temperature_prediction = scaler.inverse_transform(prediction)[0, 0]
        
        print("\nDonnées de test :")
        print(f"Températures d'entrée : {test_temperatures.tolist()}")
        print(f"Température prédite : {temperature_prediction:.2f}°C")
        
        # 4. Faire des prédictions pour les prochains jours
        print("\nPrédictions pour les 5 prochains jours :")
        
        current_sequence = scaled_data.reshape(1, len(test_temperatures), 1)
        future_dates = [(datetime.now() + timedelta(days=i)).strftime('%Y-%m-%d') for i in range(1, 6)]
        
        for date in future_dates:
            pred = model.predict(current_sequence)
            temp = scaler.inverse_transform(pred)[0, 0]
            print(f"{date} : {temp:.2f}°C")
            
            # Mettre à jour la séquence pour la prochaine prédiction
            current_sequence = np.append(current_sequence[:, 1:, :], 
                                      pred.reshape(1, 1, 1), 
                                      axis=1)
        
        print("\n✅ Test des prédictions réussi")
        
    except Exception as e:
        print(f"❌ Erreur lors des prédictions : {str(e)}")

# Exécuter le test
if __name__ == "__main__":
    try:
        test_saved_model('saved_models')
        print("\n✅ Test complet terminé avec succès")
    except Exception as e:
        print(f"\n❌ Erreur lors du test : {str(e)}")



Test du modèle : temperature_model_rabat_20250120_005420

✅ Chargement réussi du modèle, du scaler et des métadonnées

Métadonnées du modèle :
{
  "ville": "Rabat",
  "date_creation": "2025-01-20T00:54:29.656664",
  "parametres": {
    "time_step": 10,
    "train_size": 410,
    "epochs": 20,
    "batch_size": 32
  },
  "performance": {
    "loss_final": 0.0039708418771624565,
    "val_loss_final": 0.006809934042394161
  }
}

Test des prédictions...




[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 284ms/step

Données de test :
Températures d'entrée : [22, 23, 24, 25, 23, 22, 24, 25, 26, 25]
Température prédite : 29.47°C

Prédictions pour les 5 prochains jours :
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step
2025-01-21 : 29.47°C
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 74ms/step
2025-01-22 : 30.81°C
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 72ms/step
2025-01-23 : 32.15°C
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 70ms/step
2025-01-24 : 33.38°C
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 81ms/step
2025-01-25 : 34.45°C

✅ Test des prédictions réussi

✅ Test complet terminé avec succès
