In [None]:
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

def random_forest_model(df):
    """
    Appliquer le modèle Random Forest pour prédire la demande en produits sanguins.
    Le modèle est entraîné sur des variables explicatives comme la température, les vacances et le jour de la semaine.
    """
    # Sélection des variables explicatives et de la cible
    X = df[['température', 'vacances', 'jour_semaine']]  # Variables explicatives
    y = df['demande']  # Variable cible

    # Séparation des données en ensembles d'entraînement et de test
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False)

    # Entraînement du modèle Random Forest
    rf_model = RandomForestRegressor(n_estimators=100, random_state=42)
    rf_model.fit(X_train, y_train)

    # Prédictions sur l'ensemble de test
    y_pred_rf = rf_model.predict(X_test)

    # Visualisation des performances du modèle
    plt.figure(figsize=(10, 6))
    plt.plot(y_test.index, y_test, label='Demande réelle', color='blue')
    plt.plot(y_test.index, y_pred_rf, label='Prévisions Random Forest', color='orange')
    plt.title('Comparaison des prévisions Random Forest vs Réel')
    plt.xlabel('Date')
    plt.ylabel('Quantité demandée')
    plt.legend()
    plt.tight_layout()  # Assure que les étiquettes sont correctement espacées
    plt.show()

    return y_pred_rf

# Charger les données prétraitées et appliquer le modèle Random Forest
df = pd.read_csv('results/preprocessed_data.csv')
y_pred_rf = random_forest_model(df)
