# Prédiction du Délai de Paiement - Données FEC Consolidées
Ce notebook utilise plusieurs fichiers FEC simulés, consolidés dans un seul jeu de données, pour entraîner un modèle de prédiction du délai de paiement.

In [None]:
# 📦 Importation des bibliothèques
import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error, mean_squared_error
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# 📄 Chargement du fichier FEC consolidé
df = pd.read_csv('../data/fec_fictifs_consolides.csv', parse_dates=['EcritureDate', 'DatePaiementClient'])

# 🎯 Calcul du délai de paiement
df['DelaiPaiement'] = (df['DatePaiementClient'] - df['EcritureDate']).dt.days

# 🧠 Création de nouvelles variables
df['Mois'] = df['EcritureDate'].dt.month
df['Montant'] = df['Debit'] - df['Credit']

In [None]:
# 🔢 Sélection des variables explicatives et de la cible
X = df[['Mois', 'Montant']]
y = df['DelaiPaiement']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
# 🤖 Entraînement d'un modèle de régression
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 📊 Évaluation du modèle
y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
rmse = mean_squared_error(y_test, y_pred, squared=False)
print(f'MAE : {mae:.2f} jours')
print(f'RMSE : {rmse:.2f} jours')

In [None]:
# 📈 Visualisation des résultats
sns.scatterplot(x=y_test, y=y_pred)
plt.xlabel('Vrai délai')
plt.ylabel('Délai prédit')
plt.title('Prédiction vs Réel')
plt.grid(True)
plt.show()