# üè• Analyse Avanc√©e avec Dataset Enrichi - Clinique du Mont Vert
## IA Pr√©dictive avec Prophet + Regressors Externes

---

**Version ENRICHI - Optimis√©e pour Prophet Avanc√©**

**Projet** : Master EISI - Gestion des stocks  
**Dataset** : Enrichi v3.0 - 5 ans de donn√©es (2020-2024)  
**Lignes** : 85,809 enregistrements  
**Colonnes** : 22 (15 base + 7 r√©gresseurs)

---

## üìã Nouveaut√©s du Dataset Enrichi

### üéØ 7 R√©gresseurs Externes
- **temperature** : Temp√©rature ext√©rieure (¬∞C)
- **taux_occupation** : Taux d'occupation h√¥pital (%)
- **nb_patients** : Nombre de patients
- **epidemie_grippe** : P√©riodes d'√©pid√©mie (0/1)
- **vacances_scolaires** : Vacances scolaires (0/1)
- **jour_ferie** : Jours f√©ri√©s fran√ßais (0/1)
- **covid_impact** : P√©riodes COVID (0/1)

### üîÑ Changepoints Majeurs
- **15/03/2020** : COVID-19 Vague 1 (+50%)
- **01/11/2020** : COVID-19 Vague 2 (+30%)
- **01/05/2021** : D√©confinement (-10%)
- **01/01/2022** : Nouvelle Direction (+10%)
- **01/09/2023** : Extension H√¥pital (+15%)

### üìä R√©sultats Attendus
- **MAE** : ~2.0 kg (vs 3.5 kg sans regressors)
- **MAPE** : ~20% (vs 35% sans regressors)
- **Pr√©cision** : Excellente

---

# üì¶ √âtape 1 : Imports et Configuration

In [None]:
# Imports standards
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime, timedelta
import warnings
import json
from pathlib import Path
warnings.filterwarnings('ignore')

# Configuration pandas
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)
pd.set_option('display.float_format', '{:.2f}'.format)

# Configuration matplotlib
plt.style.use('seaborn-v0_8-darkgrid')
plt.rcParams['figure.figsize'] = (16, 8)
plt.rcParams['font.size'] = 10

print("‚úÖ Imports de base termin√©s !")
print(f"üìä NumPy version : {np.__version__}")
print(f"üìä Pandas version : {pd.__version__}")

In [None]:
# Import Prophet et utilitaires
print("ü§ñ Import de Prophet...")
try:
    from prophet import Prophet
    from prophet.plot import plot_yearly, plot_weekly, add_changepoints_to_plot
    from prophet.utilities import regressor_coefficients
    print("‚úÖ Prophet import√© avec succ√®s !")
    PROPHET_AVAILABLE = True
except Exception as e:
    print(f"‚ö†Ô∏è  Erreur Prophet : {e}")
    print("üí° Installation : pip install prophet")
    PROPHET_AVAILABLE = False

print(f"\n{'='*70}")
if PROPHET_AVAILABLE:
    print("üéâ Tout est pr√™t pour l'analyse avanc√©e !")
else:
    print("‚ö†Ô∏è  Prophet requis pour ce notebook")
print(f"{'='*70}")

In [None]:
# Import Results Manager (optionnel)
try:
    from results_manager import ResultsManager
    results_mgr = ResultsManager()
    results_mgr.create_run_directory()
    print(f"‚úÖ Results Manager activ√©")
    print(f"üìÅ R√©sultats seront sauvegard√©s dans : {results_mgr.get_run_path()}")
    USE_RESULTS_MANAGER = True
except:
    print("‚ö†Ô∏è  Results Manager non disponible (optionnel)")
    USE_RESULTS_MANAGER = False

# üìÇ √âtape 2 : Chargement du Dataset Enrichi

In [None]:
# Chemin du dataset enrichi
FICHIER_CSV = "../data/dataset_stock_hopital_ENRICHI.csv"

# V√©rifier que le fichier existe
if not Path(FICHIER_CSV).exists():
    print(f"‚ùå Fichier introuvable : {FICHIER_CSV}")
    print("\nüí° Assurez-vous que le dataset enrichi est dans data/")
    raise FileNotFoundError(f"Le fichier {FICHIER_CSV} n'existe pas")

# Chargement
print(f"üìä Chargement de {FICHIER_CSV}...")
df = pd.read_csv(FICHIER_CSV)

print(f"‚úÖ Dataset enrichi charg√© avec succ√®s !")
print(f"üìè Dimensions : {df.shape[0]:,} lignes √ó {df.shape[1]} colonnes")
print(f"üíæ Taille m√©moire : {df.memory_usage(deep=True).sum() / 1024**2:.2f} MB")

In [None]:
# Aper√ßu des donn√©es
print("üëÄ Aper√ßu des 5 premi√®res lignes :")
df.head()

In [None]:
# V√©rifier les colonnes du dataset enrichi
print("üìä COLONNES DU DATASET ENRICHI")
print("="*70)

colonnes_base = ['date', 'id_produit', 'nom_produit', 'type_produit', 'type_operation',
                 'type_sortie', 'quantite', 'unite', 'id_lot', 'id_arrivage',
                 'id_fournisseur', 'nom_fournisseur', 'date_expiration',
                 'stock_theorique', 'temperature_stockage']

regresseurs = ['temperature', 'taux_occupation', 'nb_patients', 'epidemie_grippe',
               'vacances_scolaires', 'jour_ferie', 'covid_impact']

print("\n‚úÖ Colonnes de base (15) :")
for col in colonnes_base:
    if col in df.columns:
        print(f"   ‚úì {col}")
    else:
        print(f"   ‚úó {col} (manquante)")

print("\n‚úÖ R√©gresseurs externes (7) :")
for col in regresseurs:
    if col in df.columns:
        print(f"   ‚úì {col}")
    else:
        print(f"   ‚úó {col} (manquante)")

print(f"\nüìä Total colonnes trouv√©es : {len(df.columns)}")

# üßπ √âtape 3 : Pr√©paration des Donn√©es

In [None]:
# Conversion des dates
print("üìÖ Conversion des colonnes de dates...")
df['date'] = pd.to_datetime(df['date'])
df['date_expiration'] = pd.to_datetime(df['date_expiration'])

print("‚úÖ Dates converties !")
print(f"üìÜ P√©riode couverte : {df['date'].min().date()} ‚Üí {df['date'].max().date()}")
print(f"‚è±Ô∏è  Dur√©e totale : {(df['date'].max() - df['date'].min()).days} jours")
print(f"üìä Soit {(df['date'].max() - df['date'].min()).days / 365:.1f} ans de donn√©es")

In [None]:
# Statistiques sur les r√©gresseurs
print("üìä STATISTIQUES DES R√âGRESSEURS")
print("="*70)

print(f"\nüå°Ô∏è  Temp√©rature :")
print(f"   Moyenne : {df['temperature'].mean():.1f}¬∞C")
print(f"   Min/Max : {df['temperature'].min():.1f}¬∞C / {df['temperature'].max():.1f}¬∞C")

print(f"\nüè• Taux d'occupation :")
print(f"   Moyenne : {df['taux_occupation'].mean():.1f}%")
print(f"   Min/Max : {df['taux_occupation'].min():.1f}% / {df['taux_occupation'].max():.1f}%")

print(f"\nüë• Nombre de patients :")
print(f"   Moyenne : {df['nb_patients'].mean():.0f} patients/jour")
print(f"   Min/Max : {df['nb_patients'].min():.0f} / {df['nb_patients'].max():.0f}")

print(f"\nü¶† √âpid√©mies de grippe :")
nb_jours_grippe = df['epidemie_grippe'].sum()
pct_grippe = (nb_jours_grippe / len(df) * 100)
print(f"   {nb_jours_grippe:,} jours d'√©pid√©mie ({pct_grippe:.1f}%)")

print(f"\nüèñÔ∏è  Vacances scolaires :")
nb_jours_vacances = df['vacances_scolaires'].sum()
pct_vacances = (nb_jours_vacances / len(df) * 100)
print(f"   {nb_jours_vacances:,} jours de vacances ({pct_vacances:.1f}%)")

print(f"\nüìÖ Jours f√©ri√©s :")
nb_jours_feries = df['jour_ferie'].sum()
nb_annees = (df['date'].max() - df['date'].min()).days / 365
print(f"   {nb_jours_feries:,} jours f√©ri√©s (~{nb_jours_feries/nb_annees:.0f}/an)")

print(f"\nüò∑ Impact COVID :")
nb_jours_covid = df['covid_impact'].sum()
pct_covid = (nb_jours_covid / len(df) * 100)
print(f"   {nb_jours_covid:,} jours impact√©s ({pct_covid:.1f}%)")
print(f"   Soit {nb_jours_covid/30:.0f} mois cumul√©s")

# üéØ √âtape 4 : S√©lection du Produit √† Analyser

In [None]:
# Choisir le produit √† analyser
PRODUIT_ANALYSE = "Poulet frais"  # ‚Üê Changez ici pour analyser un autre produit

print(f"üîç ANALYSE APPROFONDIE : {PRODUIT_ANALYSE}")
print("="*70)

# Filtrer uniquement les sorties de consommation (pas les destructions)
produit_df = df[
    (df['nom_produit'] == PRODUIT_ANALYSE) &
    (df['type_sortie'] == 'CONSOMMATION')
].copy()

if len(produit_df) == 0:
    print(f"‚ùå Aucune donn√©e trouv√©e pour '{PRODUIT_ANALYSE}'")
    print("\nüí° Produits disponibles :")
    print(df['nom_produit'].unique())
else:
    print(f"üìä {len(produit_df):,} sorties enregistr√©es")
    print(f"üìÖ P√©riode : {produit_df['date'].min().date()} ‚Üí {produit_df['date'].max().date()}")
    print(f"üì¶ Volume total : {produit_df['quantite'].sum():,.2f} kg")
    print(f"üìà Moyenne/sortie : {produit_df['quantite'].mean():.2f} kg")

# üìä √âtape 5 : Agr√©gation Quotidienne avec R√©gresseurs

In [None]:
# Agr√©ger par jour en gardant les r√©gresseurs
print("üîß Agr√©gation des donn√©es par jour...")

daily = produit_df.groupby('date').agg({
    'quantite': 'sum',                    # Somme des quantit√©s consomm√©es
    'temperature': 'mean',                # Moyenne temp√©rature du jour
    'taux_occupation': 'mean',            # Moyenne taux occupation
    'nb_patients': 'mean',                # Moyenne nb patients
    'epidemie_grippe': 'max',             # 1 si √©pid√©mie ce jour
    'vacances_scolaires': 'max',          # 1 si vacances ce jour
    'jour_ferie': 'max',                  # 1 si f√©ri√© ce jour
    'covid_impact': 'max'                 # 1 si COVID ce jour
}).reset_index()

print(f"‚úÖ {len(daily)} jours avec donn√©es")

# Compl√©ter les dates manquantes avec 0
print("üîß Compl√©tion des dates manquantes...")
date_range = pd.date_range(
    start=daily['date'].min(),
    end=daily['date'].max(),
    freq='D'
)
full_dates = pd.DataFrame({'date': date_range})
daily = full_dates.merge(daily, on='date', how='left')

# Remplir les valeurs manquantes
daily['quantite'].fillna(0, inplace=True)  # Pas de consommation = 0

# Pour les r√©gresseurs continus : utiliser la moyenne
for col in ['temperature', 'taux_occupation', 'nb_patients']:
    daily[col].fillna(daily[col].mean(), inplace=True)

# Pour les r√©gresseurs binaires : utiliser 0
for col in ['epidemie_grippe', 'vacances_scolaires', 'jour_ferie', 'covid_impact']:
    daily[col].fillna(0, inplace=True)

print(f"‚úÖ {len(daily)} jours pr√©par√©s (toutes les dates)")
print(f"   - Jours avec consommation : {(daily['quantite'] > 0).sum()}")
print(f"   - Jours sans consommation : {(daily['quantite'] == 0).sum()}")

In [None]:
# Pr√©parer le DataFrame pour Prophet
print("üîß Pr√©paration pour Prophet (renommage ds/y)...")

prophet_df = daily.copy()
prophet_df = prophet_df.rename(columns={'date': 'ds', 'quantite': 'y'})

print(f"‚úÖ DataFrame Prophet pr√™t")
print(f"   - ds (date) : {prophet_df['ds'].min()} ‚Üí {prophet_df['ds'].max()}")
print(f"   - y (quantit√©) : moyenne = {prophet_df['y'].mean():.2f} kg/jour")
print(f"   - R√©gresseurs : {', '.join(['temperature', 'taux_occupation', 'nb_patients', 'epidemie_grippe'])}")

# üìÖ √âtape 6 : Configuration des Holidays (Jours F√©ri√©s)

Prophet permet de mod√©liser des √©v√©nements sp√©ciaux via le syst√®me de "holidays".
Nous allons cr√©er **3 types de holidays** :

1. **Jours f√©ri√©s fran√ßais** (No√´l, 14 juillet, etc.)
2. **Vacances scolaires** (zones A, B, C)
3. **P√©riodes COVID** (√©v√©nement majeur exceptionnel)

Ces √©v√©nements ont un impact important sur la consommation hospitali√®re :
- Les jours f√©ri√©s = moins de personnel = moins de consommation
- Les vacances = moins d'admissions = consommation r√©duite
- COVID = confinement + surcharge = consommation augment√©e

In [None]:
# Cr√©er le DataFrame des jours f√©ri√©s
print("üìÖ CONFIGURATION DES HOLIDAYS")
print("="*70)

# 1. Jours f√©ri√©s fran√ßais
holidays_jf = daily[daily['jour_ferie'] == 1][['date']].drop_duplicates()
holidays_jf.columns = ['ds']
holidays_jf['holiday'] = 'jour_ferie'
holidays_jf['lower_window'] = 0
holidays_jf['upper_window'] = 0

print(f"\n‚úÖ Jours f√©ri√©s : {len(holidays_jf)} jours")

# 2. Vacances scolaires
holidays_vac = daily[daily['vacances_scolaires'] == 1][['date']].drop_duplicates()
holidays_vac.columns = ['ds']
holidays_vac['holiday'] = 'vacances_scolaires'
holidays_vac['lower_window'] = 0
holidays_vac['upper_window'] = 0

print(f"‚úÖ Vacances scolaires : {len(holidays_vac)} jours")

# 3. P√©riodes COVID (√©v√©nement majeur)
holidays_covid = daily[daily['covid_impact'] == 1][['date']].drop_duplicates()
holidays_covid.columns = ['ds']
holidays_covid['holiday'] = 'covid_19'
holidays_covid['lower_window'] = 0
holidays_covid['upper_window'] = 0

print(f"‚úÖ P√©riodes COVID : {len(holidays_covid)} jours")

# Combiner tous les holidays
holidays = pd.concat([holidays_jf, holidays_vac, holidays_covid])

print(f"\nüìä Total holidays configur√©s : {len(holidays)} jours")
print(f"\nTypes de holidays :")
print(holidays['holiday'].value_counts())

In [None]:
# Aper√ßu des holidays
print("\nüëÄ Aper√ßu des 10 premiers holidays :")
holidays.head(10)

# üîÑ √âtape 7 : Configuration des Changepoints

Les **changepoints** sont des moments o√π la tendance du mod√®le peut changer brusquement.

Prophet peut les d√©tecter automatiquement, mais nous pouvons aussi les sp√©cifier **manuellement** pour les √©v√©nements importants que nous connaissons.

### üí° Pourquoi des changepoints manuels ?

Dans notre dataset enrichi, nous connaissons 5 √©v√©nements majeurs qui ont impact√© la consommation :

| Date | √âv√©nement | Impact |
|------|-----------|--------|
| **15/03/2020** | COVID-19 Vague 1 | +50% consommation |
| **01/11/2020** | COVID-19 Vague 2 | +30% consommation |
| **01/05/2021** | D√©confinement | -10% consommation |
| **01/01/2022** | Nouvelle Direction | +10% consommation |
| **01/09/2023** | Extension H√¥pital | +15% consommation |

En sp√©cifiant ces dates, nous aidons Prophet √† mieux capturer ces changements de tendance.

In [None]:
# D√©finir les changepoints manuellement
print("üîÑ CONFIGURATION DES CHANGEPOINTS")
print("="*70)

# Dates des √©v√©nements majeurs (format YYYY-MM-DD)
changepoints_manuels = [
    '2020-03-15',  # COVID-19 Vague 1
    '2020-11-01',  # COVID-19 Vague 2
    '2021-05-01',  # D√©confinement
    '2022-01-01',  # Nouvelle Direction
    '2023-09-01'   # Extension H√¥pital
]

print(f"\n‚úÖ {len(changepoints_manuels)} changepoints manuels d√©finis :")
for i, cp in enumerate(changepoints_manuels, 1):
    print(f"   {i}. {cp}")

print(f"\nüí° Note importante :")
print(f"   Prophet peut aussi d√©tecter automatiquement d'autres changepoints")
print(f"   ‚Üí Param√®tre : changepoint_prior_scale")
print(f"   ‚Üí Plus ce param√®tre est √©lev√©, plus le mod√®le est flexible")
print(f"   ‚Üí Valeur par d√©faut : 0.05 (peu flexible)")
print(f"   ‚Üí Valeur recommand√©e pour notre dataset : 0.5 (plus flexible)")

# üìä √âtape 8 : Split Train/Test

Pour √©valuer la performance de notre mod√®le, nous devons diviser nos donn√©es en deux parties :

### üéØ Principe du Split

- **Train (Entra√Ænement)** : Donn√©es que le mod√®le va utiliser pour apprendre les patterns
- **Test (Validation)** : Donn√©es r√©serv√©es pour √©valuer la performance

### üìê Notre Strat√©gie

Nous avons **5 ans de donn√©es** (2020-2024). Nous allons utiliser :

- **Train** : Les 4 premi√®res ann√©es (~80% des donn√©es)
- **Test** : La derni√®re ann√©e (~20% des donn√©es)

### üí° Pourquoi 1 an de test ?

- C'est suffisant pour capturer toutes les variations saisonni√®res (4 saisons compl√®tes)
- Cela nous permet de tester la capacit√© du mod√®le √† pr√©dire sur une p√©riode longue
- C'est une pratique standard en time series forecasting

In [None]:
# Split train/test
print("üìä SPLIT TRAIN/TEST")
print("="*70)

# Garder la derni√®re ann√©e pour le test (365 jours)
split_date = prophet_df['ds'].max() - pd.Timedelta(days=365)
train = prophet_df[prophet_df['ds'] <= split_date].copy()
test = prophet_df[prophet_df['ds'] > split_date].copy()

print(f"\n‚úÖ Donn√©es divis√©es :")
print(f"   üìÖ Date de split : {split_date.date()}")
print(f"\n   üéì Train : {len(train)} jours ({train['ds'].min().date()} ‚Üí {train['ds'].max().date()})")
print(f"   üß™ Test  : {len(test)} jours ({test['ds'].min().date()} ‚Üí {test['ds'].max().date()})")
print(f"\n   üìä Ratio : {len(train)/len(prophet_df)*100:.1f}% train / {len(test)/len(prophet_df)*100:.1f}% test")

# V√©rifier que le test contient bien des r√©gresseurs
print(f"\n‚úÖ V√©rification des r√©gresseurs dans le test :")
print(f"   - Temperature : {test['temperature'].notna().sum()} valeurs")
print(f"   - Taux occupation : {test['taux_occupation'].notna().sum()} valeurs")
print(f"   - Nb patients : {test['nb_patients'].notna().sum()} valeurs")
print(f"   - Epidemie grippe : {test['epidemie_grippe'].notna().sum()} valeurs")

# ü§ñ √âtape 9 : Mod√®le Prophet avec Regressors

C'est l'√©tape la plus importante ! Nous allons configurer un mod√®le Prophet **avanc√©** avec toutes les fonctionnalit√©s.

### üéØ Configuration Compl√®te

Notre mod√®le va int√©grer :

1. **Holidays** ‚Üí Jours f√©ri√©s, vacances, COVID
2. **Changepoints** ‚Üí 5 √©v√©nements majeurs manuels
3. **Seasonality** ‚Üí Saisonnalit√© annuelle (20) + hebdomadaire (5)
4. **Regressors** ‚Üí 4 variables externes (temp√©rature, occupation, patients, grippe)

### üìä Param√®tres D√©taill√©s

| Param√®tre | Valeur | Explication |
|-----------|--------|-------------|
| `yearly_seasonality` | 20 | Fourier order pour capturer les cycles annuels (default: 10) |
| `weekly_seasonality` | 5 | Fourier order pour les cycles hebdomadaires (default: 3) |
| `seasonality_mode` | multiplicative | Effet multiplicatif (mieux pour nos donn√©es) |
| `changepoint_prior_scale` | 0.5 | Flexibilit√© des changepoints (default: 0.05) |
| `holidays_prior_scale` | 10.0 | Importance des holidays (default: 10) |
| `interval_width` | 0.85 | Intervalle de confiance √† 85% |

In [None]:
# Configuration du mod√®le Prophet
print("ü§ñ CONFIGURATION DU MOD√àLE PROPHET")
print("="*70)

# Cr√©er le mod√®le avec configuration optimale
model = Prophet(
    # ===== HOLIDAYS =====
    holidays=holidays,                # Les 3 types configur√©s pr√©c√©demment
    holidays_prior_scale=10.0,        # Importance des holidays (default: 10)
    
    # ===== SEASONALITY =====
    yearly_seasonality=20,            # Ordre Fourier annuel (default: 10, max: 20)
    weekly_seasonality=5,             # Ordre Fourier hebdo (default: 3)
    daily_seasonality=False,          # Pas n√©cessaire pour agr√©gation quotidienne
    seasonality_mode='multiplicative', # Effet multiplicatif (vs 'additive')
    seasonality_prior_scale=10.0,     # Flexibilit√© saisonnalit√© (default: 10)
    
    # ===== CHANGEPOINTS =====
    changepoints=changepoints_manuels, # 5 √©v√©nements majeurs
    changepoint_prior_scale=0.5,      # Flexibilit√© (default: 0.05, plus = flexible)
    changepoint_range=0.9,            # 90% des donn√©es (default: 0.8)
    
    # ===== AUTRES =====
    interval_width=0.85,              # Intervalle de confiance 85%
    growth='linear',                  # Croissance lin√©aire (vs 'logistic')
    mcmc_samples=0                    # 0 = pas de MCMC (plus rapide)
)

print("\n‚úÖ Mod√®le cr√©√© avec :")
print(f"   üéâ Holidays : {len(holidays)} √©v√©nements")
print(f"   üîÑ Changepoints : {len(changepoints_manuels)} manuels")
print(f"   üìä Seasonality : yearly (20) + weekly (5)")
print(f"   üéØ Mode : multiplicative")
print(f"   üìà Intervalle confiance : 85%")

In [None]:
# Ajouter les r√©gresseurs externes
print("\nüîß AJOUT DES R√âGRESSEURS EXTERNES")
print("="*70)

# 1. Temp√©rature (effet sur produits frais/p√©rissables)
model.add_regressor(
    'temperature',
    prior_scale=0.5,      # Importance mod√©r√©e
    standardize=True,     # Normaliser automatiquement (recommand√©)
    mode='additive'       # Effet additif
)
print("‚úÖ R√©gresseur 'temperature' ajout√©")
print("   ‚Üí Impact sur produits sensibles √† la temp√©rature")

# 2. Taux d'occupation (corr√©lation forte avec consommation)
model.add_regressor(
    'taux_occupation',
    prior_scale=1.0,      # Importance √©lev√©e (forte corr√©lation)
    standardize=True,
    mode='additive'
)
print("‚úÖ R√©gresseur 'taux_occupation' ajout√©")
print("   ‚Üí Plus de patients = plus de consommation")

# 3. Nombre de patients (alternative au taux occupation)
model.add_regressor(
    'nb_patients',
    prior_scale=0.5,      # Importance mod√©r√©e (redondant avec occupation)
    standardize=True,
    mode='additive'
)
print("‚úÖ R√©gresseur 'nb_patients' ajout√©")
print("   ‚Üí Compl√©ment du taux d'occupation")

# 4. √âpid√©mie de grippe (√©v√©nement ponctuel √† fort impact)
model.add_regressor(
    'epidemie_grippe',
    prior_scale=0.5,      # Importance mod√©r√©e
    standardize=False,    # D√©j√† binaire (0 ou 1), pas besoin de normaliser
    mode='additive'
)
print("‚úÖ R√©gresseur 'epidemie_grippe' ajout√©")
print("   ‚Üí Impact des √©pid√©mies hivernales")

print(f"\nüìä Total : 4 r√©gresseurs externes configur√©s !")
print(f"üí° Ces variables vont am√©liorer significativement les pr√©dictions")

In [None]:
# Entra√Æner le mod√®le
print("\n‚è≥ ENTRA√éNEMENT DU MOD√àLE...")
print("="*70)
print("‚è≥ Cela peut prendre 1-2 minutes selon votre machine...")
print("   Prophet utilise Stan (optimisation bay√©sienne)")

# Fit sur les donn√©es d'entra√Ænement
model.fit(train)

print("\n‚úÖ Mod√®le entra√Æn√© avec succ√®s !")
print("   Le mod√®le a appris les patterns sur 4 ans de donn√©es")
print("   Nous allons maintenant l'√©valuer sur l'ann√©e de test")

# üìä √âtape 10 : √âvaluation sur le Test

Maintenant que le mod√®le est entra√Æn√©, nous allons √©valuer sa **performance** sur les donn√©es de test (1 an).

### üìê M√©triques Utilis√©es

Nous utilisons 3 m√©triques standard pour √©valuer la pr√©cision :

| M√©trique | Nom Complet | Signification | Bon Score |
|----------|-------------|---------------|-----------|
| **MAE** | Mean Absolute Error | Erreur moyenne en kg | < 3 kg |
| **MAPE** | Mean Absolute Percentage Error | Erreur relative en % | < 20% |
| **RMSE** | Root Mean Squared Error | P√©nalise les grandes erreurs | < 4 kg |

### üí° Interpr√©tation

- **MAE** : "En moyenne, je me trompe de X kg"
- **MAPE** : "En moyenne, je me trompe de X%"
- **RMSE** : "Mes erreurs les plus importantes sont de l'ordre de X kg"

In [None]:
# Pr√©dire sur les donn√©es de test
print("üìä √âVALUATION SUR LE TEST")
print("="*70)

# G√©n√©rer les pr√©dictions pour la p√©riode de test
predictions_test = model.predict(test)

# Extraire les valeurs r√©elles et pr√©dites
y_true = test['y'].values      # Vraies valeurs
y_pred = predictions_test['yhat'].values  # Pr√©dictions

# Calculer les 3 m√©triques principales
mae = np.mean(np.abs(y_true - y_pred))
mape = np.mean(np.abs((y_true - y_pred) / (y_true + 0.01))) * 100  # +0.01 √©vite division par 0
rmse = np.sqrt(np.mean((y_true - y_pred)**2))

# Afficher les r√©sultats
print(f"\nüìä M√âTRIQUES DE PERFORMANCE")
print("="*70)
print(f"MAE  (Erreur Absolue Moyenne)    : {mae:.2f} kg")
print(f"MAPE (Erreur Relative Moyenne)   : {mape:.2f}%")
print(f"RMSE (Erreur Quadratique Moyenne): {rmse:.2f} kg")
print("="*70)

# Interpr√©ter les r√©sultats
if mape < 15:
    verdict = "‚úÖ Excellente pr√©cision ! (MAPE < 15%)"
    commentaire = "Le mod√®le est tr√®s performant. R√©sultats fiables."
elif mape < 25:
    verdict = "‚úÖ Bonne pr√©cision (MAPE entre 15% et 25%)"
    commentaire = "Le mod√®le est satisfaisant. Peut √™tre utilis√© en production."
else:
    verdict = "‚ö†Ô∏è  Pr√©cision moyenne (MAPE > 25%)"
    commentaire = "Le mod√®le pourrait √™tre am√©lior√©."

print(f"\n{verdict}")
print(f"üí° {commentaire}")
print(f"\nüìà En pratique : Le mod√®le se trompe en moyenne de ¬±{mae:.2f} kg (soit {mape:.1f}%)")

# üî¨ √âtape 11 : Analyse des Coefficients des R√©gresseurs

Une des forces de Prophet est qu'il permet d'**interpr√©ter** l'impact de chaque r√©gresseur.

### üí° Qu'est-ce qu'un coefficient ?

Le coefficient repr√©sente **l'impact** d'un r√©gresseur sur la pr√©diction :

- **Coefficient positif** ‚Üí Quand le r√©gresseur augmente, la consommation augmente
- **Coefficient n√©gatif** ‚Üí Quand le r√©gresseur augmente, la consommation diminue

### üìä Exemple d'Interpr√©tation

Si le coefficient de `taux_occupation` est **+0.25** :
- Quand le taux d'occupation augmente de 1%, la consommation augmente de ~0.25 kg
- C'est un **effet positif** : plus de patients = plus de consommation

### üéØ Ce que nous allons analyser

- Impact de la **temp√©rature** sur les produits frais
- Impact du **taux d'occupation** sur la consommation
- Impact du **nombre de patients**
- Impact des **√©pid√©mies de grippe**

In [None]:
# Extraire les coefficients des r√©gresseurs
print("üî¨ ANALYSE DES COEFFICIENTS DES R√âGRESSEURS")
print("="*70)

try:
    # Utiliser la fonction native de Prophet
    coeffs = regressor_coefficients(model)
    
    print("\nüìä Tableau des coefficients :")
    print(coeffs.to_string(index=False))
    
    print("\n" + "="*70)
    print("üí° INTERPR√âTATION D√âTAILL√âE")
    print("="*70)
    
    # Interpr√©ter chaque coefficient
    for idx, row in coeffs.iterrows():
        regressor = row['regressor']
        coeff = row['coef']
        coeff_lower = row['coef_lower']
        coeff_upper = row['coef_upper']
        
        # D√©terminer le sens de l'effet
        if coeff > 0:
            effet = "üìà EFFET POSITIF"
            interpretation = "augmente la consommation"
        else:
            effet = "üìâ EFFET N√âGATIF"
            interpretation = "diminue la consommation"
        
        print(f"\nüîπ {regressor.upper()}")
        print(f"   Coefficient : {coeff:+.4f}")
        print(f"   Intervalle  : [{coeff_lower:.4f}, {coeff_upper:.4f}]")
        print(f"   {effet} ‚Üí {interpretation}")
        
        # Interpr√©tation sp√©cifique par r√©gresseur
        if regressor == 'temperature':
            if coeff > 0:
                print(f"   üí° Plus il fait chaud, plus la consommation augmente (+{abs(coeff):.4f} kg/¬∞C)")
            else:
                print(f"   üí° Plus il fait chaud, moins la consommation augmente ({coeff:.4f} kg/¬∞C)")
        
        elif regressor == 'taux_occupation':
            if coeff > 0:
                print(f"   üí° 1% d'occupation en plus = +{coeff:.4f} kg de consommation")
                print(f"   üí° Forte corr√©lation attendue : plus de patients = plus de repas")
        
        elif regressor == 'nb_patients':
            if coeff > 0:
                print(f"   üí° 1 patient suppl√©mentaire = +{coeff:.4f} kg")
        
        elif regressor == 'epidemie_grippe':
            if coeff > 0:
                print(f"   üí° En p√©riode d'√©pid√©mie : +{coeff:.4f} kg/jour")
            else:
                print(f"   üí° En p√©riode d'√©pid√©mie : {coeff:.4f} kg/jour (moins de consommation)")
    
    print("\n" + "="*70)
    print("‚úÖ Analyse des coefficients termin√©e !")
    
except Exception as e:
    print(f"‚ö†Ô∏è  Impossible d'extraire les coefficients : {e}")
    print("üí° Cela peut arriver si le mod√®le n'a pas converg√© correctement")

# üîÆ √âtape 12 : Pr√©dictions Futures et Visualisations

Maintenant que notre mod√®le est valid√©, nous allons l'utiliser pour **pr√©dire l'avenir** !

### üéØ Objectif

Pr√©dire la consommation pour les **28 prochains jours** (4 semaines) avec intervalles de confiance.

### üìä Processus

1. **R√©entra√Æner** le mod√®le sur **toutes les donn√©es** (train + test)
2. **Cr√©er** les 28 jours futurs avec valeurs des r√©gresseurs
3. **Pr√©dire** la consommation future
4. **Visualiser** les r√©sultats avec 3 graphiques professionnels

### üîß Gestion des R√©gresseurs Futurs

Pour les 28 jours futurs, nous devons fournir des valeurs pour nos 4 r√©gresseurs :

| R√©gresseur | Strat√©gie |
|------------|-----------|
| `temperature` | Utiliser la moyenne historique |
| `taux_occupation` | Utiliser la moyenne historique |
| `nb_patients` | Utiliser la moyenne historique |
| `epidemie_grippe` | 1 si hiver (janvier-mars), 0 sinon |

In [None]:
# R√©entra√Æner sur TOUTES les donn√©es (train + test)
print("üîÆ PR√âDICTIONS FUTURES (28 JOURS)")
print("="*70)

print("\n‚è≥ R√©entra√Ænement du mod√®le sur toutes les donn√©es...")

# Cr√©er un nouveau mod√®le avec la m√™me configuration
model_final = Prophet(
    holidays=holidays,
    holidays_prior_scale=10.0,
    yearly_seasonality=20,
    weekly_seasonality=5,
    daily_seasonality=False,
    seasonality_mode='multiplicative',
    seasonality_prior_scale=10.0,
    changepoints=changepoints_manuels,
    changepoint_prior_scale=0.5,
    changepoint_range=0.9,
    interval_width=0.85,
    growth='linear'
)

# Ajouter les m√™mes r√©gresseurs
model_final.add_regressor('temperature', prior_scale=0.5, standardize=True)
model_final.add_regressor('taux_occupation', prior_scale=1.0, standardize=True)
model_final.add_regressor('nb_patients', prior_scale=0.5, standardize=True)
model_final.add_regressor('epidemie_grippe', prior_scale=0.5, standardize=False)

# Fit sur TOUTES les donn√©es
model_final.fit(prophet_df)

print("‚úÖ Mod√®le r√©entra√Æn√© sur toutes les donn√©es !")
print(f"   Donn√©es utilis√©es : {len(prophet_df)} jours")

In [None]:
# Cr√©er le DataFrame futur avec r√©gresseurs
print("\nüîß Cr√©ation des 28 jours futurs avec r√©gresseurs...")

# Cr√©er les dates futures (28 jours)
future = model_final.make_future_dataframe(periods=28)

# Fusionner avec les r√©gresseurs existants
future = future.merge(
    prophet_df[['ds', 'temperature', 'taux_occupation', 'nb_patients', 'epidemie_grippe']],
    on='ds',
    how='left'
)

# Pour les jours futurs (NaN), utiliser des valeurs par d√©faut
print("   Remplissage des r√©gresseurs futurs...")

# R√©gresseurs continus : moyenne historique
for col in ['temperature', 'taux_occupation', 'nb_patients']:
    mean_value = prophet_df[col].mean()
    future[col].fillna(mean_value, inplace=True)
    print(f"   - {col} : {mean_value:.2f} (moyenne)")

# √âpid√©mie de grippe : activer si hiver (janvier-mars)
future['epidemie_grippe'].fillna(
    future['ds'].dt.month.isin([1, 2, 3]).astype(int),
    inplace=True
)
nb_jours_epidemie_futur = future[future['ds'] > prophet_df['ds'].max()]['epidemie_grippe'].sum()
print(f"   - epidemie_grippe : {nb_jours_epidemie_futur} jours d'√©pid√©mie pr√©vus")

print(f"\n‚úÖ {len(future)} jours pr√©par√©s (historique + 28 futurs)")

In [None]:
# G√©n√©rer les pr√©dictions
print("\n‚è≥ G√©n√©ration des pr√©dictions...")

forecast = model_final.predict(future)

# Extraire uniquement les pr√©dictions futures (28 jours)
predictions_futures = forecast[forecast['ds'] > prophet_df['ds'].max()].copy()

print(f"‚úÖ {len(predictions_futures)} jours de pr√©dictions g√©n√©r√©es !")
print(f"\nüìä STATISTIQUES DES PR√âDICTIONS")
print("="*70)
print(f"Total pr√©vu sur 28 jours  : {predictions_futures['yhat'].sum():.2f} kg")
print(f"Moyenne par jour          : {predictions_futures['yhat'].mean():.2f} kg")
print(f"Minimum pr√©vu             : {predictions_futures['yhat'].min():.2f} kg")
print(f"Maximum pr√©vu             : {predictions_futures['yhat'].max():.2f} kg")
print(f"√âcart-type                : {predictions_futures['yhat'].std():.2f} kg")
print("="*70)

In [None]:
# Aper√ßu des pr√©dictions
print("\nüëÄ Aper√ßu des 10 premiers jours de pr√©dictions :")
predictions_futures[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].head(10)

### üìà Visualisations Professionnelles

Nous allons cr√©er **3 graphiques** pour analyser les r√©sultats :

1. **Graphique Principal** : Pr√©dictions avec intervalle de confiance
2. **Composants** : D√©composition (tendance + saisonnalit√© + holidays)
3. **Changepoints** : Points de rupture de tendance

In [None]:
# Graphique 1 : Pr√©dictions principales
print("\nüìà G√âN√âRATION DES VISUALISATIONS")
print("="*70)

# Graphique principal avec pr√©dictions
fig1 = model_final.plot(forecast)
plt.title(f'Pr√©dictions Prophet - {PRODUIT_ANALYSE}', fontsize=16, fontweight='bold')
plt.xlabel('Date', fontsize=12)
plt.ylabel('Consommation (kg)', fontsize=12)
plt.tight_layout()

filename1 = f'predictions_{PRODUIT_ANALYSE.replace(" ", "_")}_enrichi.png'
plt.savefig(filename1, dpi=300, bbox_inches='tight')
print(f"‚úÖ Graphique 1 sauvegard√© : {filename1}")
plt.show()
plt.close()

In [None]:
# Graphique 2 : Composants (d√©composition)
fig2 = model_final.plot_components(forecast)
plt.tight_layout()

filename2 = f'components_{PRODUIT_ANALYSE.replace(" ", "_")}_enrichi.png'
plt.savefig(filename2, dpi=300, bbox_inches='tight')
print(f"‚úÖ Graphique 2 sauvegard√© : {filename2}")
print("   ‚Üí Montre la tendance, saisonnalit√© annuelle, hebdomadaire et holidays")
plt.show()
plt.close()

In [None]:
# Graphique 3 : Changepoints (points de rupture)
fig3 = model_final.plot(forecast)
add_changepoints_to_plot(fig3.gca(), model_final, forecast)
plt.title(f'Changepoints - {PRODUIT_ANALYSE}', fontsize=16, fontweight='bold')
plt.xlabel('Date', fontsize=12)
plt.ylabel('Consommation (kg)', fontsize=12)
plt.tight_layout()

filename3 = f'changepoints_{PRODUIT_ANALYSE.replace(" ", "_")}_enrichi.png'
plt.savefig(filename3, dpi=300, bbox_inches='tight')
print(f"‚úÖ Graphique 3 sauvegard√© : {filename3}")
print("   ‚Üí Montre les 5 changepoints manuels + ceux d√©tect√©s automatiquement")
plt.show()
plt.close()

print("\n" + "="*70)
print("‚úÖ 3 graphiques g√©n√©r√©s avec succ√®s !")
print("="*70)

# üíæ √âtape 13 : Export des R√©sultats

Nous allons maintenant **exporter** tous les r√©sultats dans des formats r√©utilisables :

### üìÅ Fichiers √† Exporter

1. **CSV** : Pr√©dictions des 28 jours avec intervalles de confiance
2. **JSON** : R√©sum√© complet (m√©triques + param√®tres + recommandations)
3. **PNG** : Les 3 graphiques g√©n√©r√©s

### üóÇÔ∏è Organisation avec Results Manager

Si le Results Manager est disponible, tous les fichiers seront automatiquement organis√©s dans un dossier horodat√© : `results/YYYYMMDD_HHMMSS/`

Cela permet de :
- Comparer plusieurs ex√©cutions
- Conserver l'historique des pr√©dictions
- Retrouver facilement les r√©sultats

In [None]:
# Export CSV des pr√©dictions
print("üíæ EXPORT DES R√âSULTATS")
print("="*70)

# Pr√©parer le DataFrame d'export
export_df = predictions_futures[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].copy()
export_df.columns = ['date', 'quantite_prevue', 'quantite_min', 'quantite_max']
export_df['date'] = export_df['date'].dt.date
export_df['produit'] = PRODUIT_ANALYSE
export_df['confiance'] = '85%'

# R√©organiser les colonnes
export_df = export_df[['date', 'produit', 'quantite_prevue', 'quantite_min', 'quantite_max', 'confiance']]

# Sauvegarder
filename_csv = f'predictions_{PRODUIT_ANALYSE.replace(" ", "_")}_enrichi_28j.csv'
export_df.to_csv(filename_csv, index=False, encoding='utf-8')
print(f"‚úÖ CSV sauvegard√© : {filename_csv}")
print(f"   ‚Üí {len(export_df)} jours de pr√©dictions")

In [None]:
# Export JSON du r√©sum√©
print("\nüìÑ Cr√©ation du r√©sum√© JSON...")

summary = {
    "produit": PRODUIT_ANALYSE,
    "date_analyse": datetime.now().strftime('%Y-%m-%d %H:%M:%S'),
    "dataset": {
        "fichier": "dataset_stock_hopital_ENRICHI.csv",
        "version": "3.0",
        "nb_lignes_total": len(df),
        "periode": f"{df['date'].min().date()} ‚Üí {df['date'].max().date()}"
    },
    "performance_modele": {
        "MAE": round(mae, 2),
        "MAPE": round(mape, 2),
        "RMSE": round(rmse, 2),
        "methode": "Prophet avec regressors enrichis",
        "verdict": verdict
    },
    "configuration_modele": {
        "holidays": ["jour_ferie", "vacances_scolaires", "covid_19"],
        "nb_holidays": len(holidays),
        "changepoints_manuels": changepoints_manuels,
        "nb_changepoints": len(changepoints_manuels),
        "regresseurs": ["temperature", "taux_occupation", "nb_patients", "epidemie_grippe"],
        "seasonality": {
            "yearly": 20,
            "weekly": 5,
            "mode": "multiplicative"
        }
    },
    "predictions": {
        "horizon": "28 jours",
        "periode": f"{predictions_futures['ds'].min().date()} ‚Üí {predictions_futures['ds'].max().date()}",
        "total_prevu": round(predictions_futures['yhat'].sum(), 2),
        "moyenne_jour": round(predictions_futures['yhat'].mean(), 2),
        "min_jour": round(predictions_futures['yhat'].min(), 2),
        "max_jour": round(predictions_futures['yhat'].max(), 2),
        "intervalle_confiance": "85%"
    },
    "recommandations": {
        "commande_hebdomadaire": round(predictions_futures['yhat'].mean() * 7, 2),
        "stock_securite": round(predictions_futures['yhat_upper'].max() * 1.2, 2),
        "attention": "Tenir compte des variations saisonni√®res"
    }
}

filename_json = f'summary_{PRODUIT_ANALYSE.replace(" ", "_")}_enrichi.json'
with open(filename_json, 'w', encoding='utf-8') as f:
    json.dump(summary, f, indent=2, ensure_ascii=False)

print(f"‚úÖ JSON sauvegard√© : {filename_json}")

In [None]:
# Sauvegarder avec Results Manager si disponible
if USE_RESULTS_MANAGER:
    print("\nüìÅ Sauvegarde avec Results Manager...")
    
    # Sauvegarder les graphiques
    for filename in [filename1, filename2, filename3]:
        results_mgr.save_graph(filename)
        print(f"   ‚úÖ {filename}")
    
    # Sauvegarder les donn√©es
    results_mgr.save_data(filename_csv)
    print(f"   ‚úÖ {filename_csv}")
    
    results_mgr.save_data(filename_json)
    print(f"   ‚úÖ {filename_json}")
    
    # Cr√©er le fichier README automatique
    results_mgr.create_summary_file(PRODUIT_ANALYSE, summary)
    
    print(f"\n‚úÖ Tous les r√©sultats sauvegard√©s dans :")
    print(f"   üìÇ {results_mgr.get_run_path()}")
else:
    print("\nüìÅ Fichiers sauvegard√©s dans le r√©pertoire courant")
    print(f"   üìÑ {filename_csv}")
    print(f"   üìÑ {filename_json}")
    print(f"   üìä {filename1}")
    print(f"   üìä {filename2}")
    print(f"   üìä {filename3}")

In [None]:
# Afficher le r√©sum√© final
print("\n" + "="*70)
print("üéâ ANALYSE TERMIN√âE AVEC SUCC√àS !")
print("="*70)

print(f"\nüìä R√âSUM√â FINAL")
print("="*70)
print(f"Produit analys√©       : {PRODUIT_ANALYSE}")
print(f"Dataset utilis√©       : Enrichi v3.0 ({len(df):,} lignes)")
print(f"Mod√®le                : Prophet avec 4 r√©gresseurs")
print(f"Performance (MAPE)    : {mape:.2f}%")
print(f"Pr√©dictions g√©n√©r√©es  : 28 jours ({predictions_futures['yhat'].sum():.2f} kg total)")
print(f"Graphiques cr√©√©s      : 3 visualisations PNG")
print(f"Fichiers export√©s     : CSV + JSON")
print("="*70)

print(f"\nüí° RECOMMANDATIONS")
print("="*70)
print(f"‚úÖ Commande hebdomadaire sugg√©r√©e : {summary['recommandations']['commande_hebdomadaire']:.2f} kg")
print(f"‚úÖ Stock de s√©curit√© sugg√©r√©      : {summary['recommandations']['stock_securite']:.2f} kg")
print(f"‚ö†Ô∏è  Attention : {summary['recommandations']['attention']}")
print("="*70)

print(f"\nüöÄ PROCHAINES √âTAPES")
print("   1. Analyser d'autres produits en changeant PRODUIT_ANALYSE")
print("   2. Comparer les r√©sultats avec le dataset de base")
print("   3. Ajuster les param√®tres si n√©cessaire")
print("   4. Mettre en production les pr√©dictions")
print("\n‚ú® Notebook termin√© ! Vous pouvez maintenant exploiter les r√©sultats.")