# Pr√©diction de Consommation √ânerg√©tique - Campus Aix

## Objectifs du projet

Ce notebook pr√©sente un pipeline complet de pr√©diction de consommation √©nerg√©tique horaire pour un campus, en utilisant :
- Des donn√©es temporelles (heure, jour, mois, ann√©e)
- Des variables m√©t√©orologiques
- Des features d√©riv√©es (lags, diff√©rences, encodages cycliques)
- Un mod√®le de r√©seau de neurones (MLPRegressor)

**Objectif m√©tier** : Pr√©dire la consommation √©nerg√©tique horaire pour optimiser la gestion des ressources.


## 1. Imports et Configuration

Importation des biblioth√®ques n√©cessaires et configuration de la reproductibilit√©.


In [None]:
import datetime
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error, mean_absolute_percentage_error
from sklearn.preprocessing import StandardScaler
import warnings
warnings.filterwarnings('ignore')

# Configuration pour la reproductibilit√©
np.random.seed(42)

# Configuration des graphiques
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 10

print("‚úì Imports effectu√©s avec succ√®s")


## 2. Chargement des Donn√©es

Chargement du fichier CSV contenant les donn√©es de consommation et les variables explicatives.


In [None]:
# Chargement des donn√©es
data = np.genfromtxt('conso_campus_aix.csv', delimiter=',', skip_header=1)

# Extraction de la variable cible (colonne 8 : consommation)
conso = data[:, 8]
y_orig = conso

# Extraction des variables temporelles
Jours_du_mois = data[:, 0].astype(int)
Mois_orig = data[:, 1].astype(int)
Annees_orig = data[:, 2].astype(int)
Heure_orig = data[:, 3].astype(int)

# Variables m√©t√©orologiques (colonnes 4, 5, 6, 7)
variables_meteo = data[:, [4, 5, 6, 7]]

print(f"‚úì Donn√©es charg√©es : {len(data)} observations")
print(f"  - Consommation : min={y_orig.min():.2f}, max={y_orig.max():.2f}, mean={y_orig.mean():.2f}")
print(f"  - P√©riode : {Annees_orig.min()}-{Mois_orig.min():02d} √† {Annees_orig.max()}-{Mois_orig.max():02d}")


## 3. Exploration des Donn√©es (EDA)

### 3.1. Analyse de la variable cible

Visualisation de la distribution et de l'√©volution temporelle de la consommation pour identifier :
- Les tendances et saisonnalit√©s
- Les valeurs aberrantes potentielles
- La distribution des valeurs


In [None]:
# Visualisation de l'√©volution temporelle de la consommation
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# S√©rie temporelle compl√®te
axes[0, 0].plot(y_orig[:1000], alpha=0.7, linewidth=0.5)
axes[0, 0].set_title('√âvolution de la consommation (1000 premi√®res heures)')
axes[0, 0].set_xlabel('Heures')
axes[0, 0].set_ylabel('Consommation')
axes[0, 0].grid(True, alpha=0.3)

# Distribution
axes[0, 1].hist(y_orig, bins=50, edgecolor='black', alpha=0.7)
axes[0, 1].set_title('Distribution de la consommation')
axes[0, 1].set_xlabel('Consommation')
axes[0, 1].set_ylabel('Fr√©quence')
axes[0, 1].axvline(y_orig.mean(), color='r', linestyle='--', label=f'Moyenne: {y_orig.mean():.2f}')
axes[0, 1].legend()

# Box plot pour d√©tecter les outliers
axes[1, 0].boxplot(y_orig, vert=True)
axes[1, 0].set_title('Box Plot - D√©tection des valeurs aberrantes')
axes[1, 0].set_ylabel('Consommation')
axes[1, 0].grid(True, alpha=0.3)

# Statistiques descriptives
stats_text = f"""
Statistiques descriptives :
- Min: {y_orig.min():.2f}
- Max: {y_orig.max():.2f}
- Moyenne: {y_orig.mean():.2f}
- M√©diane: {np.median(y_orig):.2f}
- √âcart-type: {y_orig.std():.2f}
- Skewness: {np.abs(y_orig - y_orig.mean()).mean() / y_orig.std():.2f}
"""
axes[1, 1].text(0.1, 0.5, stats_text, fontsize=11, verticalalignment='center',
                bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.5))
axes[1, 1].axis('off')

plt.tight_layout()
plt.show()


### 3.2. Analyse des patterns temporels

Analyse de la consommation selon l'heure, le jour de la semaine et le mois pour identifier les patterns cycliques.


In [None]:
# Calcul des jours de la semaine pour l'analyse
jours_de_la_semaine_temp = []
for annee, mois, jour in zip(Annees_orig, Mois_orig, Jours_du_mois):
    date_obj = datetime.date(annee, mois, jour)
    jours_de_la_semaine_temp.append(date_obj.weekday())
jours_de_la_semaine_temp = np.array(jours_de_la_semaine_temp)

# Visualisation des patterns temporels
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# Consommation par heure
conso_par_heure = [y_orig[Heure_orig == h].mean() for h in range(24)]
axes[0, 0].plot(range(24), conso_par_heure, marker='o', linewidth=2, markersize=6)
axes[0, 0].set_title('Consommation moyenne par heure de la journ√©e')
axes[0, 0].set_xlabel('Heure')
axes[0, 0].set_ylabel('Consommation moyenne')
axes[0, 0].set_xticks(range(0, 24, 2))
axes[0, 0].grid(True, alpha=0.3)

# Consommation par jour de la semaine
jours_noms = ['Lun', 'Mar', 'Mer', 'Jeu', 'Ven', 'Sam', 'Dim']
conso_par_jour = [y_orig[jours_de_la_semaine_temp == j].mean() for j in range(7)]
axes[0, 1].bar(jours_noms, conso_par_jour, color='steelblue', alpha=0.7)
axes[0, 1].set_title('Consommation moyenne par jour de la semaine')
axes[0, 1].set_ylabel('Consommation moyenne')
axes[0, 1].grid(True, alpha=0.3, axis='y')

# Consommation par mois
conso_par_mois = [y_orig[Mois_orig == m].mean() for m in range(1, 13)]
mois_noms = ['Jan', 'F√©v', 'Mar', 'Avr', 'Mai', 'Jun', 
             'Jul', 'Ao√ª', 'Sep', 'Oct', 'Nov', 'D√©c']
axes[1, 0].plot(range(1, 13), conso_par_mois, marker='o', linewidth=2, markersize=6, color='green')
axes[1, 0].set_title('Consommation moyenne par mois')
axes[1, 0].set_xlabel('Mois')
axes[1, 0].set_ylabel('Consommation moyenne')
axes[1, 0].set_xticks(range(1, 13))
axes[1, 0].set_xticklabels(mois_noms, rotation=45)
axes[1, 0].grid(True, alpha=0.3)

# Heatmap consommation par heure et jour de la semaine
heatmap_data = np.zeros((7, 24))
for j in range(7):
    for h in range(24):
        mask = (jours_de_la_semaine_temp == j) & (Heure_orig == h)
        if mask.sum() > 0:
            heatmap_data[j, h] = y_orig[mask].mean()
im = axes[1, 1].imshow(heatmap_data, aspect='auto', cmap='YlOrRd', interpolation='nearest')
axes[1, 1].set_title('Heatmap : Consommation par heure et jour de la semaine')
axes[1, 1].set_xlabel('Heure')
axes[1, 1].set_ylabel('Jour de la semaine')
axes[1, 1].set_yticks(range(7))
axes[1, 1].set_yticklabels(jours_noms)
axes[1, 1].set_xticks(range(0, 24, 2))
plt.colorbar(im, ax=axes[1, 1])

plt.tight_layout()
plt.show()


### 3.3. Analyse des corr√©lations et valeurs manquantes

V√©rification des corr√©lations entre variables m√©t√©orologiques et la consommation, ainsi que d√©tection des valeurs manquantes.


In [None]:
# V√©rification des valeurs manquantes
missing_data = np.isnan(data).sum(axis=0)
print("Valeurs manquantes par colonne :")
for i, missing in enumerate(missing_data):
    if missing > 0:
        print(f"  Colonne {i}: {missing} valeurs manquantes ({missing/len(data)*100:.2f}%)")
    else:
        print(f"  Colonne {i}: Aucune valeur manquante")

# Analyse des corr√©lations avec les variables m√©t√©orologiques
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Corr√©lations entre variables m√©t√©orologiques et consommation
corr_with_target = []
for i in range(4):
    corr = np.corrcoef(variables_meteo[:, i], y_orig)[0, 1]
    corr_with_target.append(corr)

axes[0].bar(range(1, 5), corr_with_target, color='coral', alpha=0.7)
axes[0].set_title('Corr√©lation entre variables m√©t√©o et consommation')
axes[0].set_xlabel('Variable m√©t√©o (colonne)')
axes[0].set_ylabel('Corr√©lation avec consommation')
axes[0].set_xticks(range(1, 5))
axes[0].axhline(0, color='black', linestyle='-', linewidth=0.5)
axes[0].grid(True, alpha=0.3, axis='y')

# Distribution des variables m√©t√©orologiques
axes[1].boxplot([variables_meteo[:, i] for i in range(4)], labels=[f'Var {i+4}' for i in range(4)])
axes[1].set_title('Distribution des variables m√©t√©orologiques')
axes[1].set_ylabel('Valeurs')
axes[1].grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

print(f"\n‚úì Corr√©lations variables m√©t√©o ‚Üí consommation : {[f'{c:.3f}' for c in corr_with_target]}")


### üìä Interpr√©tation & Pistes d'am√©lioration - EDA

**Observations cl√©s :**
- Distribution de la consommation : identifier si elle est normale, asym√©trique, ou pr√©sente des outliers
- Patterns temporels : heures de pointe, diff√©rences week-end/semaine, saisonnalit√©
- Corr√©lations m√©t√©o : quelles variables m√©t√©orologiques sont les plus pr√©dictives

**Pistes d'am√©lioration :**
- Appliquer une transformation (log, Box-Cox) si la distribution est asym√©trique
- Cr√©er des features d'interaction entre variables m√©t√©o et variables temporelles
- G√©rer les outliers si n√©cessaire (capping, suppression, ou mod√©lisation s√©par√©e)


## 4. Feature Engineering

### 4.1. Encodages cycliques

Les variables temporelles (heure, mois, jour de la semaine) sont cycliques. L'encodage sinuso√Ødal permet au mod√®le de comprendre cette cyclicit√© (ex: 23h est proche de 0h).


In [None]:
# Encodage cyclique de l'heure (24h)
H_sin = np.sin(2 * np.pi * Heure_orig / 24)
H_cos = np.cos(2 * np.pi * Heure_orig / 24)

# Encodage cyclique du mois (12 mois)
M_sin = np.sin(2 * np.pi * Mois_orig / 12)
M_cos = np.cos(2 * np.pi * Mois_orig / 12)

# Calcul du jour de la semaine
jours_de_la_semaine = []
for annee, mois, jour in zip(Annees_orig, Mois_orig, Jours_du_mois):
    date_obj = datetime.date(annee, mois, jour)
    jours_de_la_semaine.append(date_obj.weekday())
jours_de_la_semaine = np.array(jours_de_la_semaine)

# Encodage cyclique du jour de la semaine (7 jours)
S_sin = np.sin(2 * np.pi * jours_de_la_semaine / 7)
S_cos = np.cos(2 * np.pi * jours_de_la_semaine / 7)

print("‚úì Encodages cycliques cr√©√©s")
print(f"  - Heure: sin/cos (24h cycle)")
print(f"  - Mois: sin/cos (12 mois cycle)")
print(f"  - Jour semaine: sin/cos (7 jours cycle)")


### 4.2. Visualisation des encodages cycliques

Visualisation pour v√©rifier que les encodages capturent bien la cyclicit√© des variables temporelles.


In [None]:
# Visualisation des encodages cycliques
fig, axes = plt.subplots(1, 3, figsize=(18, 4))

# Encodage heure
axes[0].scatter(H_sin[:1000], H_cos[:1000], c=Heure_orig[:1000], cmap='hsv', alpha=0.6, s=10)
axes[0].set_title('Encodage cyclique de l\'heure (sin/cos)')
axes[0].set_xlabel('sin(2œÄ * heure / 24)')
axes[0].set_ylabel('cos(2œÄ * heure / 24)')
axes[0].grid(True, alpha=0.3)
axes[0].set_aspect('equal')

# Encodage mois
axes[1].scatter(M_sin[:1000], M_cos[:1000], c=Mois_orig[:1000], cmap='hsv', alpha=0.6, s=10)
axes[1].set_title('Encodage cyclique du mois (sin/cos)')
axes[1].set_xlabel('sin(2œÄ * mois / 12)')
axes[1].set_ylabel('cos(2œÄ * mois / 12)')
axes[1].grid(True, alpha=0.3)
axes[1].set_aspect('equal')

# Encodage jour de la semaine
axes[2].scatter(S_sin[:1000], S_cos[:1000], c=jours_de_la_semaine[:1000], cmap='hsv', alpha=0.6, s=10)
axes[2].set_title('Encodage cyclique du jour de la semaine (sin/cos)')
axes[2].set_xlabel('sin(2œÄ * jour / 7)')
axes[2].set_ylabel('cos(2œÄ * jour / 7)')
axes[2].grid(True, alpha=0.3)
axes[2].set_aspect('equal')

plt.tight_layout()
plt.show()


### 4.3. Variables binaires et cat√©gorielles

Cr√©ation de variables binaires pour capturer des effets sp√©cifiques (week-end, heures actives).


In [None]:
# Variable binaire Week-end (1 si samedi ou dimanche, 0 sinon)
is_weekend = (jours_de_la_semaine >= 5).astype(int)

# Variable binaire Heures actives (1 si entre 7h et 20h, 0 sinon)
# Cette variable aide le mod√®le √† mieux caler le "talon" de consommation nocturne
is_active_hours = ((Heure_orig >= 7) & (Heure_orig <= 20)).astype(int)

# Visualisation de l'impact de ces variables
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Impact du week-end
conso_weekend = y_orig[is_weekend == 1].mean()
conso_semaine = y_orig[is_weekend == 0].mean()
axes[0].bar(['Semaine', 'Week-end'], [conso_semaine, conso_weekend], 
            color=['steelblue', 'coral'], alpha=0.7)
axes[0].set_title('Consommation moyenne : Semaine vs Week-end')
axes[0].set_ylabel('Consommation moyenne')
axes[0].grid(True, alpha=0.3, axis='y')
diff_pct = ((conso_weekend - conso_semaine) / conso_semaine) * 100
axes[0].text(0.5, max(conso_semaine, conso_weekend) * 0.95, 
             f'Diff√©rence: {diff_pct:.1f}%', ha='center', fontsize=10,
             bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.5))

# Impact des heures actives
conso_active = y_orig[is_active_hours == 1].mean()
conso_inactive = y_orig[is_active_hours == 0].mean()
axes[1].bar(['Heures inactives\n(21h-6h)', 'Heures actives\n(7h-20h)'], 
            [conso_inactive, conso_active], color=['darkblue', 'orange'], alpha=0.7)
axes[1].set_title('Consommation moyenne : Heures actives vs inactives')
axes[1].set_ylabel('Consommation moyenne')
axes[1].grid(True, alpha=0.3, axis='y')
diff_pct2 = ((conso_active - conso_inactive) / conso_inactive) * 100
axes[1].text(0.5, max(conso_active, conso_inactive) * 0.95, 
             f'Diff√©rence: {diff_pct2:.1f}%', ha='center', fontsize=10,
             bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.5))

plt.tight_layout()
plt.show()

print(f"‚úì Variables binaires cr√©√©es")
print(f"  - Week-end: {is_weekend.sum()} observations ({is_weekend.sum()/len(is_weekend)*100:.1f}%)")
print(f"  - Heures actives: {is_active_hours.sum()} observations ({is_active_hours.sum()/len(is_active_hours)*100:.1f}%)")


### 4.4. Features temporelles avanc√©es (Lags et diff√©rences)

Les lags (valeurs pass√©es) et les diff√©rences capturent l'inertie et les tendances de la consommation.


In [None]:
# Cr√©ation des lags (valeurs pass√©es)
lag_1 = np.roll(y_orig, 1)   # Consommation 1h avant
lag_2 = np.roll(y_orig, 2)   # Consommation 2h avant
lag_24 = np.roll(y_orig, 24) # Consommation 24h avant (m√™me heure hier)
lag_168 = np.roll(y_orig, 168) # Consommation 168h avant (m√™me heure la semaine derni√®re)

# Cr√©ation des diff√©rences (tendances)
diff_1h = lag_1 - lag_2      # Variation sur 1h
diff_24h = lag_1 - lag_24    # Variation sur 24h

# Visualisation de l'importance des lags
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# Corr√©lation avec la cible
lags = [lag_1, lag_24, lag_168]
lag_names = ['Lag 1h', 'Lag 24h', 'Lag 168h']
correlations = [np.corrcoef(y_orig, lag)[0, 1] for lag in lags]

axes[0, 0].bar(lag_names, correlations, color='teal', alpha=0.7)
axes[0, 0].set_title('Corr√©lation des lags avec la consommation actuelle')
axes[0, 0].set_ylabel('Corr√©lation')
axes[0, 0].set_ylim([0, 1])
axes[0, 0].grid(True, alpha=0.3, axis='y')

# Visualisation des lags sur un extrait
sample_idx = slice(200, 400)
axes[0, 1].plot(y_orig[sample_idx], label='Consommation actuelle', linewidth=2)
axes[0, 1].plot(lag_1[sample_idx], label='Lag 1h', alpha=0.7, linestyle='--')
axes[0, 1].plot(lag_24[sample_idx], label='Lag 24h', alpha=0.7, linestyle=':')
axes[0, 1].set_title('Comparaison consommation actuelle vs lags (zoom 200h)')
axes[0, 1].set_xlabel('Heures')
axes[0, 1].set_ylabel('Consommation')
axes[0, 1].legend()
axes[0, 1].grid(True, alpha=0.3)

# Visualisation des diff√©rences
axes[1, 0].plot(diff_1h[sample_idx], label='Diff√©rence 1h', alpha=0.7, linewidth=1.5)
axes[1, 0].plot(diff_24h[sample_idx], label='Diff√©rence 24h', alpha=0.7, linewidth=1.5)
axes[1, 0].axhline(0, color='black', linestyle='-', linewidth=0.5)
axes[1, 0].set_title('Variations temporelles (diff√©rences)')
axes[1, 0].set_xlabel('Heures')
axes[1, 0].set_ylabel('Diff√©rence')
axes[1, 0].legend()
axes[1, 0].grid(True, alpha=0.3)

# Scatter plot lag_24 vs consommation (tr√®s corr√©l√©)
axes[1, 1].scatter(lag_24[168:], y_orig[168:], alpha=0.3, s=5)
axes[1, 1].plot([y_orig.min(), y_orig.max()], [y_orig.min(), y_orig.max()], 
                'r--', lw=2, label='y=x')
axes[1, 1].set_title(f'Lag 24h vs Consommation actuelle (corr={correlations[1]:.3f})')
axes[1, 1].set_xlabel('Consommation il y a 24h')
axes[1, 1].set_ylabel('Consommation actuelle')
axes[1, 1].legend()
axes[1, 1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"‚úì Features temporelles cr√©√©es")
print(f"  - Lags: 1h, 2h, 24h, 168h")
print(f"  - Diff√©rences: 1h, 24h")


### üìä Interpr√©tation & Pistes d'am√©lioration - Feature Engineering

**Observations cl√©s :**
- Les lags (surtout lag_24h) sont tr√®s corr√©l√©s avec la consommation actuelle ‚Üí indicateurs puissants
- Les encodages cycliques capturent bien les patterns temporels
- Les variables binaires (week-end, heures actives) montrent des diff√©rences significatives

**Pistes d'am√©lioration :**
- Ajouter des lags suppl√©mentaires (lag_48h, lag_336h pour capturer des cycles plus longs)
- Cr√©er des features d'interaction (ex: week-end √ó heure, m√©t√©o √ó saison)
- Tester des moyennes mobiles (rolling mean) pour lisser les variations
- Ajouter des features de tendance (d√©riv√©e seconde, acc√©l√©ration)


## 5. Pr√©paration des Donn√©es pour le Mod√®le

### 5.1. Construction de la matrice de features

Assemblage de toutes les features cr√©√©es en une matrice X et pr√©paration de la variable cible y.


In [None]:
# Construction de la matrice de features compl√®te
X_full = np.column_stack((
    variables_meteo,           # 4 variables m√©t√©orologiques
    M_sin, M_cos,              # Encodage cyclique mois (2 features)
    H_sin, H_cos,              # Encodage cyclique heure (2 features)
    S_sin, S_cos,              # Encodage cyclique jour semaine (2 features)
    is_weekend,                # Variable binaire week-end (1 feature)
    is_active_hours,           # Variable binaire heures actives (1 feature)
    lag_1, lag_24, lag_168,    # Lags temporels (3 features)
    diff_1h, diff_24h          # Diff√©rences temporelles (2 features)
))

# Suppression des premi√®res lignes (n√©cessaires pour les lags)
# On garde seulement les observations o√π tous les lags sont disponibles
X = X_full[168:]
y = y_orig[168:]

print(f"‚úì Matrice de features construite")
print(f"  - Nombre de features: {X.shape[1]}")
print(f"  - Nombre d'observations: {X.shape[0]} (apr√®s suppression des 168 premi√®res)")
print(f"  - Features: {X.shape[1]} variables")


### 5.2. Transformation de la variable cible

Application d'une transformation logarithmique (log1p) pour stabiliser la variance et am√©liorer les performances du mod√®le sur des donn√©es potentiellement asym√©triques.


In [None]:
# Transformation logarithmique de la variable cible
y_log = np.log1p(y)  # log1p(x) = log(1+x) pour g√©rer les valeurs proches de 0

# Visualisation de l'impact de la transformation
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Distribution avant transformation
axes[0].hist(y, bins=50, edgecolor='black', alpha=0.7, color='steelblue')
axes[0].set_title('Distribution de y (avant transformation)')
axes[0].set_xlabel('Consommation')
axes[0].set_ylabel('Fr√©quence')
axes[0].axvline(y.mean(), color='r', linestyle='--', label=f'Moyenne: {y.mean():.2f}')
axes[0].legend()

# Distribution apr√®s transformation
axes[1].hist(y_log, bins=50, edgecolor='black', alpha=0.7, color='coral')
axes[1].set_title('Distribution de y_log (apr√®s log1p)')
axes[1].set_xlabel('log(1 + Consommation)')
axes[1].set_ylabel('Fr√©quence')
axes[1].axvline(y_log.mean(), color='r', linestyle='--', label=f'Moyenne: {y_log.mean():.2f}')
axes[1].legend()

plt.tight_layout()
plt.show()

# Comparaison des statistiques
print("Statistiques avant/apr√®s transformation :")
print(f"  Avant - Skewness: {np.abs(y - y.mean()).mean() / y.std():.3f}")
print(f"  Apr√®s - Skewness: {np.abs(y_log - y_log.mean()).mean() / y_log.std():.3f}")
print(f"  ‚úì Transformation appliqu√©e pour stabiliser la variance")


### 5.3. Split train/test s√©quentiel

Pour les donn√©es temporelles, on utilise un split s√©quentiel (pas de shuffle) pour pr√©server l'ordre chronologique.


In [None]:
# Split s√©quentiel (80% train, 20% test)
test_size = 0.2
split_index = int(len(X) * (1 - test_size))

X_train, X_test = X[:split_index], X[split_index:]
y_train_log, y_test_log = y_log[:split_index], y_log[split_index:]
y_test_real = y[split_index:]  # On garde aussi les valeurs r√©elles pour l'√©valuation

print(f"‚úì Split s√©quentiel effectu√©")
print(f"  - Train: {len(X_train)} observations ({len(X_train)/len(X)*100:.1f}%)")
print(f"  - Test: {len(X_test)} observations ({len(X_test)/len(X)*100:.1f}%)")
print(f"  - P√©riode train: indices 0 √† {split_index-1}")
print(f"  - P√©riode test: indices {split_index} √† {len(X)-1}")

# Visualisation du split
fig, ax = plt.subplots(figsize=(15, 4))
ax.plot(range(len(y)), y, alpha=0.6, linewidth=0.5, label='Donn√©es compl√®tes')
ax.axvline(split_index, color='r', linestyle='--', linewidth=2, label=f'Split train/test (index {split_index})')
ax.set_title('Visualisation du split train/test')
ax.set_xlabel('Index')
ax.set_ylabel('Consommation')
ax.legend()
ax.grid(True, alpha=0.3)
plt.show()


### 5.4. Normalisation des features

Standardisation des features pour que toutes les variables soient √† la m√™me √©chelle, ce qui am√©liore les performances des r√©seaux de neurones.


In [None]:
# Normalisation avec StandardScaler (moyenne=0, √©cart-type=1)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Visualisation de l'impact de la normalisation
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Distribution d'une feature avant normalisation (ex: premi√®re variable m√©t√©o)
feature_idx = 0
axes[0].hist(X_train[:, feature_idx], bins=50, edgecolor='black', alpha=0.7, color='steelblue')
axes[0].set_title(f'Feature {feature_idx} avant normalisation')
axes[0].set_xlabel('Valeur')
axes[0].set_ylabel('Fr√©quence')
axes[0].axvline(X_train[:, feature_idx].mean(), color='r', linestyle='--', 
                label=f'Moyenne: {X_train[:, feature_idx].mean():.2f}')
axes[0].legend()

# Distribution apr√®s normalisation
axes[1].hist(X_train_scaled[:, feature_idx], bins=50, edgecolor='black', alpha=0.7, color='coral')
axes[1].set_title(f'Feature {feature_idx} apr√®s normalisation (StandardScaler)')
axes[1].set_xlabel('Valeur normalis√©e')
axes[1].set_ylabel('Fr√©quence')
axes[1].axvline(X_train_scaled[:, feature_idx].mean(), color='r', linestyle='--', 
                label=f'Moyenne: {X_train_scaled[:, feature_idx].mean():.3f}')
axes[1].legend()

plt.tight_layout()
plt.show()

print(f"‚úì Normalisation effectu√©e")
print(f"  - Moyenne train (apr√®s scaling): {X_train_scaled.mean():.6f} (‚âà 0)")
print(f"  - √âcart-type train (apr√®s scaling): {X_train_scaled.std():.6f} (‚âà 1)")


## 6. Mod√©lisation

### 6.1. Configuration et entra√Ænement du mod√®le MLP

Utilisation d'un Multi-Layer Perceptron (r√©seau de neurones) pour capturer les relations non-lin√©aires complexes entre les features et la consommation.


In [None]:
# Configuration du mod√®le MLPRegressor
mlp = MLPRegressor(
    hidden_layer_sizes=(100, 100, 50),  # Architecture: 3 couches cach√©es
    activation='relu',                   # Fonction d'activation ReLU
    solver='adam',                       # Optimiseur Adam
    max_iter=2000,                       # Nombre maximum d'it√©rations
    early_stopping=True,                 # Arr√™t anticip√© si pas d'am√©lioration
    n_iter_no_change=20,                # Nombre d'it√©rations sans am√©lioration avant arr√™t
    alpha=0.5,                           # R√©gularisation L2
    random_state=42                      # Pour la reproductibilit√©
)

print("Configuration du mod√®le MLP:")
print(f"  - Architecture: {mlp.hidden_layer_sizes}")
print(f"  - Activation: {mlp.activation}")
print(f"  - Optimiseur: {mlp.solver}")
print(f"  - R√©gularisation (alpha): {mlp.alpha}")
print(f"  - Early stopping: {mlp.early_stopping}")

# Entra√Ænement du mod√®le
print("\n‚è≥ Entra√Ænement en cours...")
mlp.fit(X_train_scaled, y_train_log)
print("‚úì Mod√®le entra√Æn√© avec succ√®s")


### 6.2. Analyse de la courbe d'apprentissage

Visualisation de l'√©volution de la loss pendant l'entra√Ænement pour d√©tecter le surapprentissage ou le sous-apprentissage.


In [None]:
# R√©cup√©ration de la courbe de loss
if hasattr(mlp, 'loss_curve_'):
    fig, ax = plt.subplots(figsize=(12, 6))
    ax.plot(mlp.loss_curve_, linewidth=2, color='steelblue')
    ax.set_title('Courbe d\'apprentissage - √âvolution de la loss')
    ax.set_xlabel('It√©rations')
    ax.set_ylabel('Loss (MSE)')
    ax.grid(True, alpha=0.3)
    
    # Marquer le point d'arr√™t si early stopping a √©t√© utilis√©
    if mlp.n_iter_ < mlp.max_iter:
        ax.axvline(mlp.n_iter_, color='r', linestyle='--', 
                   label=f'Arr√™t anticip√© √† l\'it√©ration {mlp.n_iter_}')
        ax.legend()
    
    plt.tight_layout()
    plt.show()
    
    print(f"‚úì Nombre d'it√©rations effectu√©es: {mlp.n_iter_}")
    print(f"  - Loss finale: {mlp.loss_curve_[-1]:.6f}")
    if len(mlp.loss_curve_) > 1:
        print(f"  - Am√©lioration: {((mlp.loss_curve_[0] - mlp.loss_curve_[-1]) / mlp.loss_curve_[0] * 100):.2f}%")
else:
    print("‚ö† Courbe de loss non disponible (peut n√©cessiter validation_fraction > 0)")


### üìä Interpr√©tation & Pistes d'am√©lioration - Mod√©lisation

**Observations cl√©s :**
- La courbe d'apprentissage montre si le mod√®le converge correctement
- L'early stopping permet d'√©viter le surapprentissage
- L'architecture (100, 100, 50) peut √™tre optimis√©e selon les performances

**Pistes d'am√©lioration :**
- Tester diff√©rentes architectures (plus profondes, plus larges, ou dropout)
- Ajuster les hyperparam√®tres (learning_rate, alpha, batch_size)
- Utiliser la validation crois√©e temporelle (TimeSeriesSplit) pour mieux √©valuer
- Tester d'autres mod√®les (XGBoost, LSTM pour s√©ries temporelles, ensemble methods)


## 7. √âvaluation du Mod√®le

### 7.1. Pr√©dictions et inversion de la transformation

Les pr√©dictions sont faites sur l'√©chelle logarithmique, puis invers√©es pour revenir √† l'√©chelle originale.


In [None]:
# Pr√©dictions sur l'√©chelle logarithmique
y_pred_test_log = mlp.predict(X_test_scaled)

# Inversion de la transformation logarithmique
y_pred_test = np.expm1(y_pred_test_log)  # expm1(x) = exp(x) - 1, inverse de log1p

print("‚úì Pr√©dictions g√©n√©r√©es et transform√©es")
print(f"  - Nombre de pr√©dictions: {len(y_pred_test)}")
print(f"  - Min pr√©dit: {y_pred_test.min():.2f}, Max pr√©dit: {y_pred_test.max():.2f}")
print(f"  - Min r√©el: {y_test_real.min():.2f}, Max r√©el: {y_test_real.max():.2f}")


### 7.2. Calcul des m√©triques d'√©valuation

Calcul des m√©triques principales pour √©valuer la performance du mod√®le : RMSE, MAE, et MAPE.


In [None]:
# Calcul des m√©triques
rmse_test = np.sqrt(mean_squared_error(y_test_real, y_pred_test))
mae_test = mean_absolute_error(y_test_real, y_pred_test)
mape_test = mean_absolute_percentage_error(y_test_real, y_pred_test) * 100

# Affichage des r√©sultats
print("=" * 50)
print("R√âSULTATS FINAUX - √âVALUATION SUR LE TEST SET")
print("=" * 50)
print(f"RMSE Test : {rmse_test:.2f} (Root Mean Squared Error)")
print(f"MAE Test  : {mae_test:.2f} (Mean Absolute Error)")
print(f"MAPE Test : {mape_test:.2f}% (Mean Absolute Percentage Error)")
print("=" * 50)

# Visualisation des m√©triques
fig, ax = plt.subplots(figsize=(10, 6))
metrics = ['RMSE', 'MAE', 'MAPE (%)']
values = [rmse_test, mae_test, mape_test]
colors = ['steelblue', 'coral', 'teal']

bars = ax.bar(metrics, values, color=colors, alpha=0.7, edgecolor='black')
ax.set_title('M√©triques d\'√©valuation du mod√®le')
ax.set_ylabel('Valeur')
ax.grid(True, alpha=0.3, axis='y')

# Ajouter les valeurs sur les barres
for bar, val in zip(bars, values):
    height = bar.get_height()
    ax.text(bar.get_x() + bar.get_width()/2., height,
            f'{val:.2f}', ha='center', va='bottom', fontsize=11, fontweight='bold')

plt.tight_layout()
plt.show()


### 7.3. Visualisation des pr√©dictions vs valeurs r√©elles

Comparaison visuelle des pr√©dictions avec les valeurs r√©elles pour identifier les patterns d'erreur.


In [None]:
# Graphique temporel : pr√©dictions vs r√©elles (zoom sur les 200 derni√®res heures)
fig, axes = plt.subplots(2, 1, figsize=(15, 10))

# Zoom sur 200 heures
zoom_size = 200
axes[0].plot(y_test_real[-zoom_size:], label="Valeurs r√©elles", 
             color='black', alpha=0.7, linewidth=1.5)
axes[0].plot(y_pred_test[-zoom_size:], label=f"Pr√©dictions (MAPE: {mape_test:.2f}%)", 
             color='red', linestyle='--', linewidth=1.5, alpha=0.8)
axes[0].set_title(f'Comparaison Pr√©dictions vs R√©elles - Zoom sur {zoom_size} derni√®res heures')
axes[0].set_xlabel('Heures (dans le test set)')
axes[0].set_ylabel('Consommation')
axes[0].legend(loc='best')
axes[0].grid(True, alpha=0.3)

# Erreurs r√©siduelles
errors = y_test_real[-zoom_size:] - y_pred_test[-zoom_size:]
axes[1].plot(errors, color='purple', alpha=0.7, linewidth=1)
axes[1].axhline(0, color='black', linestyle='-', linewidth=0.5)
axes[1].fill_between(range(len(errors)), errors, 0, alpha=0.3, color='purple')
axes[1].set_title(f'Erreurs r√©siduelles - Zoom sur {zoom_size} derni√®res heures')
axes[1].set_xlabel('Heures (dans le test set)')
axes[1].set_ylabel('Erreur (R√©el - Pr√©dit)')
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()


### 7.4. Scatter plot et analyse de corr√©lation

Analyse de la corr√©lation entre pr√©dictions et valeurs r√©elles pour √©valuer la qualit√© du mod√®le.


In [None]:
# Scatter plot : Pr√©dictions vs R√©elles
fig, axes = plt.subplots(1, 2, figsize=(15, 6))

# Scatter plot avec ligne parfaite
correlation = np.corrcoef(y_test_real, y_pred_test)[0, 1]
axes[0].scatter(y_test_real, y_pred_test, alpha=0.5, color='blue', s=10)
axes[0].plot([y_test_real.min(), y_test_real.max()], 
             [y_test_real.min(), y_test_real.max()], 
             'r--', lw=2, label='Ligne parfaite (y=x)')
axes[0].set_xlabel('Valeurs R√©elles')
axes[0].set_ylabel('Valeurs Pr√©dites')
axes[0].set_title(f'Pr√©dictions vs R√©elles (Corr√©lation: {correlation:.3f}, MAPE: {mape_test:.2f}%)')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Distribution des erreurs
errors_all = y_test_real - y_pred_test
axes[1].hist(errors_all, bins=50, edgecolor='black', alpha=0.7, color='coral')
axes[1].axvline(0, color='r', linestyle='--', linewidth=2, label='Erreur = 0')
axes[1].axvline(errors_all.mean(), color='g', linestyle='--', linewidth=2, 
                label=f'Moyenne: {errors_all.mean():.2f}')
axes[1].set_title('Distribution des erreurs de pr√©diction')
axes[1].set_xlabel('Erreur (R√©el - Pr√©dit)')
axes[1].set_ylabel('Fr√©quence')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Statistiques des erreurs
print(f"\nAnalyse des erreurs :")
print(f"  - Erreur moyenne: {errors_all.mean():.2f} (id√©alement proche de 0)")
print(f"  - √âcart-type des erreurs: {errors_all.std():.2f}")
print(f"  - Corr√©lation pr√©dictions/r√©elles: {correlation:.4f}")
if abs(errors_all.mean()) < errors_all.std() * 0.1:
    print(f"  ‚úì Le mod√®le ne pr√©sente pas de biais significatif")
else:
    print(f"  ‚ö† Le mod√®le pr√©sente un biais (erreur moyenne ‚â† 0)")


### 7.5. Analyse des erreurs par contexte

Analyse des performances selon diff√©rents contextes (heure, jour de la semaine, week-end) pour identifier les situations o√π le mod√®le performe moins bien.


In [None]:
# Extraction des contextes pour le test set
test_heures = Heure_orig[168+split_index:]
test_jours_semaine = jours_de_la_semaine[168+split_index:]
test_is_weekend = is_weekend[168+split_index:]

# Calcul du MAPE par contexte
def calculate_mape_by_context(context_values, context_name):
    """Calcule le MAPE pour chaque valeur unique du contexte"""
    unique_values = np.unique(context_values)
    mape_by_context = {}
    for val in unique_values:
        mask = context_values == val
        if mask.sum() > 0:
            mape = mean_absolute_percentage_error(y_test_real[mask], y_pred_test[mask]) * 100
            mape_by_context[val] = mape
    return mape_by_context

# MAPE par heure
mape_by_hour = calculate_mape_by_context(test_heures, "heure")
mape_by_weekday = calculate_mape_by_context(test_jours_semaine, "jour_semaine")

# Visualisation
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# MAPE par heure
hours = sorted(mape_by_hour.keys())
mape_hours = [mape_by_hour[h] for h in hours]
axes[0].plot(hours, mape_hours, marker='o', linewidth=2, markersize=6, color='steelblue')
axes[0].axhline(mape_test, color='r', linestyle='--', label=f'MAPE moyen: {mape_test:.2f}%')
axes[0].set_title('MAPE par heure de la journ√©e')
axes[0].set_xlabel('Heure')
axes[0].set_ylabel('MAPE (%)')
axes[0].set_xticks(range(0, 24, 2))
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# MAPE par jour de la semaine
jours_noms = ['Lun', 'Mar', 'Mer', 'Jeu', 'Ven', 'Sam', 'Dim']
jours_idx = sorted(mape_by_weekday.keys())
mape_days = [mape_by_weekday[j] for j in jours_idx]
axes[1].bar(jours_noms, mape_days, color='coral', alpha=0.7)
axes[1].axhline(mape_test, color='r', linestyle='--', label=f'MAPE moyen: {mape_test:.2f}%')
axes[1].set_title('MAPE par jour de la semaine')
axes[1].set_ylabel('MAPE (%)')
axes[1].legend()
axes[1].grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

# Identification des heures/jours avec les meilleures/pires performances
worst_hour = max(mape_by_hour, key=mape_by_hour.get)
best_hour = min(mape_by_hour, key=mape_by_hour.get)
worst_day = max(mape_by_weekday, key=mape_by_weekday.get)
best_day = min(mape_by_weekday, key=mape_by_weekday.get)

print(f"\nAnalyse des performances par contexte :")
print(f"  - Meilleure heure: {best_hour}h (MAPE: {mape_by_hour[best_hour]:.2f}%)")
print(f"  - Pire heure: {worst_hour}h (MAPE: {mape_by_hour[worst_hour]:.2f}%)")
print(f"  - Meilleur jour: {jours_noms[best_day]} (MAPE: {mape_by_weekday[best_day]:.2f}%)")
print(f"  - Pire jour: {jours_noms[worst_day]} (MAPE: {mape_by_weekday[worst_day]:.2f}%)")


## 8. Analyse des R√©sultats et Conclusion

### üìä Interpr√©tation & Pistes d'am√©lioration - √âvaluation

**Observations cl√©s :**
- **Performance globale** : Le MAPE, RMSE et MAE donnent une id√©e de la pr√©cision du mod√®le
- **Distribution des erreurs** : Si centr√©e sur 0, le mod√®le n'a pas de biais syst√©matique
- **Erreurs par contexte** : Identifier les heures/jours o√π le mod√®le performe moins bien permet de cibler les am√©liorations

**Points forts identifi√©s :**
- Les lags temporels (surtout lag_24h) sont tr√®s pr√©dictifs
- Les encodages cycliques capturent bien les patterns saisonniers
- Le mod√®le suit g√©n√©ralement bien les tendances

**Points √† am√©liorer :**
- Si certaines heures/jours ont un MAPE √©lev√©, cr√©er des features sp√©cifiques pour ces contextes
- Si les erreurs sont corr√©l√©es (autocorr√©lation), consid√©rer des mod√®les de s√©ries temporelles (LSTM, ARIMA)
- Tester des ensembles de mod√®les (stacking, blending) pour am√©liorer la robustesse

**Pistes d'am√©lioration techniques :**
1. **Feature engineering avanc√©** :
   - Features d'interaction (m√©t√©o √ó saison, week-end √ó heure)
   - Moyennes mobiles et tendances
   - Features de pointe (d√©tection des pics de consommation)

2. **Mod√©lisation** :
   - Hyperparameter tuning (GridSearch/RandomSearch)
   - Mod√®les de s√©ries temporelles (LSTM, GRU, Transformer)
   - Ensemble methods (XGBoost, LightGBM, stacking)

3. **Validation** :
   - Validation crois√©e temporelle (TimeSeriesSplit)
   - Validation sur plusieurs p√©riodes pour tester la robustesse

4. **Post-processing** :
   - Lissage des pr√©dictions si n√©cessaire
   - Ajustement des pr√©dictions selon le contexte (calibrage)

---

**Notebook pr√™t pour it√©ration et am√©lioration continue ! üöÄ**
