# Package

In [None]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
import shap
from sklearn.metrics import mean_absolute_error, mean_squared_error
from scipy.stats import pearsonr
from sklearn.utils import shuffle
import pickle

  from .autonotebook import tqdm as notebook_tqdm


# Importation

In [None]:
# Les donn√©es
df_stationary_test = pd.read_csv("df_stationary_test.csv", index_col="date")
df_stationary_test.index = pd.to_datetime(df_stationary_test.index)

In [5]:
import pickle

# Nom du fichier du mod√®le sauvegard√©
file_name = "OLS_h12_expanding_window.pkl"

# üîÅ Charger le fichier
with open(file_name, "rb") as f:
    exp_results = pickle.load(f)

# Extraire uniquement les mod√®les
models = exp_results["models"]

print(f"‚úÖ {len(models)} mod√®les OLS recharg√©s avec succ√®s depuis '{file_name}'.")

‚úÖ 29 mod√®les OLS recharg√©s avec succ√®s depuis 'OLS_h12_expanding_window.pkl'.


# 1) Param√®tres & sous-ensemble TRAIN global

In [7]:
# ================== TEST AVEC MOD√àLE PR√â-ENTRA√éN√â (reconstruit les transfos) ==================
import pickle
import numpy as np
import pandas as pd
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error

# 1) Charger le pack
with open("OLS_h12_expanding_window.pkl", "rb") as f:
    exp_results = pickle.load(f)

models        = exp_results["models"]
train_periods = exp_results["train_periods"]
params        = exp_results["params"]

# R√©cup params (fallback si manquants)
h             = params.get("h", 12)
winsor_level  = params.get("winsor_level", 0.01)
cols_tx       = params.get("features", [c for c in df_stationary_train.columns if c != "UNRATE"])

# 2) RECONSTRUIRE les transfos de la DERNI√àRE fen√™tre d'entra√Ænement
last_train_end = pd.to_datetime(train_periods[-1])  # ex. 1989-12
df_train_global = df_stationary_train.loc[:last_train_end].copy().sort_index()

# Aligner X_t avec Y_{t+h} pour le fit (comme lors de l'entra√Ænement)
if len(df_train_global) <= h:
    raise ValueError("Fen√™tre d'entra√Ænement trop courte pour reconstruire les transfos.")
X_last = df_train_global.loc[:, cols_tx].iloc[:-h].copy()
Y_last = df_train_global["UNRATE"].shift(-h).iloc[:-h].copy()
valid  = ~(X_last.isnull().any(axis=1) | Y_last.isnull())
X_last = X_last.loc[valid]

# Winsor + normalisation (transfos √† r√©utiliser sur le test)
lower_wins = X_last.quantile(winsor_level)
upper_wins = X_last.quantile(1 - winsor_level)
Xw_last    = X_last.clip(lower=lower_wins, upper=upper_wins, axis=1)
mean_last  = Xw_last.mean()
std_last   = Xw_last.std().replace(0, 1)

# 3) Jeu de TEST (dates post√©rieures √† last_train_end)
df_test_full = df_stationary_test.copy().sort_index()
df_test      = df_test_full.loc[last_train_end:]  # pour chaque t on pr√©dit y_{t+h}

# 4) Pr√©dire √† horizon h avec le DERNIER mod√®le (aucune r√©estimation)
model_final = models[-1]
records = []

for t_date in df_test.index:
    # v√©rifier t+h dans df_test_full
    try:
        t_pos = df_test_full.index.get_loc(t_date)
    except KeyError:
        continue
    target_pos = t_pos + h
    if target_pos >= len(df_test_full):
        break

    # X_t (1xK) + m√™mes transfos que sur la derni√®re fen√™tre d'entra√Ænement
    x_t  = df_test_full.loc[[t_date], cols_tx].copy()
    xw_t = x_t.clip(lower=lower_wins, upper=upper_wins, axis=1)
    xs_t = (xw_t - mean_last) / std_last

    y_hat = float(model_final.predict(xs_t)[0])
    target_date = df_test_full.index[target_pos]
    y_true = float(df_test_full.loc[target_date, "UNRATE"])

    records.append({"origin": t_date, "target": target_date, "y_hat": y_hat, "y_true": y_true})

forecast_test_df = pd.DataFrame(records)

# 5) √âvaluation
if forecast_test_df.empty:
    print("Aucune pr√©vision produite sur le test (v√©rifie dates et horizon h).")
else:
    y, yhat = forecast_test_df["y_true"].values, forecast_test_df["y_hat"].values
    r2   = r2_score(y, yhat)
    mae  = mean_absolute_error(y, yhat)
    rmse = np.sqrt(mean_squared_error(y, yhat))
    corr = np.corrcoef(y, yhat)[0, 1]

    print(f"\n=== TEST pseudo-OOS (h = {h} mois) ===")
    print(f"R¬≤   : {r2:.3f}\nMAE  : {mae:.3f}\nRMSE : {rmse:.3f}\nCorr : {corr:.3f}")

    forecast_test_df.to_csv("forecast_test_OLS.csv", index=False)
    print("Pr√©visions test export√©es -> forecast_test_OLS.csv")

NameError: name 'df_stationary_train' is not defined

In [21]:
# ===================== √âVALUATION PSEUDO‚ÄìOUT-OF-SAMPLE =====================
import numpy as np
import pandas as pd
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error
from sklearn.linear_model import LinearRegression
from scipy.stats import pearsonr

# 1Ô∏è‚É£ Rassembler les pr√©visions
forecast_df = pd.DataFrame(forecast_records).dropna(subset=["y_true", "y_hat"]).copy()
forecast_df = forecast_df.sort_values("target").reset_index(drop=True)

def r2_origin_reg(y, yhat):
    """R¬≤ d'une r√©gression √† l‚Äôorigine: y ‚âà b * yhat (sans intercept)."""
    denom = np.dot(yhat, yhat)
    if denom == 0:
        return np.nan
    b = np.dot(yhat, y) / denom
    sse = np.sum((y - b * yhat) ** 2)
    sst = np.sum((y - y.mean()) ** 2)
    return 1 - sse / sst if sst > 0 else np.nan

def corr_pvalue(y, yhat):
    if len(y) < 3:
        return np.nan, np.nan
    r, p = pearsonr(y, yhat)
    return float(r), float(p)

if forecast_df.empty:
    print("\n[√âVALUATION] Aucune pr√©vision disponible (forecast_df est vide).")
else:
    y = forecast_df["y_true"].values
    yhat = forecast_df["y_hat"].values

    # 2Ô∏è‚É£ M√©triques principales
    r2   = r2_score(y, yhat)
    mae  = mean_absolute_error(y, yhat)
    rmse = np.sqrt(mean_squared_error(y, yhat))   # ‚úÖ compatible toutes versions
    r2_o = r2_origin_reg(y, yhat)
    corr, pval = corr_pvalue(y, yhat)
    amd  = float(abs(np.mean(y - yhat)))          # biais absolu moyen

    # 3Ô∏è‚É£ Benchmark na√Øf (utile si la cible est Œî12 UNRATE)
    yhat_naive0 = np.zeros_like(y)
    mae_naive0  = mean_absolute_error(y, yhat_naive0)
    rmse_naive0 = np.sqrt(mean_squared_error(y, yhat_naive0))

    # 4Ô∏è‚É£ Pr√©cision directionnelle
    hit_rate = float(np.mean(np.sign(y) == np.sign(yhat))) if len(y) > 0 else np.nan

    # 5Ô∏è‚É£ Calibration (Mincer‚ÄìZarnowitz): y = a + b * yhat
    reg = LinearRegression()
    reg.fit(yhat.reshape(-1, 1), y)
    a_calib = float(reg.intercept_)
    b_calib = float(reg.coef_[0])

    # 6Ô∏è‚É£ R√©sum√© par d√©cennie (facultatif)
    by_decade = (
        forecast_df.assign(decade=forecast_df["target"].dt.year // 10 * 10)
                   .groupby("decade")
                   .apply(lambda g: pd.Series({
                       "n": len(g),
                       "MAE": mean_absolute_error(g["y_true"], g["y_hat"]),
                       "RMSE": np.sqrt(mean_squared_error(g["y_true"], g["y_hat"]))
                   }))
                   .reset_index()
    )

    # 7Ô∏è‚É£ Impression des r√©sultats
    print("\n=== √âVALUATION PSEUDO‚ÄìOOS (h = {} mois) ===".format(h))
    print(f"R¬≤            : {r2:.3f}")
    print(f"R¬≤ (origin)   : {r2_o:.3f}")
    print(f"MAE           : {mae:.3f}")
    print(f"RMSE          : {rmse:.3f}")
    print(f"Corr(y, yÃÇ)   : {corr:.3f}  (p={pval:.3g})")
    print(f"Hit rate sign : {hit_rate:.3f}")
    print(f"AMD (|bias|)  : {amd:.3f}")

    print("\n--- Benchmark na√Øf (z√©ro-changement) ---")
    print(f"MAE_na√Øf0     : {mae_naive0:.3f}")
    print(f"RMSE_na√Øf0    : {rmse_naive0:.3f}")

    if not by_decade.empty:
        print("\n--- MAE/RMSE par d√©cennie ---")
        print(by_decade.to_string(index=False))

    # 8Ô∏è‚É£ Sauvegarde des r√©sultats
    eval_results = {
        "overall": {
            "r2": r2, "r2_origin": r2_o, "mae": mae, "rmse": rmse,
            "corr": corr, "pval": pval, "hit_rate": hit_rate, "amd": amd
        },
        "benchmark_naive0": {
            "mae": mae_naive0, "rmse": rmse_naive0
        },
        "calibration": {
            "intercept": a_calib, "slope": b_calib
        },
        "by_decade": by_decade,
        "forecast_df": forecast_df
    }

    print("\n‚úÖ √âvaluation termin√©e. R√©sultats enregistr√©s dans eval_results.")


=== √âVALUATION PSEUDO‚ÄìOOS (h = 12 mois) ===
R¬≤            : 0.095
R¬≤ (origin)   : 0.205
MAE           : 0.809
RMSE          : 1.058
Corr(y, yÃÇ)   : 0.453  (p=0.0154)
Hit rate sign : 0.714
AMD (|bias|)  : 0.010

--- Benchmark na√Øf (z√©ro-changement) ---
MAE_na√Øf0     : 0.800
RMSE_na√Øf0    : 1.113

--- MAE/RMSE par d√©cennie ---
 decade    n      MAE     RMSE
   1960  8.0 0.695125 1.136080
   1970 10.0 0.772075 0.930614
   1980 10.0 0.937675 1.112530

‚úÖ √âvaluation termin√©e. R√©sultats enregistr√©s dans eval_results.


  .apply(lambda g: pd.Series({


In [None]:
# ==========================================================
# üîç IMPORTANCE PAR PERMUTATION ‚Äî PSEUDO-OOS
# ==========================================================
import numpy as np
import pandas as pd
from sklearn.metrics import mean_absolute_error, mean_squared_error

def permutation_importance_pseudo_oos(models, df_train_global, cols_tx, h=12, n_repeats=20, metric=mean_absolute_error):
    """
    Importance par permutation pour une s√©rie de mod√®les OLS entra√Æn√©s
    selon une logique expanding window pseudo‚ÄìOOS.
    -> aucune r√©estimation
    -> mesure la d√©gradation moyenne de la performance apr√®s permutation de chaque variable
    """
    var_imp = {col: [] for col in cols_tx}

    for i, model in enumerate(models):
        # Reconstituer la fen√™tre utilis√©e par le mod√®le i
        end_idx = (i + 1) * 12  # correspond √† ton step_size = 12
        df_win = df_train_global.iloc[:end_idx].copy()

        if len(df_win) <= h:
            continue

        # Pr√©paration des donn√©es (alignement X_t avec Y_{t+h})
        X = df_win[cols_tx].iloc[:-h].copy()
        y = df_win["UNRATE"].shift(-h).iloc[:-h].copy()
        valid = ~(X.isnull().any(axis=1) | y.isnull())
        X, y = X.loc[valid], y.loc[valid]

        # Score de base (MAE sur donn√©es d'origine)
        base_score = metric(y, model.predict(X))

        # Boucle sur chaque variable
        for col in cols_tx:
            perm_scores = []
            for _ in range(n_repeats):
                X_perm = X.copy()
                X_perm[col] = np.random.permutation(X_perm[col])
                perm_scores.append(metric(y, model.predict(X_perm)))
            perm_scores = np.array(perm_scores)
            var_imp[col].append(np.mean(perm_scores) / base_score)

    # Agr√©gation moyenne sur toutes les fen√™tres
    results = []
    for col, ratios in var_imp.items():
        if len(ratios) > 0:
            results.append({
                "variable": col,
                "perm_mae_ratio_mean": np.mean(ratios),
                "perm_mae_ratio_std": np.std(ratios),
                "n_windows": len(ratios)
            })

    imp_df = pd.DataFrame(results).sort_values("perm_mae_ratio_mean", ascending=False).reset_index(drop=True)
    return imp_df

In [None]:
# ----------------------------------------------------------
# üß≠ Appel de la fonction sur ton jeu de mod√®les OLS
# ----------------------------------------------------------
perm_df = permutation_importance_pseudo_oos(
    models=models,
    df_train_global=df_train_global,
    cols_tx=cols_tx,
    h=h,
    n_repeats=20  # augmente √† 50 pour des r√©sultats plus stables
)

print("\n=== üîç Importance par permutation (pseudo‚ÄìOOS) ===")
print(perm_df.head(15).to_string(index=False))


=== üîç Importance par permutation (pseudo‚ÄìOOS) ===
       variable  perm_mae_ratio_mean  perm_mae_ratio_std  n_windows
          USREC             1.092658            0.051073         28
          TB3MS             1.028961            0.025485         28
        S&P 500             1.013475            0.004537         28
      OILPRICEx             1.004680            0.004453         28
DPCERA3M086SBEA             1.000228            0.000298         28
           M2SL             1.000208            0.000311         28
         INDPRO             1.000093            0.001816         28
       BUSLOANS             1.000056            0.000236         28
            RPI             1.000051            0.000412         28
       CPIAUCSL             1.000038            0.000150         28


Ton mod√®le OLS pr√©dit principalement le ch√¥mage via le cycle √©conomique :
- USREC (r√©cession) est la variable cl√© ‚Äî sa permutation d√©grade la performance de ~9 %.
- TB3MS (taux court) joue un r√¥le secondaire.
- Les autres variables ont un effet n√©gligeable.

Conclusion : le pouvoir pr√©dictif du mod√®le vient surtout des variables cycliques (r√©cession, taux), les autres apportent peu d‚Äôinformation.

In [None]:
# ==========================================================
# üí° IMPORTANCE SHAPLEY (pour mod√®le OLS)
# ==========================================================
import shap
import numpy as np
import pandas as pd

# 1Ô∏è‚É£ On utilise le dernier mod√®le entra√Æn√©
model_final = models[-1]

# 2Ô∏è‚É£ On reconstitue ses donn√©es finales (derni√®re fen√™tre du train)
df_final = df_train_global.copy()
X_full = df_final[cols_tx].iloc[:-h].copy()
Y_full = df_final["UNRATE"].shift(-h).iloc[:-h].copy()
valid = ~(X_full.isnull().any(axis=1) | Y_full.isnull())
X_full = X_full.loc[valid]
Y_full = Y_full.loc[valid]

# 3Ô∏è‚É£ Calcul des valeurs SHAP
# Pour les mod√®les lin√©aires, on peut utiliser shap.LinearExplainer (plus stable)
explainer = shap.LinearExplainer(model_final, X_full, feature_perturbation="interventional")
shap_values = explainer(X_full)

# 4Ô∏è‚É£ Importance moyenne absolue
shap_df = pd.DataFrame({
    "variable": X_full.columns,
    "shap_mean_abs": np.abs(shap_values.values).mean(axis=0),
})
shap_df["shap_share"] = shap_df["shap_mean_abs"] / shap_df["shap_mean_abs"].sum()
shap_df = shap_df.sort_values("shap_mean_abs", ascending=False).reset_index(drop=True)

# 5Ô∏è‚É£ Affichage
print("\n=== üí° Importance SHAP (shares) ===")
print(shap_df.head(10).to_string(index=False))


=== üí° Importance SHAP (shares) ===
       variable  shap_mean_abs  shap_share
          TB3MS       0.148710    0.485751
          USREC       0.124740    0.407453
        S&P 500       0.017688    0.057777
      OILPRICEx       0.012534    0.040941
DPCERA3M086SBEA       0.001011    0.003303
         INDPRO       0.000871    0.002845
       CPIAUCSL       0.000309    0.001010
           M2SL       0.000204    0.000667
            RPI       0.000043    0.000139
       BUSLOANS       0.000035    0.000114




- TB3MS (0.49)	üü¢ Repr√©sente ~49 % de l‚Äôinfluence totale du mod√®le. Le taux d‚Äôint√©r√™t √† 3 mois est donc la variable la plus d√©terminante pour les pr√©visions du ch√¥mage : quand les taux montent, le mod√®le anticipe souvent une hausse future du ch√¥mage.

- USREC (0.41)	üîµ Repr√©sente ~41 % de l‚Äôinfluence totale. Le dummy de r√©cession (NBER) p√®se presque autant : le simple fait d‚Äô√™tre en r√©cession ou non explique une large part des variations pr√©vues du ch√¥mage.

- S&P 500, OILPRICEx üü† Poids faibles (~6 % et 4 %) : les conditions boursi√®res et le prix du p√©trole ont un impact marginal dans la version lin√©aire du mod√®le.

# üìä M√©triques utilis√©es

## 1) Performance globale

**Coefficient de d√©termination (R¬≤)**  
$$
R^2 = 1 - \frac{\sum_i (y_i - \hat{y}_i)^2}{\sum_i (y_i - \bar{y})^2}
$$  
‚û°Ô∏è Part de la variance expliqu√©e par le mod√®le (0 = pas mieux que la moyenne, 1 = parfait).

**Erreur absolue moyenne (MAE)**  
$$
MAE = \frac{1}{n}\sum_{i=1}^n |y_i - \hat{y}_i|
$$  
‚û°Ô∏è √âcart absolu moyen entre valeurs r√©elles et pr√©dites, robuste aux outliers.

**Erreur quadratique moyenne (RMSE)**  
$$
RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^n (y_i - \hat{y}_i)^2}
$$  
‚û°Ô∏è Similaire au MAE mais p√©nalise davantage les grosses erreurs.

**Corr√©lation de Pearson**  
$$
\rho(y, \hat{y}) = \frac{\text{Cov}(y, \hat{y})}{\sigma_y \cdot \sigma_{\hat{y}}}
$$  
‚û°Ô∏è Mesure le degr√© de lien lin√©aire entre les pr√©dictions et les observations.

**Abs Mean Deviance (AMD)**  
$$
AMD = \frac{1}{n}\sum_{i=1}^n |\hat{y}_i - \bar{\hat{y}}|
$$  
‚û°Ô∏è √âcart moyen des pr√©dictions par rapport √† leur moyenne ; sert de r√©f√©rence pour la permutation pr√©diction-bas√©e.

---

## 2) Importance par permutation
La relation entre Y et X d√©pend du temps. Quand on perturbe la s√©rie X (en la m√©langeant), on casse ce lien, et si l‚Äôerreur augmente, cela montre que X est une variable cl√© pour expliquer Y.

**Ratio MAE**  
$$
PI^{MAE}_j = \frac{MAE^{(perm)}_j}{MAE^{(base)}}
$$  
‚û°Ô∏è Si > 1, la variable est utile pour r√©duire l‚Äôerreur absolue.

**Ratio RMSE**  
$$
PI^{RMSE}_j = \frac{RMSE^{(perm)}_j}{RMSE^{(base)}}
$$  
‚û°Ô∏è Si > 1, la variable aide √† limiter les grosses erreurs.

**D√©viance de pr√©diction**  
$$
PI^{dev}_j = \frac{1}{n}\sum_{i=1}^n \big|\hat{y}_i - \hat{y}^{(perm)}_{i,j}\big|
$$  
‚û°Ô∏è Mesure combien les pr√©dictions changent quand on brouille une variable.

---

## 3) Importance Shapley

**D√©composition des pr√©dictions**  
$$
\hat{y}_i = \phi_0 + \sum_{j=1}^p \phi_{ij}
$$  
‚û°Ô∏è Chaque pr√©diction est expliqu√©e par une contribution \(\phi_{ij}\) par variable.

**Importance absolue moyenne**  
$$
\text{Mean}(|\phi_j|) = \frac{1}{n}\sum_{i=1}^n |\phi_{ij}|
$$  
‚û°Ô∏è Contribution moyenne (absolue) d‚Äôune variable sur toutes les pr√©dictions.

**Shapley share**  
$$
\Gamma_j = \frac{\text{Mean}(|\phi_j|)}{\sum_{k=1}^p \text{Mean}(|\phi_k|)}
$$  
‚û°Ô∏è Part relative de la variable dans l‚Äôexplication totale (somme des parts = 1).

## Interpr√©tation des r√©sultats 

### Performance globale 
- R¬≤ = 0.2266 ‚Üí mod√®le OLS explique ~23 % de la variance du ch√¥mage US.
- MAE = 0.6774 ‚Üí en moyenne, l‚Äôerreur absolue est de 0.68 points (dans l‚Äôunit√© de la variable cible).
- RMSE = 0.8750 ‚Üí un peu plus √©lev√© que le MAE, ce qui indique la pr√©sence de grosses erreurs ponctuelles.
- Corr√©lation = 0.4760 (p ‚âà 10‚Åª¬≥‚Åµ) ‚Üí lien positif et significatif entre pr√©dictions et observations, mais seulement mod√©r√©. Ce qui peut expliquer la pr√©sence d'une relation 
- Abs Mean Deviance = 0.3370 ‚Üí sert ici de r√©f√©rence pour l‚Äôimportance pr√©diction-bas√©e : les pr√©dictions s‚Äô√©cartent en moyenne de 0.34 de leur propre moyenne.

Lecture : le mod√®le OLS capte une partie utile du signal, mais laisse beaucoup de variance inexpliqu√©e. La corr√©lation faible illustre √©ventuellement la pr√©sence des relations non-lin√©aire, et non capt√©es par OLS.

### üîπ 2. Importance par permutation
- INDPRO (Industrial Production) : la plus influente. Sa permutation augmente MAE de +19 % et RMSE de +20 %, avec une forte d√©viance de pr√©diction (0.41).
- TB3MS (Taux d‚Äôint√©r√™t √† 3 mois) : impact non n√©gligeable, ratios ~1.02 et d√©viance ~0.10.
- BUSLOANS (Pr√™ts commerciaux) : r√¥le similaire (MAE ratio 1.017, d√©viance ~0.09).
- S&P 500 : contribution mod√©r√©e, ratios l√©g√®rement > 1.
- RPI, M2SL : influence plus faible mais perceptible.
- CPIAUCSL, OILPRICEx, DPCERA3M086SBEA : quasi neutres (ratios ‚âà 1, d√©viance tr√®s faible).

Lecture : INDPRO domine largement la performance, les autres apportent des compl√©ments mais plus modestes.

### üîπ 3. Importance Shapley (shares)
- INDPRO : ~52 % de l‚Äôexplication totale des pr√©dictions ‚Üí coh√©rence parfaite avec la permutation.
- TB3MS (12 %) + BUSLOANS (12 %) : deux autres piliers importants.
- S&P 500 (9,7 %) : contribue de fa√ßon notable.
- M2SL (5 %), RPI (3 %), CPIAUCSL (3,5 %) : apports plus secondaires.
- OILPRICEx et DPCERA3M086SBEA (<2 %) : quasi n√©gligeables dans ce mod√®le.

Lecture : INDPRO est la variable macro√©conomique centrale, suivie par des indicateurs financiers (taux courts, pr√™ts bancaires, march√© actions).

# Test

In [None]:
import joblib

saved_model = joblib.load("models/model_final.pkl")
model_final = saved_model["model"]
features = saved_model["features"]
winsor_level = saved_model["winsor_level"]
norm_var = saved_model["norm_var"]
mean_full = saved_model["mean_full"]
std_full = saved_model["std_full"]