# **Implémentation du modèle**
---

## Introduction

Ce notebook contient les codes nécessaire à la mise en place du modèle. Le modèle est inspiré de celui de Iacoviello et Navarro : 

- La première étape consiste à identifier les chocs de politique monétaire, en prenant le résidu de la régression du taux d'intérêt sur l'écart d'inflation par rapport à la cible et l'output gap ou le chômage. En réalité Iacoviello et Navarro utilisent des lags et valeurs présentes de l'inflation, des spreads de crédit, du PIB et des lags des taux des fonds fédéraux.
Il nous manque donc l'output gap, l'inflation et le chômage de la zone euro
- La deuxième étape consiste à estimer l'impact de ces chocs sur l'activité économique (PIB, emploi ...) en régressant ces variables sur les chocs et des variables de contrôles (4 lags du PIB et des trends linéaires et quadratiques)



## Identification des chocs

In [11]:
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import sklearn.metrics
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

Problème: dans Iacoviello et Navarro, ils régressent le taux d'intérêt sur le PIB etc des US seulement. Or on est dans la zone euro ici, doit-on faire une régression de panel ? 

Pour faire la première étape il nous faudrait un data frame avec les données de seulement la zone euro.
Il faut construire les variables suivantes : 
- log_euroarea_gdp, 
- corporate spreads, 
- lagged_federal_funds (<span style="color:red"> Iacoviello et Navarro utilisent le shadow rate, je pense qu'il faut faire une variable par lag, ils prennent 4 lags dans le papier</span>),
- log_foreign_gdp (<span style="color:red"> le problème c'est qu'on n'a pas de pays étrangers dans notre base donc on ne peut pas vraiment créer cette variable</span> )


Pour l'instant pour le federal funds rate j'ai pris le key interest rate qui est sur le site de l'OCDE

In [12]:
%pip install -r requirements.txt
import pandas as pd
import numpy as np


Note: you may need to restart the kernel to use updated packages.


In [13]:
# Import et formatage du key interest rate
df_key = pd.read_csv("Données_extraites/key interest rates.csv", encoding='utf-8')
df_key = df_key[['TIME_PERIOD', 'OBS_VALUE']]
df_key = df_key.rename(columns={'OBS_VALUE':'key_rate'})
df_key["TIME_PERIOD"] = pd.to_datetime(df_key["TIME_PERIOD"])
df_key = df_key.sort_values(by="TIME_PERIOD")

# création des lags 
df_key["key_rate_lag1"] = df_key["key_rate"].shift(1)
df_key["key_rate_lag2"] = df_key["key_rate"].shift(2)
df_key["key_rate_lag3"] = df_key["key_rate"].shift(3)
df_key["key_rate_lag4"] = df_key["key_rate"].shift(4)
df_key

  df_key["TIME_PERIOD"] = pd.to_datetime(df_key["TIME_PERIOD"])


Unnamed: 0,TIME_PERIOD,key_rate,key_rate_lag1,key_rate_lag2,key_rate_lag3,key_rate_lag4
6,1999-01-01,2.00,,,,
5,1999-04-01,1.50,2.00,,,
28,1999-07-01,1.50,1.50,2.0,,
27,1999-10-01,2.00,1.50,1.5,2.0,
26,2000-01-01,2.50,2.00,1.5,1.5,2.0
...,...,...,...,...,...,...
39,2023-10-01,4.00,4.00,3.5,3.0,2.0
38,2024-01-01,4.00,4.00,4.0,3.5,3.0
37,2024-04-01,4.00,4.00,4.0,4.0,3.5
25,2024-07-01,3.75,4.00,4.0,4.0,4.0


In [14]:
# import et formatage du GDP

df_euro_gdp = pd.read_csv("Données_extraites/estat_namq_10_gdp_filtered_en (1).csv.gz", compression="gzip")
df_euro_gdp=df_euro_gdp[['TIME_PERIOD', 'OBS_VALUE']]
df_euro_gdp=df_euro_gdp.rename(columns={'OBS_VALUE':'gdp'})
df_euro_gdp["log_gdp"] = np.log(df_euro_gdp["gdp"])

# mettre les dates dans l'ordre
df_euro_gdp["TIME_PERIOD"] = pd.to_datetime(df_euro_gdp["TIME_PERIOD"])
df_euro_gdp = df_euro_gdp.sort_values(by="TIME_PERIOD")

# création des lags pour gdp et log_gdp

df_euro_gdp["gdp_lag1"] = df_euro_gdp["gdp"].shift(1)
df_euro_gdp["gdp_lag2"] = df_euro_gdp["gdp"].shift(2)
df_euro_gdp["gdp_lag3"] = df_euro_gdp["gdp"].shift(3)
df_euro_gdp["gdp_lag4"] = df_euro_gdp["gdp"].shift(4)

df_euro_gdp["log_gdp_lag1"] = df_euro_gdp["log_gdp"].shift(1)
df_euro_gdp["log_gdp_lag2"] = df_euro_gdp["log_gdp"].shift(2)
df_euro_gdp["log_gdp_lag3"] = df_euro_gdp["log_gdp"].shift(3)
df_euro_gdp["log_gdp_lag4"] = df_euro_gdp["log_gdp"].shift(4)
df_euro_gdp



  df_euro_gdp["TIME_PERIOD"] = pd.to_datetime(df_euro_gdp["TIME_PERIOD"])


Unnamed: 0,TIME_PERIOD,gdp,log_gdp,gdp_lag1,gdp_lag2,gdp_lag3,gdp_lag4,log_gdp_lag1,log_gdp_lag2,log_gdp_lag3,log_gdp_lag4
0,1995-01-01,1340877.4,14.108835,,,,,,,,
1,1995-04-01,1385087.6,14.141274,1340877.4,,,,14.108835,,,
2,1995-07-01,1388312.6,14.143600,1385087.6,1340877.4,,,14.141274,14.108835,,
3,1995-10-01,1472070.7,14.202181,1388312.6,1385087.6,1340877.4,,14.143600,14.141274,14.108835,
4,1996-01-01,1400071.7,14.152034,1472070.7,1388312.6,1385087.6,1340877.4,14.202181,14.143600,14.141274,14.108835
...,...,...,...,...,...,...,...,...,...,...,...
115,2023-10-01,3804526.0,15.151702,3639290.0,3626149.8,3528215.7,3602551.8,15.107299,15.103682,15.076303,15.097153
116,2024-01-01,3662523.2,15.113663,3804526.0,3639290.0,3626149.8,3528215.7,15.151702,15.107299,15.103682,15.076303
117,2024-04-01,3759149.1,15.139703,3662523.2,3804526.0,3639290.0,3626149.8,15.113663,15.151702,15.107299,15.103682
118,2024-07-01,3781949.7,15.145750,3759149.1,3662523.2,3804526.0,3639290.0,15.139703,15.113663,15.151702,15.107299


In [15]:
# Import et formatage inflation
# pour l'inflation j'ai pris dans l'OCDE, economic outlook 116 -> harmonized core infation, Euro Area(17 countries)

df_euro_inflation = pd.read_csv("Données_extraites/inflation euro.csv", encoding='utf-8')
df_euro_inflation = df_euro_inflation[['TIME_PERIOD', 'OBS_VALUE']]
df_euro_inflation = df_euro_inflation.rename(columns={'OBS_VALUE':'inflation'})
df_euro_inflation["TIME_PERIOD"] = pd.to_datetime(df_euro_inflation["TIME_PERIOD"])
df_euro_inflation = df_euro_inflation.sort_values(by="TIME_PERIOD")

# création des lags 
df_euro_inflation["inflation_lag1"] = df_euro_inflation["inflation"].shift(1)
df_euro_inflation["inflation_lag2"] = df_euro_inflation["inflation"].shift(2)
df_euro_inflation["inflation_lag3"] = df_euro_inflation["inflation"].shift(3)
df_euro_inflation["inflation_lag4"] = df_euro_inflation["inflation"].shift(4)
df_euro_inflation



  df_euro_inflation["TIME_PERIOD"] = pd.to_datetime(df_euro_inflation["TIME_PERIOD"])


Unnamed: 0,TIME_PERIOD,inflation,inflation_lag1,inflation_lag2,inflation_lag3,inflation_lag4
7,1999-01-01,1.404333,,,,
6,1999-04-01,1.186841,1.404333,,,
5,1999-07-01,1.125569,1.186841,1.404333,,
4,1999-10-01,1.030436,1.125569,1.186841,1.404333,
26,2000-01-01,1.055140,1.030436,1.125569,1.186841,1.404333
...,...,...,...,...,...,...
40,2023-10-01,3.715027,5.042847,5.459302,5.504622,5.094049
39,2024-01-01,3.088601,3.715027,5.042847,5.459302,5.504622
25,2024-04-01,2.784795,3.088601,3.715027,5.042847,5.459302
24,2024-07-01,2.720590,2.784795,3.088601,3.715027,5.042847


In [16]:
# merger les data frames

data = df_key.merge(df_euro_gdp, on='TIME_PERIOD').merge(df_euro_inflation, on='TIME_PERIOD')
data


Unnamed: 0,TIME_PERIOD,key_rate,key_rate_lag1,key_rate_lag2,key_rate_lag3,key_rate_lag4,gdp,log_gdp,gdp_lag1,gdp_lag2,...,gdp_lag4,log_gdp_lag1,log_gdp_lag2,log_gdp_lag3,log_gdp_lag4,inflation,inflation_lag1,inflation_lag2,inflation_lag3,inflation_lag4
0,1999-01-01,2.00,,,,,1547535.7,14.252174,1633294.4,1535843.2,...,1478792.9,14.306110,14.244590,14.243551,14.206737,1.404333,,,,
1,1999-04-01,1.50,2.00,,,,1603780.2,14.287874,1547535.7,1633294.4,...,1534248.7,14.252174,14.306110,14.244590,14.243551,1.186841,1.404333,,,
2,1999-07-01,1.50,1.50,2.0,,,1608279.7,14.290676,1603780.2,1547535.7,...,1535843.2,14.287874,14.252174,14.306110,14.244590,1.125569,1.186841,1.404333,,
3,1999-10-01,2.00,1.50,1.5,2.0,,1710929.2,14.352547,1608279.7,1603780.2,...,1633294.4,14.290676,14.287874,14.252174,14.306110,1.030436,1.125569,1.186841,1.404333,
4,2000-01-01,2.50,2.00,1.5,1.5,2.0,1639761.3,14.310061,1710929.2,1608279.7,...,1547535.7,14.352547,14.290676,14.287874,14.252174,1.055140,1.030436,1.125569,1.186841,1.404333
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
99,2023-10-01,4.00,4.00,3.5,3.0,2.0,3804526.0,15.151702,3639290.0,3626149.8,...,3602551.8,15.107299,15.103682,15.076303,15.097153,3.715027,5.042847,5.459302,5.504622,5.094049
100,2024-01-01,4.00,4.00,4.0,3.5,3.0,3662523.2,15.113663,3804526.0,3639290.0,...,3528215.7,15.151702,15.107299,15.103682,15.076303,3.088601,3.715027,5.042847,5.459302,5.504622
101,2024-04-01,4.00,4.00,4.0,4.0,3.5,3759149.1,15.139703,3662523.2,3804526.0,...,3626149.8,15.113663,15.151702,15.107299,15.103682,2.784795,3.088601,3.715027,5.042847,5.459302
102,2024-07-01,3.75,4.00,4.0,4.0,4.0,3781949.7,15.145750,3759149.1,3662523.2,...,3639290.0,15.139703,15.113663,15.151702,15.107299,2.720590,2.784795,3.088601,3.715027,5.042847


In [24]:
import pandas as pd
import numpy as np
import statsmodels.api as sm

# Création d'une variable de tendance quadratique
data['TIME_PERIOD'] = pd.to_datetime(data['TIME_PERIOD'])

# Créer la variable de tendance temporelle time (1 pour le premier trimestre, 2 pour le second, etc.)
data['time'] = range(1, len(data) + 1)

# Créer la tendance quadratique time²
data['time_squared'] = data['time'] ** 2

#création des lags de time_squared

data["time_squared_lag1"] = data["time_squared"].shift(1)
data["time_squared_lag2"] = data["time_squared"].shift(2)
data["time_squared_lag3"] = data["time_squared"].shift(3)
data["time_squared_lag4"] = data["time_squared"].shift(4)



In [30]:
# Supprimer les lignes avec NaN ou Inf
data_clean = data.dropna()

# Définition de Y (variable dépendante)
Y = data_clean['key_rate']

# Sélectionner toutes les colonnes sauf 'key_rate' et 'TIME_PERIOD'
X = data_clean.drop(columns=['key_rate', 'TIME_PERIOD','gdp', 'gdp_lag1', 'gdp_lag2', 'gdp_lag3','gdp_lag4','time', 'time_squared_lag4', 'time_squared_lag3', 'time_squared_lag2', 'time_squared_lag1'])

# Ajouter une constante pour l'intercept dans la régression
X = sm.add_constant(X)

# Régression
model = sm.OLS(Y, X).fit()

# Extraire les résidus comme chocs monétaires
data_clean['monetary_shocks'] = model.resid

# Afficher le résumé de la régression
print(model.summary())
with open("regression_results.tex", "w") as f:
    f.write(model.summary().as_latex())
# Sauvegarder les résultats dans un fichier CSV
data_clean[['TIME_PERIOD','time', 'monetary_shocks']].to_csv('identified_monetary_shocks.csv', index=False)


                            OLS Regression Results                            
Dep. Variable:               key_rate   R-squared:                       0.974
Model:                            OLS   Adj. R-squared:                  0.970
Method:                 Least Squares   F-statistic:                     212.1
Date:                Thu, 20 Mar 2025   Prob (F-statistic):           4.77e-60
Time:                        13:56:06   Log-Likelihood:                 2.2271
No. Observations:                 100   AIC:                             27.55
Df Residuals:                      84   BIC:                             69.23
Df Model:                          15                                         
Covariance Type:            nonrobust                                         
                     coef    std err          t      P>|t|      [0.025      0.975]
----------------------------------------------------------------------------------
const              8.2352      6.815      1.

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  data_clean['monetary_shocks'] = model.resid


## Estimation de l'impact des chocs

Nous allons maintenant estimer avec une régression de panel l'impact des chocs de politique monétaire identifiés, sur différentes variables (GDP, employment ? ...). La méthode utilisé est celle de Jorda (2005), la méthode de projection locale. Cela consiste à "estimer des projections locales à chaque période au lieu d'extrapoler sur des horizons lointains à partir d'un modèle."
Nous allons estimer une équation de la forme suivante, comme dans Iacoviello & Navarro (2018) :

$$
y_{i,t+h} = \alpha_{i,h} + \beta_h u_t + A_{h,i} Z_{i,t} + \varepsilon_{i,t+h}
$$

où :

- $y_{i,t+h}$ est le PIB du pays $ i $ au temps $t$,
- $\alpha_{i,h} $ est un effet fixe spécifique au pays,
- $u_t$ est le choc monétaire,
- $Z_{i,t}$  représente les variables de contrôle : 4 lags du PIB, des tendances linéaire et quadratique,
- $\varepsilon_{i,t+h}$  est le terme d'erreur.

Pour chaque h il faut estimer un $\beta_h$, ensuite il faut faire les IRF (fonctions de réponse impulsionnelle) pour les différents Y qu'on utilise.


Pour les variables de contrôle, il faut sûrement tester lesquelles sont les meilleures, ne pas forcément reproduire exactement le modèle.




<span style="color:red;"> Le code suivant est fait avec chat gpt entièrement, il faut modifier le nom des variables, je ne sais pa du tout s'il va fonctionner ni si c'est exactement le modèle qu'il faut faire. </span>

Définir la fonction d'estimation

In [None]:
# il faut d'abord merger le df avec les chocs et le df avec toutes les données 

In [None]:
def local_projection_irf(data, response_var, shock_var, control_vars, max_horizon=12):
    """Estime les réponses impulsionnelles (IRF) par projections locales."""
    
    results = []
    
    for h in range(max_horizon + 1):
        data[f'{response_var}_lead_{h}'] = data.groupby('Country')[response_var].shift(-h)
        
        # suppression des lignes contenant des NA :
        df = data.dropna(subset=[f'{response_var}_lead_{h}', shock_var] + control_vars) 
        
        y = df[f'{response_var}_lead_{h}']
        X = df[[shock_var] + control_vars]
        X = sm.add_constant(X)  # Ajouter l'intercept

        model = sm.OLS(y, X).fit(cov_type="cluster", cov_kwds={"groups": df["Country"]})  # Cluster par pays: corrige l’hétéroscédasticité et l'autocorrélation intra-groupe.
        results.append((h, model.params[shock_var], model.bse[shock_var]))  # Stocker horizon, coefficient, erreur standard

    return pd.DataFrame(results, columns=["Horizon", "Beta", "SE"])


Exécuter l'estimation

In [None]:
control_vars = ['GDP_lag1', 'GDP_lag2', 'GDP_lag3', 'GDP_lag4', 'time', 'time_squared']  # Exemples de contrôles
irf_results = local_projection_irf(data, response_var="GDP", shock_var="Shock", control_vars=control_vars, max_horizon=12)

Tracer les IRF

In [None]:
plt.figure(figsize=(8,5))
plt.plot(irf_results["Horizon"], irf_results["Beta"], marker="o", label="IRF")
plt.fill_between(irf_results["Horizon"], 
                 irf_results["Beta"] - 1.96 * irf_results["SE"], 
                 irf_results["Beta"] + 1.96 * irf_results["SE"], 
                 color='gray', alpha=0.3, label="IC 95%")
plt.axhline(0, color='black', linestyle='--')
plt.xlabel("Horizon (trimestres)")
plt.ylabel("Effet du choc monétaire")
plt.title("Réponse impulsionnelle du PIB à un choc monétaire")
plt.legend()
plt.show()
