In [1]:
import pandas as pd
import numpy as np
import statsmodels.api as sm

# 1. Charger les données
df = pd.read_csv('../data/portfolios.csv')
# 2. Identifier les colonnes
# Supposons que 'YM' est à l'index 0. Les 30 portefeuilles vont de l'index 1 à 30 inclus.
portfolio_cols = df.columns[1:31]

# Extraire les rendements des portfolios et les facteurs
R = df[portfolio_cols]
factors = df[['DOL', 'CAR']]

# =====================================================================
# ÉTAPE 1 : Séries Temporelles - Estimer les quantités de risque (Bêtas)
# =====================================================================
# On ajoute une constante aux facteurs pour la régression
X_ts = sm.add_constant(factors)
betas = []

for port in portfolio_cols:
    # Régression du portfolio sur le temps
    model_ts = sm.OLS(R[port], factors).fit()

    # On sauvegarde les bêtas de chaque portfolio
    betas.append({
        'Portfolio': port,
        'Beta_DOL': model_ts.params['DOL'],
        'Beta_CAR': model_ts.params['CAR']
    })

# Création du DataFrame des Bêtas
betas_df = pd.DataFrame(betas).set_index('Portfolio')

# =====================================================================
# ÉTAPE 2 : Transversale - Estimer les prix du risque (Lambdas)
# =====================================================================
# On utilise les bêtas calculés en étape 1 comme variables explicatives (avec constante)
X_cs = sm.add_constant(betas_df[['Beta_DOL', 'Beta_CAR']])
lambdas_mensuels = []

for t in range(len(df)):
    # Rendements transversaux : les 30 portfolios pour le mois t
    y_cs = R.iloc[t]

    # Régression pour le mois t
    model_cs = sm.OLS(y_cs, X_cs).fit()
    lambdas_mensuels.append(model_cs.params)

# Création du DataFrame des Lambdas indexé par le temps (YM)
lambdas_df = pd.DataFrame(lambdas_mensuels, index=df['YM'])

# =====================================================================
# RÉSULTATS : Moyenne temporelle et Tests Statistiques
# =====================================================================
# Le prix du risque est la moyenne de ces lambdas mensuels
price_of_risk = lambdas_df.mean()

# Calcul de l'erreur standard et de la t-statistique (correction Fama-MacBeth)
T = len(lambdas_df)
std_lambdas = lambdas_df.std()
t_stats = price_of_risk / (std_lambdas / np.sqrt(T))

# Affichage des résultats
print("=== PRIX DU RISQUE (Moyenne des Lambdas) ===")
print(price_of_risk)
print("\n=== T-STATISTIQUES (Significativité) ===")
print(t_stats)

# Optionnel : sauvegarder les lambdas mensuels
# lambdas_df.to_csv("fama_macbeth_lambdas.csv")

=== PRIX DU RISQUE (Moyenne des Lambdas) ===
const       0.006337
Beta_DOL   -0.005116
Beta_CAR    0.005901
dtype: float64

=== T-STATISTIQUES (Significativité) ===
const       3.243504
Beta_DOL   -2.418552
Beta_CAR    6.180897
dtype: float64


In [2]:
import pandas as pd
import statsmodels.api as sm

# 1. Charger les données
df = pd.read_csv('../data/portfolios.csv')

# 2. Identifier les colonnes
# Les 30 portefeuilles vont de l'index 1 à 30 inclus
portfolio_cols = df.columns[1:31]

# Extraire les rendements des portfolios et les facteurs
R = df[portfolio_cols]
factors = df[['DOL', 'CAR']]

# =====================================================================
# ÉTAPE 1 : Séries Temporelles - Estimer les quantités de risque (Bêtas)
# =====================================================================
# SANS INTERCEPT : On utilise directement les facteurs sans constante
X_ts = factors
betas = []

for port in portfolio_cols:
    # Régression OLS du portefeuille sur les facteurs (sans constante)
    model_ts = sm.OLS(R[port], X_ts).fit()

    # On sauvegarde les bêtas estimés pour ce portfolio
    betas.append({
        'Portfolio': port,
        'Beta_DOL': model_ts.params['DOL'],
        'Beta_CAR': model_ts.params['CAR']
    })

# Création du DataFrame des Bêtas
betas_df = pd.DataFrame(betas).set_index('Portfolio')

# Affichage des Bêtas
print(betas_df)

# Optionnel : sauvegarder ce tableau dans un fichier CSV
# betas_df.to_csv('betas_portfolios.csv')

           Beta_DOL  Beta_CAR
Portfolio                    
P1CAR      1.000246 -0.390918
P2CAR      0.946753 -0.142682
P3CAR      0.997285 -0.014577
P4CAR      1.062937  0.041402
P5CAR      1.000246  0.609082
P1VAL      1.048215 -0.135137
P2VAL      1.114092 -0.114981
P3VAL      1.016001 -0.088823
P4VAL      0.888284  0.028516
P5VAL      0.892170  0.382396
P1M1M      1.007298  0.073551
P2M1M      1.029512 -0.033092
P3M1M      1.003020 -0.042081
P4M1M      1.011444 -0.090092
P5M1M      0.951969  0.107973
P1M3M      0.991788  0.076178
P2M3M      1.033160 -0.108747
P3M3M      1.035058 -0.062335
P4M3M      1.008465 -0.041639
P5M3M      0.940560  0.162488
P1M6M      0.997777  0.067114
P2M6M      1.024624 -0.058963
P3M6M      1.080384 -0.091422
P4M6M      1.013647 -0.059119
P5M6M      0.898897  0.161490
P1M1Y      0.994524  0.074824
P2M1Y      1.037318 -0.100966
P3M1Y      1.059046 -0.083138
P4M1Y      1.039282 -0.027975
P5M1Y      0.886733  0.164087


In [3]:
betas_df

Unnamed: 0_level_0,Beta_DOL,Beta_CAR
Portfolio,Unnamed: 1_level_1,Unnamed: 2_level_1
P1CAR,1.000246,-0.390918
P2CAR,0.946753,-0.142682
P3CAR,0.997285,-0.014577
P4CAR,1.062937,0.041402
P5CAR,1.000246,0.609082
P1VAL,1.048215,-0.135137
P2VAL,1.114092,-0.114981
P3VAL,1.016001,-0.088823
P4VAL,0.888284,0.028516
P5VAL,0.89217,0.382396


In [4]:
import pandas as pd
import statsmodels.api as sm

# 1. Charger les données
df = pd.read_csv('../data/portfolios.csv')

# Les 30 portefeuilles vont de l'index 1 à 30 inclus
portfolio_cols = df.columns[1:31]

R = df[portfolio_cols]
factors = df[['DOL', 'CAR']]

# =====================================================================
# ÉTAPE 1 : Bêtas (Quantité de risque par portefeuille)
# =====================================================================
betas = []
for port in portfolio_cols:
    model_ts = sm.OLS(R[port], factors).fit()
    betas.append({
        'Portfolio': port,
        'Beta_DOL': model_ts.params['DOL'],
        'Beta_CAR': model_ts.params['CAR']
    })

# DataFrame des Bêtas
resultats_df = pd.DataFrame(betas).set_index('Portfolio')

# =====================================================================
# ÉTAPE 2 : Lambdas (Prix du risque du marché)
# =====================================================================
X_cs = resultats_df[['Beta_DOL', 'Beta_CAR']]
lambdas_mensuels = []

for t in range(len(df)):
    y_cs = R.iloc[t]
    model_cs = sm.OLS(y_cs, X_cs).fit()
    lambdas_mensuels.append(model_cs.params)

lambdas_df = pd.DataFrame(lambdas_mensuels, index=df['YM'])
lambdas_moyens = lambdas_df.mean()

# =====================================================================
# ÉTAPE 3 : Regrouper dans un tableau unique
# =====================================================================
# Ajout des Lambdas (identiques pour tous les portefeuilles)
resultats_df['Lambda_DOL'] = lambdas_moyens['Beta_DOL']
resultats_df['Lambda_CAR'] = lambdas_moyens['Beta_CAR']

# Calcul de la contribution de chaque facteur au rendement du portefeuille (Beta * Lambda)
resultats_df['Rendement_Attendu_DOL'] = resultats_df['Beta_DOL'] * \
    resultats_df['Lambda_DOL']
resultats_df['Rendement_Attendu_CAR'] = resultats_df['Beta_CAR'] * \
    resultats_df['Lambda_CAR']

# Rendement total attendu expliqué par le modèle
resultats_df['Rendement_Total_Attendu'] = resultats_df['Rendement_Attendu_DOL'] + \
    resultats_df['Rendement_Attendu_CAR']

# Affichage des 5 premiers portefeuilles pour vérifier
print(resultats_df.head())

# Sauvegarde des résultats dans un fichier CSV
resultats_df.to_csv('betas_et_lambdas_portfolios.csv')

           Beta_DOL  Beta_CAR  Lambda_DOL  Lambda_CAR  Rendement_Attendu_DOL  \
Portfolio                                                                      
P1CAR      1.000246 -0.390918    0.001195    0.006836               0.001195   
P2CAR      0.946753 -0.142682    0.001195    0.006836               0.001131   
P3CAR      0.997285 -0.014577    0.001195    0.006836               0.001192   
P4CAR      1.062937  0.041402    0.001195    0.006836               0.001270   
P5CAR      1.000246  0.609082    0.001195    0.006836               0.001195   

           Rendement_Attendu_CAR  Rendement_Total_Attendu  
Portfolio                                                  
P1CAR                  -0.002672                -0.001477  
P2CAR                  -0.000975                 0.000156  
P3CAR                  -0.000100                 0.001092  
P4CAR                   0.000283                 0.001553  
P5CAR                   0.004164                 0.005359  


In [5]:
resultats_df.T

Portfolio,P1CAR,P2CAR,P3CAR,P4CAR,P5CAR,P1VAL,P2VAL,P3VAL,P4VAL,P5VAL,...,P1M6M,P2M6M,P3M6M,P4M6M,P5M6M,P1M1Y,P2M1Y,P3M1Y,P4M1Y,P5M1Y
Beta_DOL,1.000246,0.946753,0.997285,1.062937,1.000246,1.048215,1.114092,1.016001,0.888284,0.89217,...,0.997777,1.024624,1.080384,1.013647,0.898897,0.994524,1.037318,1.059046,1.039282,0.886733
Beta_CAR,-0.390918,-0.142682,-0.014577,0.041402,0.609082,-0.135137,-0.114981,-0.088823,0.028516,0.382396,...,0.067114,-0.058963,-0.091422,-0.059119,0.16149,0.074824,-0.100966,-0.083138,-0.027975,0.164087
Lambda_DOL,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,...,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195,0.001195
Lambda_CAR,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,...,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836,0.006836
Rendement_Attendu_DOL,0.001195,0.001131,0.001192,0.00127,0.001195,0.001252,0.001331,0.001214,0.001061,0.001066,...,0.001192,0.001224,0.001291,0.001211,0.001074,0.001188,0.001239,0.001265,0.001242,0.00106
Rendement_Attendu_CAR,-0.002672,-0.000975,-0.0001,0.000283,0.004164,-0.000924,-0.000786,-0.000607,0.000195,0.002614,...,0.000459,-0.000403,-0.000625,-0.000404,0.001104,0.000512,-0.00069,-0.000568,-0.000191,0.001122
Rendement_Total_Attendu,-0.001477,0.000156,0.001092,0.001553,0.005359,0.000329,0.000545,0.000607,0.001256,0.00368,...,0.001651,0.000821,0.000666,0.000807,0.002178,0.0017,0.000549,0.000697,0.001051,0.002181


In [6]:
import pandas as pd
import numpy as np
import statsmodels.api as sm
from scipy import stats

# 1. Charger les données
df = pd.read_csv('../data/portfolios.csv')
portfolio_cols = df.columns[1:31]
R = df[portfolio_cols]
factors = df[['DOL', 'CAR']]

# =====================================================================
# ÉTAPE 1 : Estimer les Bêtas (AVEC INTERCEPT)
# =====================================================================
# On ajoute une constante aux facteurs pour l'étape temporelle
X_ts = sm.add_constant(factors)
betas = []

for port in portfolio_cols:
    model_ts = sm.OLS(R[port], X_ts).fit()
    betas.append({
        'Portfolio': port,
        'Beta_DOL': model_ts.params['DOL'],
        'Beta_CAR': model_ts.params['CAR']
    })

# Créer un DataFrame pour les Bêtas
betas_df = pd.DataFrame(betas).set_index('Portfolio')

# Exporter les Bêtas modifiés (facultatif)
betas_df.to_csv('betas_portfolios_intercept.csv')

# =====================================================================
# ÉTAPE 2 : Estimer les Lambdas mensuels (AVEC INTERCEPT)
# =====================================================================
# On ajoute une constante aux Bêtas pour l'étape transversale
X_cs = sm.add_constant(betas_df[['Beta_DOL', 'Beta_CAR']])
lambdas_mensuels = []

for t in range(len(df)):
    y_cs = R.iloc[t]
    model_cs = sm.OLS(y_cs, X_cs).fit()
    lambdas_mensuels.append(model_cs.params)

# =====================================================================
# ÉTAPE 3 : Calculer Lambda, T-Stat et P-Value (Méthode Fama-MacBeth)
# =====================================================================
lambdas_df = pd.DataFrame(lambdas_mensuels, index=df['YM'])
T = len(lambdas_df)

lambdas_mean = lambdas_df.mean()
lambdas_se = lambdas_df.std() / np.sqrt(T)
t_stats = lambdas_mean / lambdas_se

# P-values (test bilatéral, distribution t de Student)
p_values = 2 * (1 - stats.t.cdf(np.abs(t_stats), df=T-1))

# Rassembler les résultats dans un DataFrame
fm_stats = pd.DataFrame({
    'Lambda (Prix du risque)': lambdas_mean,
    'T-stat': t_stats,
    'P-value': p_values
})

# =====================================================================
# AFFICHAGE DES RÉSULTATS
# =====================================================================
print("\n=== APERÇU DU DATAFRAME DES BÊTAS (AVEC INTERCEPT) ===")
print(betas_df.head())

print("\n=== STATISTIQUES DES LAMBDAS ===")
print(fm_stats)


=== APERÇU DU DATAFRAME DES BÊTAS (AVEC INTERCEPT) ===
           Beta_DOL  Beta_CAR
Portfolio                    
P1CAR      0.999662 -0.394309
P2CAR      0.947175 -0.140236
P3CAR      0.998028 -0.010262
P4CAR      1.062395  0.038260
P5CAR      0.999662  0.605691

=== STATISTIQUES DES LAMBDAS ===
          Lambda (Prix du risque)    T-stat       P-value
const                    0.008446  4.103466  4.633919e-05
Beta_DOL                -0.007211 -3.269417  1.139466e-03
Beta_CAR                 0.005182  5.256526  2.044831e-07


In [7]:
betas_df

Unnamed: 0_level_0,Beta_DOL,Beta_CAR
Portfolio,Unnamed: 1_level_1,Unnamed: 2_level_1
P1CAR,0.999662,-0.394309
P2CAR,0.947175,-0.140236
P3CAR,0.998028,-0.010262
P4CAR,1.062395,0.03826
P5CAR,0.999662,0.605691
P1VAL,1.047963,-0.136601
P2VAL,1.113137,-0.120521
P3VAL,1.016509,-0.085876
P4VAL,0.887713,0.025201
P5VAL,0.892729,0.385643


In [8]:
import pandas as pd
import numpy as np
import statsmodels.api as sm
from scipy import stats

# =====================================================================
# PRÉPARATION DES DONNÉES
# =====================================================================
# 1. Charger les données
df = pd.read_csv('../data/portfolios.csv')

# 2. Créer le nouveau facteur : première dérivée du log de la volatilité
df['d_log_vol'] = np.log(df['vol']).diff()

# 3. Supprimer la première ligne qui contient désormais un NaN (à cause du .diff)
df = df.dropna().reset_index(drop=True)

# 4. Identifier les variables
portfolio_cols = df.columns[1:31]
R = df[portfolio_cols]
factors = df[['DOL', 'CAR', 'd_log_vol']]

# =====================================================================
# ÉTAPE 1 : Séries Temporelles - Estimer les quantités de risque (Bêtas)
# =====================================================================
# On ajoute une constante (intercept) aux facteurs
X_ts = sm.add_constant(factors)
betas = []

for port in portfolio_cols:
    # Régression OLS du portefeuille sur les 3 facteurs + constante
    model_ts = sm.OLS(R[port], X_ts).fit()

    # On sauvegarde les bêtas estimés
    betas.append({
        'Portfolio': port,
        'Beta_DOL': model_ts.params['DOL'],
        'Beta_CAR': model_ts.params['CAR'],
        'Beta_d_log_vol': model_ts.params['d_log_vol']
    })

# Création du DataFrame des Bêtas
betas_df = pd.DataFrame(betas).set_index('Portfolio')

# Sauvegarde des bêtas dans un fichier CSV (optionnel)
betas_df.to_csv('betas_portfolios_3_factors.csv')

# =====================================================================
# ÉTAPE 2 : Transversale - Estimer les prix du risque (Lambdas)
# =====================================================================
# On ajoute une constante (intercept) aux Bêtas pour la seconde étape
X_cs = sm.add_constant(betas_df[['Beta_DOL', 'Beta_CAR', 'Beta_d_log_vol']])
lambdas_mensuels = []

for t in range(len(df)):
    y_cs = R.iloc[t]
    model_cs = sm.OLS(y_cs, X_cs).fit()
    lambdas_mensuels.append(model_cs.params)

# Création du DataFrame des Lambdas indexé par le temps
lambdas_df = pd.DataFrame(lambdas_mensuels, index=df['YM'])

# =====================================================================
# ÉTAPE 3 : Statistiques Fama-MacBeth (Significativité)
# =====================================================================
T = len(lambdas_df)

# 1. Le prix du risque est la moyenne temporelle des lambdas
lambdas_mean = lambdas_df.mean()

# 2. L'erreur standard (écart-type / racine de T)
lambdas_se = lambdas_df.std() / np.sqrt(T)

# 3. La T-statistique
t_stats = lambdas_mean / lambdas_se

# 4. La P-value (test bilatéral)
p_values = 2 * (1 - stats.t.cdf(np.abs(t_stats), df=T-1))

# Regroupement des résultats Fama-MacBeth
fm_stats = pd.DataFrame({
    'Lambda (Prix du risque)': lambdas_mean,
    'T-stat': t_stats,
    'P-value': p_values
})

# =====================================================================
# AFFICHAGE DES RÉSULTATS
# =====================================================================
print("=== APERÇU DES BÊTAS (Les 5 premiers) ===")
print(betas_df.head())

print("\n=== NOUVELLES STATISTIQUES DES LAMBDAS (3 FACTEURS + INTERCEPT) ===")
print(fm_stats)

=== APERÇU DES BÊTAS (Les 5 premiers) ===
           Beta_DOL  Beta_CAR  Beta_d_log_vol
Portfolio                                    
P1CAR      0.999091 -0.398107       -0.000178
P2CAR      0.948447 -0.137830        0.001066
P3CAR      1.002454  0.003466        0.003113
P4CAR      1.057749  0.027899       -0.003718
P5CAR      0.999091  0.601893       -0.000178

=== NOUVELLES STATISTIQUES DES LAMBDAS (3 FACTEURS + INTERCEPT) ===
                Lambda (Prix du risque)    T-stat       P-value
const                          0.009831  4.701811  3.204399e-06
Beta_DOL                      -0.008586 -3.841027  1.356022e-04
Beta_CAR                       0.005493  5.692304  1.965152e-08
Beta_d_log_vol                 0.052713  1.350795  1.772719e-01


In [9]:
betas_df

Unnamed: 0_level_0,Beta_DOL,Beta_CAR,Beta_d_log_vol
Portfolio,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
P1CAR,0.999091,-0.398107,-0.000178
P2CAR,0.948447,-0.13783,0.001066
P3CAR,1.002454,0.003466,0.003113
P4CAR,1.057749,0.027899,-0.003718
P5CAR,0.999091,0.601893,-0.000178
P1VAL,1.049092,-0.133387,0.000826
P2VAL,1.117203,-0.110437,0.00314
P3VAL,1.017399,-0.083457,0.000664
P4VAL,0.882886,0.004524,-0.002764
P5VAL,0.890872,0.387471,-0.002148
