# Estimation et test du modèle à 5 facteurs de Fama French (2014)

En Asset Pricing, l'excès de rendement d'une action est décomposé de la façon suivante :

$$
R_{it}-RF_{t} = \alpha_{i} +\sum_{j=1}^{k} \beta_{i}^{j} f_{jt} + e_{it}
$$
où 
- $R_{it}$ est le rendement de l'action *i* à la date *t*,
- $RF_{t}$ est le taux sans risque à la date *t*,
- les $f_{it}, i=1,..,k$ sont *k* facteurs expliquant les variations communes des rendements et le risque non-diversifiable
- le $\beta_{i}^{j},j=1...,k$ est l'exposition de l'actif *i* au facteur $f_{jt}$
- $e_{it}$ est la composante spécifique à l'actif *i* représentant le risque diversifiable avec $E(e_{it})=0$

Si les facteurs sont correctement choisis, c'est-à-dire qu'ils représentent les variations des rendements anticipés, on aura $\alpha_{i}=0$ 

**Fama et French (1993)** (Common risk factors in the returns on stocks and bonds, Journal of Financial Economics, 33 (1) , pp. 3-56) proposent un modèle à trois facteurs afin d'analyser les rendements des actions ou des portefeuilles d'actions. 
Dans le modèle à 3 facteurs, le rendement moyen d'une action est supposé être corrélé avec :

1. le rendement du portefeuille du marché corrigé du taux sans risque : $Mkt-RF$
2. la taille (*Size*) de l'entreprise mesurée par sa capitalisation boursière (nombre d'actions en circulation $\times$ prix d'une action). 
    - Cet effet est mesuré par le facteur $SML_{t}$ égal à la différence de rendement d'un portefeuille de petites entreprises moins celui d'un portefeuille de grandes entreprises.
3. le book to market ratio *B/M* (ratio de la valeur comptable et de la valeur de marché). Une entreprise ayant un ratio B/M elevé sera plutôt sous-évaluée et on s'attend à ce qu'elle ait ura un taux de rendement élevé. 
    - Cet effet est mesuré par le facteur $HML_{t}$ calculé comme la difference de rendements entre des portefeuilles à haut (high)
et faible (Low) ratio B/M

Ces trois facteurs ne permettent pas d'expliquer totalement les variations des rendements anticipés.  **Fama et French (2015)** ('A five-factor asset pricing model', Journal of Financial Economics, 116 1-22) ajoutent deux facteurs supplémentaires prenant en compte : 

4. la profitabilité anticipée des entreprises : des gains anticipés plus élevés ont tendance à augmenter le taux de rendement (toutes choses égales par ailleurs). Le facteur $RMW_{t}$ est la différence de rendement entre un portefeuille d'entreprises à forte (robust) et faible (weak) rentabilité.
5. les investissements anticipés des entreprises : des investissements plus élevés ont tendance à réduire le taux de rendement (moins de dividendes donc une valeur de marché plus petite).  Le facteur $CMA_{t}$ est la différence entre un portefeuille d'entreprises à faible nivea d'investissement (conservative) et d'entreprises à fort niveau d'investissement (agressive)

L'objectif de cette fiche va être d'utiliser ces facteurs pour estimer la décomposition des rendements d'un ensemble de portefeuilles d'action du NYSE, AMEX et Nasdaq.
On vérifiera dans quelle mesure ces facteurs expliquent correctement les rendements anticipés

    
Les données se trouvent sur le site de Kenneth French
https://mba.tuck.dartmouth.edu/pages/faculty/ken.french/data_library.html
    
    
**Dans les parties III et IV, les estimations devront être faites sur la période 1963-07-01 à 2023-07-01**


**Vous pouvez ajouter vos réponses (codes, affichage et commentaires des résultats) directement dans le notebook. Vous le sauvergarder avec votre nom.**
    


## I. Les 5 facteurs de Fama-French

#### 1. Importation des données 

Les données des facteurs de 5 facteurs de Fama-French sont stockées dans le fichier "F-F_Research_Data_5_Factors_2x3.csv". 

1. Importez les observations mensuelles de ces facteurs à partir de "1963-07-01".
2. Vérifiez l'existence de variables manquantes
3. Après des transformations appropriées, la date deviendra l'indice des données. 
4. Construire un dataframe spécifique pour le taux sans risque.

#### 2. Vérification de l'existence de variables manquantes

Vérifiez l'existence de variables manquantes

#### 3. Formatage des dates + Taux sans risque

1. Transformez les dates en indice du dataframe
2. Stockez le taux sans risque RF dans un dataframe spécifique

#### 4. Représentation graphique des facteurs

Faites la représentation graphique des facteurs 

#### 5. Statistiques descriptives

Calculez la moyenne, le maximum, le minimum, l'écart-type, le skewness, le kurtosis pour chaque facteur

    - pour la totalité de l'échantillon
    - par année
    - par mois

#### 6. Matrice de correlation
1. Estimez la matrice de corrélation des facteurs et commentez
2. Faites une représentation graphique de cette matrice
3. Vérifiez la significativité de la corrélation entre les facteurs $HML$ et $SMB$

## II. Les 25 portefeuilles formés à partir de B/M et OP

On importe les rendements de 25 portefeuilles formés à partir des titres du NYSE, de l'AMEX, du NASDAQ pour lesquels on dispose de toutes les quotations. 
Ces actions sont réparties en 25 portefeuilles obtenus par le croisement du ratio *B/M*:
- divisé en 5 catégories LoBM ou BM1/BM2/BM3/BM4/HiBM ou BM5

et de l'Operating Profitability: 
 
- divisé en 5 catégories LoOP ou OP1/OP2/OP3/OP4/HiOP ou OP5

Ces données se trouvent dans le fichier "25_Portfolios_BEME_OP_5x5.CSV"

#### 1. Importation des données

1. Importez les données
2. Transformez les dates au format yyyy-mm-01 (exemple 196307 devient 1963-07-01)
3. Transformez les dates en indices
4. Sélectionnez les observations à partir de "1963-07-01"

#### 2. Calculez les excès de rendements $R_{it} -RF_{t}$

#### 3. Calcul de statistiques descriptives

Calculez les rendements moyens pour chaque portefeuille. Que pouvez-vous dire de la relation entre le rendement moyen et 
- le *B/M* (*value effect*)  ?
- le *OP* (*profitability effect*) ?

## III. Estimation du modèle à facteurs


Pour chaque actif *i*, on dispose de T observations ${r_{i1},...,r_{iT}}$. On peut estimer les trois régressions suivantes : :
    
### Régression sur le facteur du marché
$$ R_{it} - R_{Ft} = \alpha_{i}+\beta_{i}(R_{MT}-R_{Ft})+e_{it}$$

### Régression sur les 3 facteurs
$$ R_{it} - R_{Ft} = \alpha_{i}+\beta_{i}(R_{MT}-R_{Ft})+s_{i}SMB_{t}+h_{i}HML_{t}+e_{it}$$

### Régression sur les 5 facteurs 
$$ R_{it} - R_{Ft} = \alpha_{i}+\beta_{i}(R_{MT}-R_{Ft})+s_{i}SMB_{t}+h_{i}HML_{t}+r_{i}RMW_{t}+c_{i}CMA_{t}+e_{it}$$

- $R_{Ft}$ est le taux sans risque
- $R_{MT}$ est le taux de rendement du portefeuille du marché
- Le résidu $e_{it}$ représente le risque idiosyncratique (ou risque diversifiable) de chaque actif.
- $\beta_{i}, s_{i}, h_{i},r_{i}, c_{i}$ représentent les expositions à chacun des facteurs
- $\alpha_{i}$ est la constante. Selon la théorie des portefeuilles efficients, on s'attend à avoir $a_{i}=0$. Cette hypothèse peut aussi se justifier par la proposition que l'ensemble des facteurs représentent la totalité des facteurs de risque.

#### 1. Construisez une fonction permettant d'estimer ces trois régressions. Vous conserverez comme output :

1. les coefficients estimés
2. les tstat des coefficients estimés
3. les résidus des régressions
4. La moyenne des constantes en valeur absolue

#### 2. Commentaires des estimations 
1. Calculez et donnez les noms des portefeuilles pour lesquels le coefficients du rendement du portefeuille du marché est

- supérieur à 1
- égal à 1
- inférieur à 1

2. Pour chacun des facteurs HML, SMB et CMA, donnez :
    
- le nombre d'actifs pour lesquels chacun des facteurs pris un à un n'est pas significatif
- les noms des portefeuilles concernés

Quels facteurs vous paraissent ne pas avoir un pouvoir explicatif dans les variations des rendements ?
     

#### 3. Corrélation des résidus

1. Calculez la matrice de corrélation des résidus et faites sa visualisation graphique
2. Peut-on supposer que les corrélations des résidus sont nulles en moyenne ? Que pouvez-vous en déduire sur la capacité des cinq facteurs à expliquer les variations communes des rendements ?


#### 4. Affichez et commentez les moyennes des $\vert \alpha_{i} \vert$

# IV. GRS test (Gibbon, Ross and Shanken (1989)) of frontier efficiency

Le test GRS vérifient si les constantes des régressions des rendements sur les facteurs sont simultanément nulles. L'hypothèse nulle du test GRS est :
$$
H_{0} : \alpha_{i}=0, \forall i=1,...,N
$$

On note :
    
- $\hat{\alpha}= (\hat{\alpha}_{1},\hat{\alpha}_{2},...,\hat{\alpha}_{N} )'$ le vecteur colonne des N $\hat{\alpha}_{i}$
- $f_{t} = (f_{1t}, f_{2t},...,f_{kt})'$ le vecteur des *k* facteurs à la date *t*
- $\hat{e}_{t} = (\hat{e}_{1t},...,\hat{e}_{Nt})'$ le vecteur des N résidus à la date *t*
- $\bar{f} = \frac{1}{T}\sum_{t=1}^{T}f_{t}$ le vecteur des moyennes empiriques des facteurs
- $\hat{\Omega} = \frac{1}{T}\sum_{t=1}^{T}f_{t}f_{t}^{'} - \bar{f}\bar{f}^{'}$ la matrice de variance covariance des facteurs
- $\hat{\Sigma} = \frac{1}{T-k-1}\sum_{t=1}^{T}e_{t}e_{t}^{'} $
                                                       
La statistique du test de nullité simultanée des constantes est :

$$\hat{W}=\frac{T(T-N-k)}{N(T-k-1)}(1-\bar{f}^{'}\hat{\Omega}^{-1}\bar{f})\hat{\alpha}^{'}\hat{\Sigma}^{-1}\hat{\alpha}$$
                                    
Sous $H_{0}$ on a $\hat{W} \sim \mathcal{F}(N,T-N-k)$ 
                                    
#### 1. Programmation et éxecution du test
Construire une fonction effectuant le test GRS et appliquez-là aux différents ensembles de facteurs (1, puis 3 puis 5 facteurs)

#### 2. Commentaires des résultats des tests
Indiquez les réponses du test pour chacun des trois ensembles de facteurs. Existe-t-il un ensemble de facteurs pour lequel les $\alpha_{i}$ sont tous simultanément égaux à 0 ?