# Partie 3 : Evaluation par arbitrage (Arbitrage pricing theory)

Le CAPM aboutit au resultat suivant, pour tout actif j:

$$E(r_j) = r_f + \beta_j*(E(r_M)-r_f)$$
avec $$\beta_j = \frac{Cov(r_j, r_M)}{\sigma_M^2}$$

On peut étendre ce résultat à tout portefeuille d'actif p :

$$E(r_p) = \sum_j w_jE(r_j) = \sum_j w_j*r_f + \sum_j w_j*\beta_j*(E(r_M)-r_f)$$
C'est-à-dire : 
$$E(r_p) = r_f + \beta_p * (E(r_M)-r_f)$$
avec $$\beta_p = \sum_j w_j*\beta_j$$

L'objectif du modèle d'évaluation par arbitrage est de s'intéresser à la même idée de séparation entre risque systémique et risque spécifique, mais en l'abordant sous l'angle de l'arbitrage.

Référence : 
Ross, Stephen A. « The arbitrage theory of capital asset pricing ». Journal of economic theory 13, nᵒ 3 (1976): 341–360.

L'argument formulé par Ross est d'abord conduit avec un seul facteur, puis généralisé à plusieurs.

La logique de l'APT tourne autour de l'idée d'arbitrage:

La définition de l'arbitrge retenue habituellement est la possibilité de réaliser un profit sans risque, sans investir de richesse (la position doit-être nulle). Un exemple simple est celui d'un actif ayant deux prix différents sur deux marchés: l'achat du titre au prix le moins cher et sa revente au prix le plus cher constitue une opération d'arbitrage : le risque est nul, l'investissement total aussi, et le gain est certain (égal à la différence de prix). Les arbitrageurs garantissent ainsi *la loi du prix unique*. 

Il suffit d'un faible nombre d'arbitrageurs pour faire disparaître les opportunités d'arbitrage, car l'absence de risque et d'investissement permet de multiplier les opérations tant que l'opportunité existe. Tout investisseur voudra prendre une position infinie sur une opportunité d'arbitrage.

C'est le caractère général de ce principe et sa rapidité d'exécution qui rendent l'arbitrage séduisant pour justifier théoriquement un modèle : c'est un avantage que ne possède pas le CAPM.

## Une situation simple

On suppose que tous les actifs dépendent d'un facteur $f$. En particulier pour deux actifs $j$ et $k$:
$$r_j = a_j + \beta_jf $$
$$r_k = a_k + \beta_kf $$

On suppose que les bêtas sont différents pour ces deux actifs. Considérons un portefeuille composé de ces deux actifs :

$$r = wr_j + (1-w)r_k  $$
$$r = w(a_j + \beta_jf) + (1-w)(a_k + \beta_kf)$$
$$r = wa_j + (1-w)a_k + [w\beta_j + (1-w)\beta_k]f$$

Pour analyser l'effet de l'absence d'arbitrage, on va construire un portefeuille sans risque. Le rendement de ce portefeuille sera nécessairement égal au taux sans risque s'il n'y a pas d'opportunité d'arbitrage.

Si on prend 
$$w = \frac{\beta_k}{(\beta_k - \beta_j)}$$ 
on obtient
$$r = wa_j + (1-w)a_k$$
$$r = \frac{\beta_k}{(\beta_k - \beta_j)}a_j - \frac{\beta_j}{(\beta_k - \beta_j)}a_k$$

Il s'agit d'un taux sans risque, en l'absence d'arbitrage on doit donc avoir ce taux égal à $r_f$.

$$r_f = \frac{\beta_k}{(\beta_k - \beta_j)}a_j - \frac{\beta_j}{(\beta_k - \beta_j)}a_k$$
$$r_f(\beta_k - \beta_j) = \beta_ka_j - \beta_ja_k$$
$$ \frac{a_j - r_f}{\beta_j} = \frac{a_k - r_f}{\beta_k} $$

Donc tous les actifs $j$ ont cette quantité en commun :
$$ \frac{a_j - r_f}{\beta_j} = c \quad \forall j $$
Que l'on peut écrire:
$$ a_j = r_f + \beta_ic$$

On peut donc obtenir l'espérance de revenu de $r_j$:
$$ E(r_j) = a_j + \beta_j E(f) = r_f + \beta_jc + \beta_jE(f) = r_f + \beta_j(c + E(f))$$

En l'appliquant au portefeuille de marché on obtient :
$$ E(r_M) - r_f =  c + E(f)$$
D'où
$$ E(r_j) = r_f + \beta_j(E(r_M) - r_f))$$
Ce qui est la même équation que le CAPM.

## Un modèle plus avancé

Comme le CAPM et l'APT (Arbitrage Pricing Theory) partagent la même idée de séparation entre risque systémique et risque spécifique, la supposition de départ de l'APT est très similaire au CAPM.

Supposons que le risque pur d'un rendement d'un actif $j$ puisse se décomposer en risque pur lié à un facteur unique (systémique, donc) et à un risque spécifique. On a alors:

$$r_j = E(r_j) + \beta_j\bar \delta + \bar \epsilon_j$$

avec $\bar \delta$ désignant le risque pur systémique (donc d'espérance 0) et $\bar \epsilon_j$ le risque pur spécifique. Les risques spécifiques sont indépendants. (Techniquement : suffisamment indépendants pour que la loi des grands nombres s'applique).

Pour prendre en compte la notion d'arbitrage, il faut prendre en compte deux aspects:
1. La richesse investie dans un portefeuille d'arbitrage est nulle : les achats de certains actifs sont compensés par les ventes par ailleurs.
2. Le risque systémique est nul. Les arbitrages parfaits disposent d'un risque (tout court) nul; mais l'APT ne nécessite que la supposition que le risque systémique soit nul, et que le risque spécifique soit bien équilibré entre les actifs, de sorte qu'il sera diversifié en augmentant le nombre d'actifs, et donc tendre vers 0 à l'aide de la loi des grands nombres.

Comme précédemment, un portefeuille est entièrement défini par les poids $w_j$ :
$$
w = \left( \begin{array}{c}
w_1 \\
w_2 \\
\vdots \\
w_n \\
\end{array} \right)
$$

On note $e$ le vecteur identité :
$$
e = \left( \begin{array}{c}
1 \\
1 \\
\vdots \\
1 \\
\end{array} \right)
$$

On note r le vecteur des rendements :
$$
r = \left( \begin{array}{c}
r_1 \\
r_2 \\
\vdots \\
r_n \\
\end{array} \right)
$$

On a de la même manière le vecteur de l'espérance des rendements $E$:
$$
E = \left( \begin{array}{c}
\mathrm{E}(r_1) \\
\mathrm{E}(r_2) \\
\vdots \\
\mathrm{E}(r_n) \\
\end{array} \right)
$$

... et le vecteur des bêtas:
$$
\beta = \left( \begin{array}{c}
\beta_1 \\
\beta_2 \\
\vdots \\
\beta_n \\
\end{array} \right)
$$

La richesse (en proportion de la richesse disponible) investie dans le portefeuille est donc :
$$w'e = \sum_j w_j * 1$$

Jusqu'à présent, on considérait les portefeuilles d'investissements qui réunissent nécéssairement toute la richesse disponible (quitte à placer une bonne partie dans l'actif sans risque). On avait alors :
$$w'e = \sum_j w_j * 1 = 1$$

Nous nous intéressons ici à une forme particulière de portefeuille, qui implique que la richesse investie sous au contraire égale à 0 au total :
$$w'e = w_j * 1 = 0$$
Ce que l'on appelle un portefeuille d'arbitrage.

Le raisonnement est le suivant :

Etape 1 : Constituer un portefeuille d'arbitrage de richesse investie nulle ($w'e = 0$) et suffisamment bien équilibré pour que le risque spécifique tende vers 0 avec la loi des grands nombres.

Etape 2 : Considérons notre portefeuille d'arbitrage :
$$r_p = w'r = \sum_j w_j r_j = \sum_j w_j [E(r_j) + \beta_j\bar \delta + \bar \epsilon_j]$$
$$r_p = w'r = \sum_j w_jE(r_j) + \sum_j w_j\beta_j\bar \delta + \sum_j w_j\bar \epsilon_j$$
$$r_p = w'r = w'E + (w'\beta) \bar \delta + w'\bar \epsilon$$

D'après la loi des grands nombres, pour un grand nombre d'actifs n, le rendement du portefeuille devient:

$$r_p = w'r \approx w'E + (w'\beta) \bar \delta$$

Etape 3 : Nous avons également le fait que le portefeuille n'ait pas de risque systémique, ce que l'on peut traduire par :
$$w'\beta = 0$$

Ce qui nous donne :
$$r_p = w'r \approx w'E$$

Ce que l'on peut interpréter comme un retour certain si le portefeuille est suffisamment diversifié pour faire disparaître le risque spécifique. En résumé, en n'utilisant aucune richesse, nous sommes à même ne nous assurer un rendement certain: c'est ce qui caractérise un portefeuille d'arbitrage.

Nécessairement, ce rendement certain doit être égal à 0. S'il est différent de 0, un petit nombre d'arbitrageurs suffira à faire revenir ce rendement à 0 très rapidement. Nous avons donc nécessairement:
$$w'E = 0$$

Nous avons donc :
$$\forall w \in \mathbb{R}^n, w'e = w'\beta=0 \Rightarrow w'E = 0  $$

En faisant un peu d'algèbre, on peut tirer de ce résultat quelque chose d'intéressant.

Nous nous situons dans $\mathbb{R}^n$, ce qui signifie que :
$$\forall w \in \mathbb{R}^n,$$
$$
w = \left( \begin{array}{c}
w_1 \\
w_2 \\
\vdots \\
w_n \\
\end{array} \right)
$$
d'où 
$$w = \sum_j w_j * e_j$$
avec 
$$
e_j = \left( \begin{array}{c}
0 \\
0 \\
\vdots \\
1 \\
\vdots \\
0 \\
\end{array} \right)
$$
(sur la ligne n°j)

Il s'agit de la décomposition de $w$ dans la base canonique de $\mathbb{R}^n$.

Néanmoins il existe une infinité de bases de $\mathbb{R}^n$, et l'on pourrait décomposer $w$ dans n'importe laquelle.

Etant donné qu'il existe $n$ dimensions dans $\mathbb{R}^n$, les bases de $\mathbb{R}^n$ comprennent $n$ éléments.

Ces éléments forment une [famille libre](https://fr.wikipedia.org/wiki/Ind%C3%A9pendance_lin%C3%A9aire), c'est-à-dire qu'on ne peut écrire aucun élément de cette famille comme une combinaison linéaire des autres éléments:
$$z = 1x + 2y$$

C'est logique, car cela signifierait que cette dimension n'en est pas vraiment une. On dit qu'il existe une indépendance linéaire entre les éléments de la base. 
Formellement, pour une famille $(v_{i})_{{1\leq i\leq n}}$ cela s'écrit comme ceci:

$\forall (a_{1},\ldots ,a_{n})\in \mathbb{R}^{n}$ non tous nuls, on a:
$$\quad \left(a_{1}v_{1}+\cdots +a_{n}v_{n}=0\Rightarrow a_{1}=a_{2}=\cdots =a_{n}=0\right)$$

Ce qui peut se traduire par : s'il existe des coefficient $a_i$ non tous nuls tels que l'on peut écrire une relation linéaire entre les éléments de la famille, alors c'est que tous les coefficients $a_i$ valent 0, car sinon la famille ne serait pas libre (il n'y aurait pas d'indépendance linéaire).

Parmi les bases de $\mathbb{R}^n$, il en existe qui dont les vecteurs sont orthogonaux entre eux. C'est-à dire que le produit scalaire de deux vecteurs est nuls : la projection d'un vecteur sur l'autre vaut 0. Le produit scalaire dans $\mathbb{R}^n$ est simplement:
$$\langle x,y\rangle =\sum _{{i=1}}^{n}x_{i}y_{i}= x'y$$
Rappelons nous que le produit scalaire est bilinéaire, que l'on peut donc séparer les sommes et sortir les facteurs.

Commençons par observer que la famille $(e, \beta)$ forme une famille libre (sinon les betas seraient tous égaux, situation que l'on peut écarter).

Le produit scalaire de $e$ et de $\beta$ est:
$$\langle e,\beta\rangle = \sum _{{i=1}}^{n}1*\beta_i$$

Pour obtenir un produit scalaire nul, il suffit simplement de centrer le vecteur $\beta$, c'est-à-dire de soustraire chaque élément par sa moyenne $\bar \beta = \frac1n\sum _{{i=1}}^{n}\beta_i$:
$$\langle e,\beta - \bar \beta e\rangle = \sum _{{i=1}}^{n}1*(\beta_i - \bar \beta) = \sum _{{i=1}}^{n}\beta_i - n\bar \beta = \sum _{{i=1}}^{n}\beta_i - \frac nn\sum _{{i=1}}^{n}\beta_i=0$$

Nous avons donc deux vecteurs qui forment une famille libre, et ils sont orthogonaux entre eux.

C'est un bon début pour une base de $\mathbb{R}^n$. Il serait possible de trouver $(v_3, v_4, ..., v_n)$ pour compléter $(e, \beta - \bar \beta e)$ et former une famille libre et dont les vecteurs sont orthogonaux entre eux.

$(e, \beta - \bar \beta e, v_3, ..., v_n)$ est alors une famille libre de $n$ vecteurs: elle forme alors une base de $\mathbb{R}^n$. Il est possible d'écrire n'impore quel élément de $\mathbb{R}^n$ comme une combinaison linéaire de ces éléments. Prenons le vecteur E des espérance de rendements:
$$
E = \left( \begin{array}{c}
\mathrm{E}(r_1) \\
\mathrm{E}(r_2) \\
\vdots \\
\mathrm{E}(r_n) \\
\end{array} \right)
$$

On a donc :
$$\exists (a_{1},\ldots ,a_{n})\in \mathbb{R}^{n}, E= a_1e + a_2(\beta - \bar \beta e) + a_3v_3 + ... + a_nv_n$$
et
$$\forall w \in \mathbb{R}^{n}, \exists (b_{1},\ldots ,b_{n})\in \mathbb{R}^{n}, w= b_1e + b_2(\beta - \bar \beta e) + b_3v_3 + ... + b_nv_n$$

Or si on se limite au portefeuille d'arbitrage $w$ tel que défini précédemment, on a :
$$\langle w,e\rangle =w'e =  0$$
$$\langle b_1e + b_2(\beta - \bar \beta e) + b_3v_3 + ... + b_nv_n, e\rangle = 0$$
or 
$$\langle b_1e + b_2(\beta - \bar \beta e) + b_3v_3 + ... + b_nv_n, e\rangle = \langle b_1e, e\rangle$$ car la base est composée de vecteur orthogonaux entre eux.
On a donc:
$$\langle b_1e, e\rangle = b_1||e||=0$$
D'où $b_1 = 0$.

De la même manière on a $$\langle w,\beta - \bar \beta e\rangle = \langle w,\beta \rangle - \langle w,\bar \beta e\rangle=w'\beta - \bar \beta w'e=  0$$
et on a donc $b_2 = 0$

On a donc $$w= b_3v_3 + ... + b_nv_n$$

On peut repartir de:
$$E= a_1e + a_2(\beta - \bar \beta e) + a_3v_3 + ... + a_nv_n$$
et multiplier par $w'$:
$$w'E = a_1w'e + a_2w'(\beta - \bar \beta e) + w'(a_3v_3 + ... + a_nv_n)$$
$$0 = w'(a_3v_3 + ... + a_nv_n)$$
$$0 = \langle w,a_3v_3 + ... + a_nv_n\rangle$$
$$0 = \langle b_3v_3 + ... + b_nv_n, a_3v_3 + ... + a_nv_n\rangle$$

Le fait que les vecteur soient orthogonaux deux-à-deux permet d'aboutir à:
$$0 = a_3b_3||v_3|| + ... + a_nb_n||v_n||$$

Or on sait que $||v_i|| \neq 0$ et que l'égalité précédente reste vraie pour tous les $(b_3, ..., b_n) \in \mathbb{R}^n$.
On a donc:
$$a_3 = ... = a_n = 0$$
et donc 
$$E= a_1e + a_2(\beta - \bar \beta e)$$
ce que l'on peut réécrire comme :
$$E= (a_1 - a_2\bar \beta)e + a_2\beta$$
d'où le résultat fondamental de l'Arbitrage Pricing Theory:
$$E= \rho e + \lambda\beta$$

C'est une égalité vectorielle que l'on peut dérouler au niveau des espérance de rendements des actifs individuels:
$$E(r_j) = \rho + \lambda\beta_j, \quad j=(1, ..., n)$$

Pour l'actif sans risque $r_n$, on a $\beta_{n} = 0$, et donc :
$$E(r_n) = r_f = \rho$$
L'égalité devient:
$$E(r_j) = r_f + \lambda\beta_j, \quad j=(1, ..., n)$$

On observe là-encore que cette égalité s'applique aux portefeuilles:
$$E(r_p) = \sum_j w_jE(r_j) = \sum_j w_j*r_f + \sum_j w_j\beta_j \lambda$$
$$E(r_p) = w'E = r_f + \lambda \beta_p$$

En particulier au portefeuille de marché:
$$E(r_m) = w_m'E = r_f + \lambda\beta_m$$

Or on a :
$$r_j = E(r_j) + \beta_j\bar \delta + \bar \epsilon_j$$
donc pour le marché :
$$r_m = E(r_m) + \beta_m\bar \delta $$
D'où $\beta_m = 1$, logiquement.

On a donc :
$$E(r_m) = r_f + \lambda$$
$$\lambda = E(r_m) - r_f$$

Le résultat devient donc :
$$E(r_j) = r_f + (E(r_m) - r_f)\beta_j, \quad j=(1, ..., n)$$

### Risque spécifique négligeable

On a vu à l'étape 2 que:
$$r_p = w'r = \sum_j w_jE(r_j) + \sum_j w_j\beta_j\bar \delta + \sum_j w_j\bar \epsilon_j$$
Ce qui nous permet d'écrire la variance du portefeuille:
$$\sigma_p^2 =  \beta_p^2 \sigma^2(\bar \delta) + \sum_j w_j^2\sigma^2(\bar \epsilon_j)$$

Le fait que la part de la variance du portefeuille spécifique aux actifs $\sum_j w_j^2\sigma^2(\bar \epsilon_j)$ deviennent négligeable dépend de plusieurs suppositions et de l'application de la loi des grands nombres. Mais nous pouvons avoir une intuition du phénomène en prenant un portefeuille avec des poids égaux a $\frac1n$:

$$\sum_j w_j^2\sigma^2(\bar \epsilon_j) = \sum_j (\frac1n)^2\sigma^2(\bar \epsilon_j) = \frac1n \sum_j \frac1n\sigma^2(\bar \epsilon_j) = \frac1n \bar \sigma^2(\bar \epsilon_j)$$

Si la variance des actifs est bornée (ce qui constitue une hypothèse du modèle), alors la diversification fera tendre la composante spécifique de la variance du portefeuille vers 0.

Dans le cas général, il faut que le portefeuille soit suffisamment diversifié pour que cette quantité devienne négligeable. Si chaque actif reste présent dans le portfeuille avec un magnitude de 1/n (comme présenté par Ross, 1976), alors cela s'applique. On peut définir de manière plus générale un portefeuille comme bien diversifié si cette quantité est négligeable.

En pratique, cela constitue le principal raccourci (et donc la faiblesse) du modèle APT. 

In [3]:
import numpy as np
sigma_2_j = 0.2
for n in [4, 60, 200, 1000, 10000]:
    sd = (1 / n) * sigma_2_j ** 2
    print("N: " + str(n) + " Risque spécifique : " + str(np.sqrt(sd)))

N: 4 Risque spécifique : 0.1
N: 60 Risque spécifique : 0.025819888974716113
N: 200 Risque spécifique : 0.014142135623730952
N: 1000 Risque spécifique : 0.00632455532033676
N: 10000 Risque spécifique : 0.002


Les fonds et les index contiennent généralement moins de 1000 actifs, les plus gros peuvent monter jusqu'à 5000. En situation idéale (diversification a 1/n), le risque spécifique n'est pas tout à fait négligeable.

### CAPM ou APT a un facteur ?

L'APT a plusieurs arguments a faire valoir contre le CAPM:
- Pas de normalité des rendements
- Pas d'homogénéité des comportements (le CAPM suppose que tout le monde optimise à la Markowitz)
- Caractère indiscutable et universel de l'arbitrage
- Rapidité d'exécution ; les opportunités d'arbitrages sont comblées aussi vite que possible, tandis que les écarts à l'équilibre dans le CAPM sont réajustés par l'aggrégation de gros volumes d'opérations conduites par les investisseurs qui modifient leurs portefeuilles.
- Nécessite peu d'arbitrageurs, tandis que l'ensemble des investisseurs doivent réajuster leurs portefeuilles pour que le système reviennent à l'équilibre dans le CAPM. 
- Un portefeuille suffisamment bien diversifié suffit dans l'APT, tandis que le CAPM nécessite un portefeuille optimal composé de tous les actifs d'un marché supposé unique et accessible entièrement à tous.

Il a cependant plusieurs inconvénients:
- La supposition de risque spécifique négligeable peut être violée même pour de très grands portefeuilles. Les portefeuilles actifs ont une taille plus limitée, et peuvent donc manifester un risque spécifique persistant.
- Mathématiquement, les conclusions de l'APT sont valables pour l'ensemble des actifs sauf peut-être quelques-uns. Ces exceptions ne sont pas possibles dans le CAPM, car les agents shortent ou achètent les actifs qui ne possèdent pas le bon ratio contribution au rendement / contribution au risque systémique.

Mais les deux modèles arrivent à la même conclusion, ce qui renforce sa pertinence.

## Le modèle a plusieurs facteurs

Il est possible de supposer que le risque ne provient pas d'une seule source, mais de plusieurs. A l'inverse du CAPM, il n'y a pas de notion d'équilibre et donc de marché comme facteur unique. On peut imaginer plusieurs source  de facteurs systémiques affectant les actifs.

Prenons par exemple deux facteurs:

$$r_j = E(r_j) + \beta_{j1}\bar \delta_1 + \beta_{j2}\bar \delta_2+ \bar \epsilon_j$$

On peut imaginer que le premier facteur désigne un décalage entre la croissance mondiale et les prévisions, tandis que le second désigne un changement inattendu de taux d'intérêts. Les deux facteurs sont toujours d'espérance nulle car ils désignent le risque pur, la surprise : ce qui était attendu est déjà intégré dans l'espérance de $r_j$.

Les facteurs peuvent être intégrés dans le modèle à l'aide de *tracking portfolios*, des portefeuilles conçus pour avoir un beta de 1 vis-à-vis du facteur considéré.

Il pourrait être démontré que l'absence d'arbitrage implique le résultat suivant :
$$E(r_j) = r_f + (E(r_{p1}) - r_f)\beta_{p1} + (E(r_{p2}) - r_f)\beta_{p2}$$

Intuitivement, cela se traduit par le fait le concept d'arbitrage s'étend aisèment à plusieurs facteurs. Pour l'actif $r_j$ vu précédemment, il est possible de constituer un portefeuille Q répliquant le rendement attendu, en investissant $\beta_{p1}$ dans le portefeuille du facteur 1, $\beta_{p2}$ dans le portefeuille du facteur 2 et $1 - \beta_{p1} - \beta_{p2}$ dans l'actif sans risque. On obtient:

$$E(r_Q) = \beta_{p1}E(r_1) + \beta_{p2}E(r_2) + (1 - \beta_{p1} - \beta_{p2})r_f$$
$$E(r_Q) = r_f + (E(r_{p1}) - r_f)\beta_{p1} + (E(r_{p2}) - r_f)\beta_{p2}$$

Si le rendement d'un actif dévie de la valeur prédite par les facteurs qui le composent, une opportunité d'arbitrage apparaît.

## Le modèle Fama-French a trois facteurs

### Théorie

Le modèle APT peut se généraliser à plusieurs sources de risques. Comment les identifier ? Lesquelles sont nécessaires ? Un modèle relativement éprouvé est le modèle Fama-French a trois facteurs.

Si une source de risque est non identifiée par le CAPM (ou l'APT a un facteur), quelles sont les conséquences ?

Compte-tenu de l'intelligence du marché, les conséquences probables sont une adaptation plus ou moins consciente des agents face à des actifs qui présentent une sensibilité à ces risques.
A rendement égal, ils préfereront les fuir : "ce type d'actif a tendance à être risqué, pour ce prix là cela ne vaut pas la peine".
Ce qui va entraîner une baisse des prix et donc une augmentation du rendement jusqu'à ce que le "surplus" de rendement compense le surplus de risque.

Conséquence : un alpha positif dans le CAPM classique pour les actifs sensibles à cette nouvelle source de risque, et négatif pour les autres.

Les sources de risques supplémentaires par rapport au risque systémique peuvent donc être identifiées via les alphas positifs de certaines catégories d'actifs.

Le point de départ du travail de Fama et French, c'est l'identification de deux de ces facteurs:

1. La taille des entreprises (par capitalisation boursière) semble jouer de manière négative sur l'alpha: les petites entreprises semble avoir des alpha positifs, c'est à dire des surplus de rendements non expliqués par leur bêta, leur sensibilité au risque systémique.
2. Le ratio Book-to-market (B/M) semble être lié positivement avec l'alpha des actifs. Le ratio B/M désigne le ratio entre la valeur comptable et la valeur boursière de l'entreprise. 

Un ratio B/M élevé peut signifier plusieurs choses:
- l'entreprise est sous-évaluée par le marché
- l'entreprise génère ses revenus grâce à ses infrastructures et ne dispose pas d'autre atout (talent managérial, créneau porteur, potentiel scientifique) non valorisables comptablement. 
- l'entreprise semble avoir un potentiel (non réalisé par définition) faible
- l'entreprise connaît des difficultés immédiates qui ne sont pas (encore ?) répercutées sur la valeur comptable.

Pour la deuxième raison, on appelle ces actifs des *value assets*.

A l'inverse, les entreprises avec un ratio B/M faible sont tout l'inverse :
- l'entreprise est sur-évaluée (hype ? bulle ?)
- l'entreprise tire sa valeur d'éléments non valorisables comptablement (Uber : une idée novatrice, une réputation mondiale.)
- l'entreprise dispose d'un potentiel (entreprises avec beaucoup de dette mais jugées prometteuses par le marché, comme Amazon, Facebook à ses débuts, etc. Kodak qui annonce son *intention* d'utiliser un processus basé sur blockchain)
- l'entreprise connaît des résultats récents très bons, ce qui reste à être traduit comptablement.

On appelle ces entreprises assez logiquement des *growth assets*.

Il reste à lier ces éléments avec des facteurs de risques non systémiques. Les observations empiriques sont relativement bien documentées, mais les explications de ces facteurs restent des questions ouvertes. Quels sont les risques liés ? Quelques éléments :

Dans le cas de la taille des entreprises, les éléments avancés sont:
- La taille des petites structures les rend plus fragiles et elles peuvent être affectées par certaines conditions de marché qui laissent les grosses entreprises indifférentes, ou moins sensibles (par exemple, une restriction des liquidités). A l'inverse, dans certaines conditions de marché changeantes, elle peuvent s'adapter plus rapidement, (proportionnellement) trouver plus facilement des financements et donc croître plus vite (en pourcentage). Il y a donc une volatilité des rendements supplémentaires, qui s'ajoute à la sensibilité systémique / macroéconomique et qui n'est pas diversifiable.
- Dans certaines conditions de marché, les investisseurs peuvent avoir un comportement de retrait vers les valeurs plus rassurantes représentées par les grosses entreprises. A l'inverse, dans certaines situations les investisseurs peuvent rechercher plus de sources de rendements et s'intéresser aux petites structures. Ces mouvements peuvent maintenir globalement le rendement du marché (puisque il n'y a pas de fuite vers l'actif sans risque ou autre) mais créeent une source de risque détachée du risque systémique, lié à la taille des entreprises et non diversifiable (Hypothèse comportementale).

Dans le cas du ratio B/M, l'élément généralement avancé est :
- Il peut parfois s'agir d'entreprises en difficulté : ce facteur peut donc capter des sources de risques diverses non systémiques

### Pratique

Les données sont disponibles sur le site du [Pr. French](http://mba.tuck.dartmouth.edu/pages/faculty/ken.french/data_library.html).

SMB = Small Less Big : Rendement espéré d’un portefeuille de titres à faible capitalisation - rendement espéré d’un portefeuille de titres à forte capitalisation.

HML = High Minus Low : Rendement espéré d’un portefeuille de titres avec ratio B/M élevé - rendement espéré d'un portefeuille de titres avec un ratio B/M faible.

$$E(r_j) = r_f + \beta_{M}(E(r_m) - r_f) + \beta_{SMB}SMB + \beta_{HML}HML$$

#### Importer les packages

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
%matplotlib inline
plt.rcParams['figure.figsize'] = (15, 10)

In [2]:
import quandl
cle_API = "vV5n2kkCHA3mm-zKCwBQ"
quandl.ApiConfig.api_key = cle_API

#### Ouvrir les données de Fama - French

In [3]:
data = []
fichier = open('F-F_Research_Data_Factors.CSV', 'r')

next(fichier)
for ligne in fichier:
    data.append(ligne.strip('\n').split(','))
    
fichier.close()
data = pd.DataFrame(data, columns=['Time', 'Mkt-RF', 'SMB', 'HML', 'RF'])
data.set_index('Time', inplace=True)
data.tail()

Unnamed: 0_level_0,Mkt-RF,SMB,HML,RF
Time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
201809,0.06,-2.37,-1.34,0.15
201810,-7.68,-4.68,3.41,0.19
201811,1.69,-0.74,0.19,0.18
201812,-9.55,-2.6,-1.51,0.19
201901,8.41,3.01,-0.6,0.21


#### Télécharger les données de Quandl

In [4]:
debut = '2011-01-01'
frequence = 'monthly'

In [5]:
liste_actions = ['WIKI/AAPL', 'WIKI/MCD', 'WIKI/MSFT', 'WIKI/TGT', 'WIKI/GE', 'WIKI/AMZN', 'WIKI/UPS', 
                 'WIKI/GM', 'WIKI/IBM', 'WIKI/PEP', 'WIKI/VZ', 'WIKI/DIS', 'WIKI/INTC', 'WIKI/F', 'WIKI/CMCSA']

In [6]:
nb_actifs = len(liste_actions)

actions = quandl.get(liste_actions, start_date = debut, 
                     column_index = 4, collapse=frequence)

In [7]:
actions.tail()

Unnamed: 0_level_0,WIKI/AAPL - Close,WIKI/MCD - Close,WIKI/MSFT - Close,WIKI/TGT - Close,WIKI/GE - Close,WIKI/AMZN - Close,WIKI/UPS - Close,WIKI/GM - Close,WIKI/IBM - Close,WIKI/PEP - Close,WIKI/VZ - Close,WIKI/DIS - Close,WIKI/INTC - Close,WIKI/F - Close,WIKI/CMCSA - Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1
2017-11-30,171.85,171.97,84.17,59.9,18.29,1176.75,121.45,43.09,153.97,116.52,50.89,104.82,44.84,12.52,37.54
2017-12-31,169.23,172.12,85.54,65.25,17.45,1169.47,119.15,40.99,153.42,119.92,52.93,107.51,46.16,12.49,40.05
2018-01-31,167.43,171.14,95.01,75.22,16.17,1451.65,127.32,42.41,163.7,120.3,54.07,108.67,48.14,10.97,42.53
2018-02-28,178.12,157.74,93.77,75.41,14.11,1512.45,104.41,39.35,155.83,109.73,47.74,103.16,49.29,10.61,36.21
2018-03-31,168.34,157.48,89.47,68.51,13.44,1497.05,102.17,34.87,151.91,107.64,47.31,99.36,51.19,10.83,32.99


#### Harmoniser l'index avec les données de Fama - French

In [8]:
dates = []
for item in actions.index.values:
    dates.append((str(item)[:4] + str(item)[5:7]))
actions['Time'] = dates
actions.set_index('Time', inplace=True)

In [9]:
actions.tail()

Unnamed: 0_level_0,WIKI/AAPL - Close,WIKI/MCD - Close,WIKI/MSFT - Close,WIKI/TGT - Close,WIKI/GE - Close,WIKI/AMZN - Close,WIKI/UPS - Close,WIKI/GM - Close,WIKI/IBM - Close,WIKI/PEP - Close,WIKI/VZ - Close,WIKI/DIS - Close,WIKI/INTC - Close,WIKI/F - Close,WIKI/CMCSA - Close
Time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1
201711,171.85,171.97,84.17,59.9,18.29,1176.75,121.45,43.09,153.97,116.52,50.89,104.82,44.84,12.52,37.54
201712,169.23,172.12,85.54,65.25,17.45,1169.47,119.15,40.99,153.42,119.92,52.93,107.51,46.16,12.49,40.05
201801,167.43,171.14,95.01,75.22,16.17,1451.65,127.32,42.41,163.7,120.3,54.07,108.67,48.14,10.97,42.53
201802,178.12,157.74,93.77,75.41,14.11,1512.45,104.41,39.35,155.83,109.73,47.74,103.16,49.29,10.61,36.21
201803,168.34,157.48,89.47,68.51,13.44,1497.05,102.17,34.87,151.91,107.64,47.31,99.36,51.19,10.83,32.99


#### Créer un portefeuille avec des poids égaux

In [10]:
actions = actions.pct_change()

In [11]:
actions['Portefeuille'] = 0
for i in range(nb_actifs):
    actions['Portefeuille'] += 1/nb_actifs * actions.iloc[:,i]
actions.tail()

Unnamed: 0_level_0,WIKI/AAPL - Close,WIKI/MCD - Close,WIKI/MSFT - Close,WIKI/TGT - Close,WIKI/GE - Close,WIKI/AMZN - Close,WIKI/UPS - Close,WIKI/GM - Close,WIKI/IBM - Close,WIKI/PEP - Close,WIKI/VZ - Close,WIKI/DIS - Close,WIKI/INTC - Close,WIKI/F - Close,WIKI/CMCSA - Close,Portefeuille
Time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1
201711,0.016623,0.030316,0.011902,0.014566,-0.092758,0.064662,0.033353,0.002559,-0.000584,0.057063,0.063088,0.07167,-0.014289,0.020375,0.04191,0.021364
201712,-0.015246,0.000872,0.016277,0.089316,-0.045927,-0.006187,-0.018938,-0.048735,-0.003572,0.02918,0.040086,0.025663,0.029438,-0.002396,0.066862,0.010446
201801,-0.010636,-0.005694,0.110708,0.152797,-0.073352,0.241289,0.068569,0.034643,0.067006,0.003169,0.021538,0.01079,0.042894,-0.121697,0.061923,0.040263
201802,0.063848,-0.078298,-0.013051,0.002526,-0.127396,0.041883,-0.17994,-0.072153,-0.048076,-0.087864,-0.11707,-0.050704,0.023889,-0.032817,-0.148601,-0.054922
201803,-0.054907,-0.001648,-0.045857,-0.0915,-0.047484,-0.010182,-0.021454,-0.11385,-0.025156,-0.019047,-0.009007,-0.036836,0.038547,0.020735,-0.088926,-0.033771


#### Fusionner les deux jeux de données en utilisant la méthode join() des DataFrames

In [12]:
donnees = actions.join(data.astype('float64'))
donnees = donnees.dropna()
donnees.tail()

Unnamed: 0_level_0,WIKI/AAPL - Close,WIKI/MCD - Close,WIKI/MSFT - Close,WIKI/TGT - Close,WIKI/GE - Close,WIKI/AMZN - Close,WIKI/UPS - Close,WIKI/GM - Close,WIKI/IBM - Close,WIKI/PEP - Close,WIKI/VZ - Close,WIKI/DIS - Close,WIKI/INTC - Close,WIKI/F - Close,WIKI/CMCSA - Close,Portefeuille,Mkt-RF,SMB,HML,RF
Time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1
201711,0.016623,0.030316,0.011902,0.014566,-0.092758,0.064662,0.033353,0.002559,-0.000584,0.057063,0.063088,0.07167,-0.014289,0.020375,0.04191,0.021364,3.12,-0.66,-0.05,0.08
201712,-0.015246,0.000872,0.016277,0.089316,-0.045927,-0.006187,-0.018938,-0.048735,-0.003572,0.02918,0.040086,0.025663,0.029438,-0.002396,0.066862,0.010446,1.06,-1.26,0.14,0.09
201801,-0.010636,-0.005694,0.110708,0.152797,-0.073352,0.241289,0.068569,0.034643,0.067006,0.003169,0.021538,0.01079,0.042894,-0.121697,0.061923,0.040263,5.58,-3.03,-1.37,0.11
201802,0.063848,-0.078298,-0.013051,0.002526,-0.127396,0.041883,-0.17994,-0.072153,-0.048076,-0.087864,-0.11707,-0.050704,0.023889,-0.032817,-0.148601,-0.054922,-3.65,0.28,-1.19,0.11
201803,-0.054907,-0.001648,-0.045857,-0.0915,-0.047484,-0.010182,-0.021454,-0.11385,-0.025156,-0.019047,-0.009007,-0.036836,0.038547,0.020735,-0.088926,-0.033771,-2.35,3.93,-0.11,0.12


#### Soustraire le taux de l'actif sans risque et harmoniser les données (décimales)

In [13]:
for i in range(nb_actifs+1):
    donnees.iloc[:,i] = (donnees.iloc[:,i])*100 - donnees.iloc[:,-1]

In [14]:
donnees.tail()

Unnamed: 0_level_0,WIKI/AAPL - Close,WIKI/MCD - Close,WIKI/MSFT - Close,WIKI/TGT - Close,WIKI/GE - Close,WIKI/AMZN - Close,WIKI/UPS - Close,WIKI/GM - Close,WIKI/IBM - Close,WIKI/PEP - Close,WIKI/VZ - Close,WIKI/DIS - Close,WIKI/INTC - Close,WIKI/F - Close,WIKI/CMCSA - Close,Portefeuille,Mkt-RF,SMB,HML,RF
Time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1
201711,1.582328,2.951574,1.11019,1.37664,-9.355794,6.386235,3.255319,0.175933,-0.138419,5.626251,6.228753,7.086956,-1.508885,1.95749,4.110952,2.056368,3.12,-0.66,-0.05,0.08
201712,-1.614585,-0.002775,1.537658,8.841553,-4.682674,-0.708653,-1.983783,-4.963521,-0.447212,2.827954,3.918646,2.476304,2.8538,-0.329617,6.596201,0.95462,1.06,-1.26,0.14,0.09
201801,-1.173641,-0.67937,10.960844,15.169693,-7.445244,24.018879,6.746903,3.35426,6.590561,0.206878,2.043788,0.968969,4.179428,-12.279736,6.08226,3.916298,5.58,-3.03,-1.37,0.11
201802,6.274758,-7.939847,-1.415126,0.142592,-12.849641,4.078337,-18.104031,-7.325279,-4.917575,-8.896367,-11.817046,-5.180397,2.278866,-3.391677,-14.970099,-5.602169,-3.65,0.28,-1.19,0.11
201803,-5.61068,-0.284828,-4.705688,-9.26998,-4.868405,-1.138215,-2.265388,-11.505006,-2.635562,-2.024675,-1.020712,-3.803598,3.734737,1.953516,-9.012571,-3.497137,-2.35,3.93,-0.11,0.12


#### Conduire une régression du modèle CAPM, puis du modèle Fama-French a trois facteurs, et comparer.

In [15]:
y = donnees['Portefeuille']
X = donnees[['Mkt-RF']]
X = sm.add_constant(X)

In [16]:
model = sm.OLS(y, X).fit()
print(model.summary())

                            OLS Regression Results                            
Dep. Variable:           Portefeuille   R-squared:                       0.745
Model:                            OLS   Adj. R-squared:                  0.742
Method:                 Least Squares   F-statistic:                     245.0
Date:                Wed, 27 Mar 2019   Prob (F-statistic):           1.25e-26
Time:                        14:09:03   Log-Likelihood:                -166.00
No. Observations:                  86   AIC:                             336.0
Df Residuals:                      84   BIC:                             340.9
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         -0.2002      0.191     -1.047      0.2

In [17]:
X = donnees[['Mkt-RF', 'SMB', 'HML']]
X = sm.add_constant(X)
model = sm.OLS(y, X).fit()
print(model.summary())

                            OLS Regression Results                            
Dep. Variable:           Portefeuille   R-squared:                       0.792
Model:                            OLS   Adj. R-squared:                  0.784
Method:                 Least Squares   F-statistic:                     104.1
Date:                Wed, 27 Mar 2019   Prob (F-statistic):           7.11e-28
Time:                        14:09:25   Log-Likelihood:                -157.18
No. Observations:                  86   AIC:                             322.4
Df Residuals:                      82   BIC:                             332.2
Df Model:                           3                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         -0.2839      0.176     -1.612      0.1