# Génération de la Frontière Efficiente de Markowitz

Ce notebook illustre l'utilisation de la méthode de scalarisation pour approximer la frontière efficiente d'un portefeuille d'actions.


In [1]:
import matplotlib.pyplot as plt
from scipy.constants import sigma
from scipy.optimize import minimize
import os
import pandas as pd
import cvxpy as cp
import numpy as np

from level1.functions import f_returns_on_df, f_mu_on_df, f_sigma_on_df

# Charger les données
df = pd.read_csv('../datasets/Information_Technology.csv', index_col=0, parse_dates=True)

for file in os.listdir('../datasets/'):
    if file.endswith('.csv') and 'Information_Technology' not in file:
        temp_df = pd.read_csv(os.path.join('../datasets/', file), index_col=0, parse_dates=True)
        df = df.join(temp_df, how='inner')

In [2]:
df

Unnamed: 0_level_0,AAPL,MSFT,NVDA,AVGO,AMD,INTC,QCOM,TXN,MU,ORCL,...,WELL,EQIX,NEE,DUK,SO,D,AEP,EXC,SRE,XEL
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
2015-01-01,,,,,,,,,,,...,,,,,,,,,,
2015-01-02,24.237545,39.858456,0.483038,7.574802,2.670000,27.896452,54.612610,39.557953,33.919167,37.583099,...,50.148026,175.042114,20.032856,53.362503,30.940670,49.050900,41.371311,18.123079,40.092155,25.736317
2015-01-05,23.554739,39.491917,0.474880,7.453717,2.660000,27.581890,54.355274,38.944038,32.972355,37.056019,...,50.767147,173.242676,19.820679,52.594288,30.809048,48.455883,40.762409,17.606934,39.358929,25.444193
2015-01-06,23.556953,38.912292,0.460482,7.284194,2.630000,27.067846,53.583282,38.300499,32.084114,36.673496,...,51.490536,169.466141,19.897663,53.457718,31.178818,48.209023,40.985676,17.471867,38.990528,25.579569
2015-01-07,23.887280,39.406670,0.459282,7.480960,2.580000,27.635595,54.208225,38.988415,31.332521,36.681988,...,51.966248,170.022186,20.079794,53.629158,31.523499,48.405239,41.567505,17.495979,39.620026,25.800449
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2024-12-25,,,,,,,,,,,...,,,,,,,,,,
2024-12-26,257.853760,434.901794,139.899521,243.627975,125.059998,20.440001,155.851318,185.700836,89.446556,169.989212,...,124.210960,927.127563,70.180817,104.529366,80.157600,51.844440,88.959755,36.136345,85.451744,65.988266
2024-12-27,254.439240,427.377319,136.980164,240.043442,125.190002,20.299999,154.583130,185.168137,88.261497,167.296021,...,122.844925,921.526001,69.928688,104.558319,80.447891,52.056801,89.394608,36.117046,85.607788,65.949562
2024-12-30,251.064514,421.719055,137.460052,233.917007,122.440002,19.820000,151.968079,182.049408,85.065674,165.266220,...,122.766312,914.946838,69.589279,103.950310,79.712494,51.998886,88.959755,36.310032,85.198143,65.417229


In [3]:
df.info()

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 2609 entries, 2015-01-01 to 2024-12-31
Columns: 196 entries, AAPL to XEL
dtypes: float64(196)
memory usage: 3.9 MB


In [4]:
# Calcul des rendements logarithmiques
returns = f_returns_on_df(df)

# Calcul des paramètres pour l'optimisation
mu = f_mu_on_df(returns)  # Annualisation (252 jours boursiers)
Sigma = f_sigma_on_df(returns)  # Annualisation de la matrice de covariance
num_assets = len(mu)
mu = mu.values.astype(float)        # shape (196,)
Sigma = Sigma.values.astype(float)  # shape (196,196)

In [5]:
import cvxpy as cp
print(cp.installed_solvers())


['CLARABEL', 'ECOS', 'ECOS_BB', 'OSQP', 'SCIPY', 'SCS']


# Calcul des Paramètres d'Optimisation

Les rendements logarithmiques sont calculés comme :

$  r_t = \ln\left(\frac{P_t}{P_{t-1}}\right) $

Le vecteur des rendements moyens annualisés :

$ \mu = \frac{1}{T} \sum_{t=1}^T r_t \times 252 $

La matrice de covariance annualisée :

$ \Sigma = \frac{1}{T} \sum_{t=1}^T (r_t - \bar{r})(r_t - \bar{r})^T \times 252 $


# Méthode de résolution par scalarisation pour générer la frontière efficiente

Fonction rendement : $ F_1(w) = - (w^T \mu) $

Fonction risque : $ F_2(w) = w^T \Sigma w $

Fonction de cout de transaction : $ C(w) = \sum_{i=1}^{N} c_{prop} \cdot |w_i - w_i^{prev}| $

Fonction objectif scalarisée : $ F(w) = \lambda \cdot (w^T \Sigma w) - (1 - \lambda) \cdot (w^T \mu) $

## Use brute force to find different cardinality portfolios

In [None]:
from level2.cardinality_epsilon import optimize

K = 2                    # nombre d'actifs à sélectionner
epsilons = np.linspace(0.001, 1, 50)  # différents niveaux de risque

frontier_returns, frontier_volatilities, frontier_weights = optimize(mu, Sigma,K, epsilons)

Pas de solution pour epsilon = 0.001


In [None]:
import pickle
with open(f'frontier_data_epsilon.pkl', 'wb') as f:
    pickle.dump((frontier_returns, frontier_volatilities, frontier_weights), f)

In [None]:
plt.figure(figsize=(8,5))
plt.plot(frontier_volatilities, frontier_returns, marker='o')
plt.xlabel('Risque')
plt.ylabel('Rendement')
plt.title(f'Frontière de Pareto approx. K={K} actifs')
plt.grid(True)
plt.show()

# Génération de la Frontière Efficiente

In [None]:
print("Le portefeuille avec le rendement le plus élevé :")
max_return_index = np.argmax(frontier_returns)
print(f"Rendement : {frontier_returns[max_return_index]:.4f}, Volatilité : {frontier_volatilities[max_return_index]:.4f}")
weights = frontier_weights[max_return_index]
weights[weights < 1e-4] = 0  # Nettoyer les poids très faibles pour l'affichage
print(f"Actifs sélectionnés :")
for i, weight in enumerate(weights):
    if weight > 0:
        print(f"  {df.columns[i]} : {weight:.4f}")
#print(f"Poids : {weights}")

print("\nLe portefeuille avec le risque le plus faible :")
min_risk_index = np.argmin(frontier_volatilities)
print(f"Rendement : {frontier_returns[min_risk_index]:.4f}, Volatilité : {frontier_volatilities[min_risk_index]:.4f}")
weights = frontier_weights[min_risk_index]
weights[weights < 1e-4] = 0  # Nettoyer les poids très faibles pour l'affichage
print(f"Actifs sélectionnés :")
for i, weight in enumerate(weights):
    if weight > 0:
        print(f"  {df.columns[i]} : {weight:.4f}")
#print(f"Poids : {weights}")

est ce que on peut pas relaxer une conteainte de cardinalité par une pénalisation L1 ? Si oui sous quelle condition ?
Oui, il est possible de relaxer une contrainte de cardinalité en utilisant une pénalisation L1, mais cela dépend de certaines conditions. La contrainte de cardinalité impose une limite sur le nombre d'actifs non nuls dans un portefeuille, ce qui est une contrainte non convexe et difficile à gérer directement dans les problèmes d'optimisation. En revanche, la pénalisation L1 (ou régularisation Lasso) encourage la sparsité dans les solutions en ajoutant une pénalité proportionnelle à la somme des valeurs absolues des coefficients (poids des actifs dans le portefeuille).