# Skfolio : Optimisation de Portefeuille Crypto

In [None]:
%pip install -q skfolio ccxt pandas numpy matplotlib scikit-learn

In [None]:
import numpy as np
import pandas as pd
import ccxt
import time
from pathlib import Path
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

from skfolio.optimization import (
    HierarchicalRiskParity,
    MeanRisk
)
from skfolio import RiskMeasure
from skfolio.model_selection import (
    WalkForward,
    CombinatorialPurgedCV,
    cross_val_predict
)

# T√©l√©chargement des Donn√©es Crypto

In [None]:
def get_crypto_data(tickers, start_date='2020-01-01', end_date='2023-12-31'):
    """
    T√©l√©charge les donn√©es crypto depuis Binance.
    
    Args:
        tickers: Liste de symboles comme ['BTC/USDT', 'ETH/USDT', 'SOL/USDT']
        start_date: Date de d√©but au format 'YYYY-MM-DD'
        end_date: Date de fin au format 'YYYY-MM-DD'
    
    Returns:
        DataFrame avec les rendements journaliers (pct_change)
    """
    print(f"üì• T√©l√©chargement depuis Binance {start_date} ‚Üí {end_date}...")
    
    exchange = ccxt.binance({
        'enableRateLimit': True,
        'options': {'defaultType': 'spot'}
    })
    
    start_ts = int(datetime.strptime(start_date, '%Y-%m-%d').timestamp() * 1000)
    end_ts = int(datetime.strptime(end_date, '%Y-%m-%d').timestamp() * 1000)
    
    all_prices = {}
    
    for ticker in tickers:
        print(f"  T√©l√©chargement {ticker}...")
        
        all_candles = []
        current_ts = start_ts
        
        while current_ts < end_ts:
            try:
                candles = exchange.fetch_ohlcv(
                    ticker, 
                    timeframe='1d',
                    since=current_ts,
                    limit=1000
                )
                
                if not candles:
                    break
                
                all_candles.extend(candles)
                current_ts = candles[-1][0] + 86400000 
                
                time.sleep(0.1)
                
            except Exception as e:
                print(f"    ‚ö†Ô∏è Erreur : {e}")
                break
        
        df = pd.DataFrame(all_candles, columns=['timestamp', 'open', 'high', 'low', 'close', 'volume'])
        df['datetime'] = pd.to_datetime(df['timestamp'], unit='ms')
        df = df.set_index('datetime').sort_index()
        
        symbol = ticker.split('/')[0]
        all_prices[symbol] = df['close']
    
    prices = pd.DataFrame(all_prices)
    
    # Filtrer strictement sur les dates demand√©es
    prices = prices[(prices.index >= start_date) & (prices.index <= end_date)]
    
    returns = prices.pct_change().dropna()
    
    print(f"‚úÖ {len(returns)} jours t√©l√©charg√©s")
    
    return returns

In [None]:
tickers = ['BTC/USDT', 'ETH/USDT', 'SOL/USDT']
# Besoin de 6 mois avant 2023 pour le train initial ‚Üí juillet 2022
returns = get_crypto_data(tickers, start_date='2022-07-01', end_date='2024-12-31')

print(f"\nüìä P√©riode totale: {returns.index[0].date()} ‚Üí {returns.index[-1].date()}")
print(f"üìä Total: {len(returns)} jours")
print(f"üìä Cryptos: BTC, ETH, SOL")
returns.head()

# Section 1: Optimisation na√Øve (poids fig√©s)

On va optimiser un portefeuille HRP sur **2021 (bull market)**, puis appliquer ces m√™mes poids fig√©s sur **2022 (bear market)**.

C'est l'erreur classique : optimiser sur l'historique disponible, puis garder ces poids comme s'ils √©taient grav√©s dans le marbre.

In [None]:
# √âtape 1: Optimiser sur 2023
train_2023 = returns[returns.index.year == 2023]

portfolio_naive = HierarchicalRiskParity(
    portfolio_params={'compounded': True}
)
portfolio_naive.fit(train_2023)

# Afficher les poids optimis√©s
weights = portfolio_naive.weights_
print("="*60)
print("OPTIMISATION SUR 2023")
print("="*60)
print(f"\nüí∞ Poids optimis√©s sur 2023 :")
print(f"   BTC : {weights[0]:.1%}")
print(f"   ETH : {weights[1]:.1%}")
print(f"   SOL : {weights[2]:.1%}")

# Performance sur 2023
pred_train = portfolio_naive.predict(train_2023)
print(f"\nüìà Performance sur 2023 (p√©riode d'optimisation) :")
print(f"   Rendement annualis√© : {pred_train.annualized_mean:.1%}")
print(f"   Max drawdown        : {pred_train.max_drawdown:.1%}")

## Maintenant, on garde les M√äMES poids et on les applique sur 2024

In [None]:
# √âtape 2: Appliquer les poids fig√©s de 2023 sur 2024
test_2024 = returns[returns.index.year == 2024]

# On utilise le M√äME portfolio avec les poids calcul√©s sur 2023
pred_test = portfolio_naive.predict(test_2024)

print("="*60)
print("TEST SUR 2024 - AVEC POIDS FIG√âS DE 2023")
print("="*60)
print(f"\nüí∞ Rappel des poids (calcul√©s sur 2023, appliqu√©s sur 2024) :")
print(f"   BTC : {weights[0]:.1%}")
print(f"   ETH : {weights[1]:.1%}")
print(f"   SOL : {weights[2]:.1%}")

print(f"\nüìâ Performance sur 2024 (na√Øf) :")
print(f"   Rendement annualis√© : {pred_test.annualized_mean:.1%}")
print(f"   Max drawdown        : {pred_test.max_drawdown:.1%}")

print(f"\nüìä Comparaison 2023 vs 2024 :")
print(f"   Rendement 2023 : +{pred_train.annualized_mean:.1%}")
print(f"   Rendement 2024 : {pred_test.annualized_mean:.1%}")
print(f"   D√©gradation    : {pred_train.annualized_mean - pred_test.annualized_mean:.1%}")

# Section 2: Walk Forward (r√©ajustement mensuel)

Au lieu de figer les poids, on les **r√©ajuste tous les mois** avec Walk Forward.

**P√©riode test√©e:** 2023-2024 (2 ans complets)

Fen√™tres glissantes : **6 mois d'entra√Ænement, 1 mois de test**

Les poids s'adaptent progressivement aux changements de march√©.

In [None]:
returns_wf = returns

cv_wf = WalkForward(train_size=180, test_size=30, freq='D')

portfolio_wf = HierarchicalRiskParity()
pred_wf = cross_val_predict(portfolio_wf, X=returns_wf, cv=cv_wf,
                            portfolio_params={'compounded': True})

print("="*60)
print("WALK FORWARD : R√©ajustement mensuel (2023-2024)")
print("="*60)
print(f"   Fen√™tre train : 180 jours (~6 mois)")
print(f"   Fen√™tre test  : 30 jours (~1 mois)")
print(f"   P√©riodes      : {len(pred_wf.portfolios)}")

print(f"\nüìâ Performance globale Walk Forward (out-of-sample) :")
print(f"   Rendement annualis√© : {pred_wf.annualized_mean:.1%}")
print(f"   Max drawdown        : {pred_wf.max_drawdown:.1%}")

print(f"\n‚úÖ COMPARAISON COMPL√àTE Na√Øf vs Walk Forward :")
print(f"\n   RENDEMENTS:")
print(f"      Na√Øf 2024           : {pred_test.annualized_mean:.1%}")
print(f"      Walk Forward 2023-24: {pred_wf.annualized_mean:.1%}")
print(f"      Diff√©rence          : {pred_wf.annualized_mean - pred_test.annualized_mean:.1%}")
print(f"\n   DRAWDOWNS:")
print(f"      Na√Øf 2024           : {pred_test.max_drawdown:.1%}")
print(f"      Walk Forward 2023-24: {pred_wf.max_drawdown:.1%}")
print(f"      Protection          : {pred_test.max_drawdown - pred_wf.max_drawdown:.1%}")

# Section 3: CombinatorialPurgedCV - Mesurer la robustesse

**Probl√®me avec Walk Forward:** On obtient UN seul r√©sultat. Si on a eu de la chance (ou malchance) sur le timing, √ßa biaise la conclusion.

**Solution:** Tester plusieurs sc√©narios diff√©rents de p√©riodes train/test pour obtenir une **distribution** de r√©sultats au lieu d'un seul chiffre.

**Interpr√©tation:**
- Si tous les sc√©narios donnent des r√©sultats similaires ‚Üí Strat√©gie robuste
- Si les r√©sultats varient √©norm√©ment (√©cart >20%) ‚Üí Strat√©gie fragile, d√©pend du timing

In [None]:
# CombinatorialPurgedCV avec purging et embargoing
cv_comb = CombinatorialPurgedCV(
    n_folds=10,
    n_test_folds=2,
    purged_size=5,   # Purge de 5 jours
    embargo_size=2  # Embargo de 2 jours
)

# G√©n√©ration de la population de portefeuilles
portfolio_comb = HierarchicalRiskParity()
population = cross_val_predict(portfolio_comb, X=returns, cv=cv_comb,
                               portfolio_params={'compounded': True})

# Extraction des statistiques
perf_list = [p.annualized_mean for p in population]
dd_list = [p.max_drawdown for p in population]

print("="*60)
print("COMBINATORIALPURGEDCV - Test de robustesse")
print("="*60)
print(f"\nüé≤ Nombre de sc√©narios test√©s : {len(perf_list)}")
print(f"   (diff√©rentes combinaisons de p√©riodes train/test)")

print(f"\nüìä RENDEMENT ANNUALIS√â :")
print(f"   R√©sultat typique (m√©diane) : {np.median(perf_list):.1%}")
print(f"   Pire cas                   : {np.min(perf_list):.1%}")
print(f"   Meilleur cas               : {np.max(perf_list):.1%}")
print(f"   √âcart (max - min)          : {np.max(perf_list) - np.min(perf_list):.1%}")

print(f"\nüìä MAX DRAWDOWN :")
print(f"   Drawdown typique (m√©diane) : {np.median(dd_list):.1%}")
print(f"   Pire cas                   : {np.max(dd_list):.1%}")
print(f"   Meilleur cas               : {np.min(dd_list):.1%}")
print(f"   √âcart (max - min)          : {np.max(dd_list) - np.min(dd_list):.1%}")

print(f"\nüí° CONCLUSION :")
ecart_rendement = np.max(perf_list) - np.min(perf_list)
if ecart_rendement < 10:
    print(f"   ‚úÖ Strat√©gie ROBUSTE (√©cart de {ecart_rendement:.1%} seulement)")
elif ecart_rendement < 20:
    print(f"   ‚ö†Ô∏è  Strat√©gie MOD√âR√âMENT robuste (√©cart de {ecart_rendement:.1%})")
else:
    print(f"   ‚ùå Strat√©gie FRAGILE (√©cart de {ecart_rendement:.1%}, d√©pend du timing)")