In [None]:
import pandas as pd
import numpy as np
import wrds
from datetime import datetime
import matplotlib.pyplot as plt

# =============================================================================
# Ã‰TAPE 1: CONNEXION WRDS ET PARAMÃˆTRES
# =============================================================================
print("ðŸš€ Ã‰tape 1: Connexion Ã  WRDS et dÃ©finition des paramÃ¨tres...")
db = wrds.Connection()
end_date = '2025-01-30'
trading_days = 1276
start_date_approx = (pd.to_datetime(end_date) - pd.to_timedelta(trading_days * 1.8, unit='d')).strftime('%Y-%m-%d')
num_stocks = 25
print("âœ… Connexion et paramÃ¨tres dÃ©finis.")

# =============================================================================
# Ã‰TAPE 2: SÃ‰LECTION DE L'UNIVERS (TOP 25 S&P 500)
# =============================================================================
print("\nðŸš€ Ã‰tape 2: SÃ©lection de l'univers des 25 plus grosses capitalisations...")
query_last_date = f"SELECT max(date) as last_date FROM crsp.dsf WHERE date <= '{end_date}'"
last_date_df = db.raw_sql(query_last_date, date_cols=['last_date'])
last_trading_day_str = last_date_df['last_date'][0].strftime('%Y-%m-%d')
end_date = last_trading_day_str
query_universe = f"""
    WITH sp500_constituents AS (SELECT permno FROM crsp.msp500list WHERE '{end_date}' BETWEEN start AND ending),
    market_cap AS (
        SELECT a.permno, ABS(a.prc * a.shrout) as mktcap
        FROM crsp.dsf AS a JOIN sp500_constituents AS b ON a.permno = b.permno
        WHERE a.date = '{end_date}' AND a.prc IS NOT NULL AND a.shrout IS NOT NULL
    )
    SELECT permno FROM market_cap ORDER BY mktcap DESC LIMIT {num_stocks}
"""
top_25_permno = db.raw_sql(query_universe)['permno'].tolist()
permno_tuple = tuple(top_25_permno)
print(f"âœ… Univers de {len(top_25_permno)} actions identifiÃ©.")

# =============================================================================
# Ã‰TAPE 3: TÃ‰LÃ‰CHARGEMENT DES DONNÃ‰ES HISTORIQUES
# =============================================================================
print("\nðŸš€ Ã‰tape 3: TÃ©lÃ©chargement des donnÃ©es (avec COMNAM et TICKER)...")
query_data = f"""
    SELECT a.permno, a.date, a.ret, b.dlret, c.comnam, c.ticker
    FROM crsp.dsf AS a
    LEFT JOIN crsp.dsedelist AS b ON a.permno = b.permno AND a.date = b.dlstdt
    LEFT JOIN crsp.msenames AS c ON a.permno = c.permno AND a.date BETWEEN c.namedt AND c.nameendt
    WHERE a.permno IN {permno_tuple} AND a.date BETWEEN '{start_date_approx}' AND '{end_date}'
"""
daily_data = db.raw_sql(query_data, date_cols=['date'])
daily_data['comnam'] = daily_data.groupby('permno')['comnam'].transform(lambda x: x.ffill().bfill())
daily_data['ticker'] = daily_data.groupby('permno')['ticker'].transform(lambda x: x.ffill().bfill())
permno_to_name = daily_data.drop_duplicates('permno').set_index('permno')['comnam'].to_dict()
permno_to_ticker = daily_data.drop_duplicates('permno').set_index('permno')['ticker'].to_dict()
all_dates = sorted(daily_data['date'].unique())
final_dates = all_dates[-trading_days:]
daily_data = daily_data[daily_data['date'].isin(final_dates)]
print("âœ… TÃ©lÃ©chargement terminÃ©.")
db.close()
print("ðŸ”’ Connexion WRDS fermÃ©e.")

# =============================================================================
# Ã‰TAPE 4: NETTOYAGE ET CRÃ‰ATION DE LA MATRICE
# =============================================================================
print("\nðŸš€ Ã‰tape 4: Nettoyage et construction de la matrice finale...")
daily_data['ret'] = pd.to_numeric(daily_data['ret'], errors='coerce').fillna(0)
daily_data['dlret'] = pd.to_numeric(daily_data['dlret'], errors='coerce').fillna(0)
daily_data['effective_ret'] = (1 + daily_data['ret']) * (1 + daily_data['dlret']) - 1
daily_data['price_relative'] = 1 + daily_data['effective_ret']
final_matrix_relatives = daily_data.pivot(index='date', columns='permno', values='price_relative')
final_matrix_relatives.ffill(inplace=True)
final_matrix_relatives.fillna(1.0, inplace=True)
print("âœ… Matrice des relatifs de prix construite !")

# ### PRINT DE DEBUG : AFFICHER L'UNIVERS FINAL ###
print("\n--- Actions dans l'univers du backtest ---")
# On utilise le dictionnaire pour afficher les tickers au lieu des PERMNO
tickers_in_matrix = [permno_to_ticker.get(p, str(p)) for p in final_matrix_relatives.columns]
print(tickers_in_matrix)
print(f"Shape de la matrice : {final_matrix_relatives.shape}")
print("------------------------------------------\n")

# =============================================================================
# FONCTION DE STRATÃ‰GIE ANTICOR(w) - AVEC PRINTS DE DEBUG
# =============================================================================
# =============================================================================
# FONCTION DE STRATÃ‰GIE ANTICOR(w) - VERSION CORRIGÃ‰E AVEC PRINTS DE SYNTHÃˆSE
# =============================================================================

def run_anticor_strategy(price_relatives: pd.DataFrame, w: int, permno_to_ticker: dict, debug_days: int = 3):
    """
    ExÃ©cute la stratÃ©gie ANTICOR(w) avec des prints de debug synthÃ©tiques.
    Cette version corrige l'erreur de calcul de la corrÃ©lation.
    """
    m = price_relatives.shape[1]
    n = len(price_relatives)
    asset_permnos = price_relatives.columns
    
    log_relatives = np.log(price_relatives)
    
    weights_history, daily_returns_history, dates_history = [], [], []
    
    # Le portefeuille est initialisÃ© de maniÃ¨re uniforme pour le PREMIER jour de trading (t=2w)
    b_t = pd.Series(1/m, index=asset_permnos)
    
    # La boucle commence Ã  2*w, qui est le premier jour oÃ¹ l'on peut calculer un rendement.
    for t in range(2 * w, n):
        is_debug_day = t < (2 * w + debug_days)

        if is_debug_day:
            print(f"\n==================== JOUR DE TRADING: {price_relatives.index[t].date()} (t={t}) ====================")
            print(f"Portefeuille utilisÃ© pour AUJOURD'HUI (dÃ©cidÃ© hier, b_t):\n{b_t.rename(permno_to_ticker).sort_values(ascending=False).head().to_string(float_format='{:.2%}'.format)}")
            
        # 1. Calcul du rendement du jour t en utilisant les poids b_t dÃ©cidÃ©s la veille
        daily_return = (b_t * price_relatives.iloc[t]).sum() - 1
        dates_history.append(price_relatives.index[t])
        daily_returns_history.append(daily_return)
        weights_history.append(b_t.to_dict())

        # 2. PrÃ©paration du portefeuille pour le JOUR SUIVANT (t+1) en utilisant les donnÃ©es jusqu'Ã  AUJOURD'HUI (t)
        
        # Le portefeuille est d'abord mis Ã  jour avec les rendements du jour t
        b_t_rebalanced = (b_t * price_relatives.iloc[t]) / (b_t * price_relatives.iloc[t]).sum()
        
        lx1 = log_relatives.iloc[t - 2*w + 1 : t - w + 1]
        lx2 = log_relatives.iloc[t - w + 1 : t + 1]
        mu2 = lx2.mean()
        
        # --- CORRECTION : Retour Ã  la boucle pour le calcul correct de M_cor ---
        m_cor = pd.DataFrame(0.0, index=asset_permnos, columns=asset_permnos)
        for i in asset_permnos:
            for j in asset_permnos:
                lx1_i_std = lx1[i].std()
                lx2_j_std = lx2[j].std()
                if lx1_i_std > 1e-8 and lx2_j_std > 1e-8:
                    m_cor.loc[i, j] = np.corrcoef(lx1[i], lx2[j])[0, 1]
        
        claims = pd.DataFrame(0.0, index=asset_permnos, columns=asset_permnos)
        for i in asset_permnos:
            for j in asset_permnos:
                if i != j and mu2[i] > mu2[j] and m_cor.loc[i, j] > 0:
                    claim_val = m_cor.loc[i, j]
                    if m_cor.loc[i, i] < 0: claim_val -= m_cor.loc[i, i]
                    if m_cor.loc[j, j] < 0: claim_val -= m_cor.loc[j, j]
                    claims.loc[i, j] = claim_val
        
        total_claims_out = claims.sum(axis=1)
        b_tplus1 = b_t_rebalanced.copy()
        
        for i in asset_permnos:
            if total_claims_out[i] > 0:
                for j in asset_permnos:
                    if i != j:
                        transfer_ij = b_t_rebalanced[i] * (claims.loc[i, j] / total_claims_out[i])
                        b_tplus1[i] -= transfer_ij
                        b_tplus1[j] += transfer_ij
        
        b_t_next_day = b_tplus1 / b_tplus1.sum()

        if is_debug_day:
            print("\n--- Analyse pour le rebalancement de DEMAIN ---")
            mu2_sorted = mu2.rename(permno_to_ticker).sort_values(ascending=False)
            print(f"Top 5 Gagnants (Perf. rÃ©cente Ã©levÃ©e):\n{mu2_sorted.head().to_string(float_format='{:.4f}'.format)}")
            print(f"\nTop 5 Perdants (Perf. rÃ©cente faible):\n{mu2_sorted.tail().to_string(float_format='{:.4f}'.format)}")
            
            print("\n--- Top 5 des changements de pondÃ©ration effectuÃ©s ---")
            weight_changes = (b_t_next_day - b_t_rebalanced).rename(permno_to_ticker)
            top_changes = weight_changes.abs().nlargest(5)
            for ticker, change in top_changes.items():
                permno = next(key for key, val in permno_to_ticker.items() if val == ticker)
                old_weight = b_t_rebalanced[permno]
                new_weight = b_t_next_day[permno]
                print(f"  - {ticker:<6}: {old_weight:.2%} -> {new_weight:.2%} (Changement: {change:+.2%})")
            print(f"\nVÃ©rification de la somme des poids pour demain: {b_t_next_day.sum():.6f}")

        # Le portefeuille pour la prochaine itÃ©ration est celui calculÃ© pour t+1
        b_t = b_t_next_day

    results_df = pd.DataFrame(daily_returns_history, index=dates_history, columns=['daily_profit'])
    weights_df = pd.DataFrame(weights_history, index=dates_history)
    weights_df.columns = [f'weight_{permno_to_ticker.get(col, col)}' for col in weights_df.columns]
    
    return pd.concat([results_df, weights_df], axis=1)

# --- ExÃ©cutez le reste de votre code comme avant ---
# La seule chose Ã  changer est l'appel de la fonction pour passer les arguments
print("\nðŸš€ Ã‰tape 5: Lancement du backtest de la stratÃ©gie Anticor(w=30)...")
resultats_strategie = run_anticor_strategy(final_matrix_relatives, w=30, permno_to_ticker=permno_to_ticker, debug_days=3) # debug_days=3 pour analyser les 3 premiers jours
resultats_strategie['profit_cumule'] = (1 + resultats_strategie['daily_profit']).cumprod()
print("\nâœ… Backtest Anticor terminÃ© !")

# ... le reste de votre code pour les benchmarks, graphiques et KPIs reste identique ...
# =============================================================================
# Ã‰TAPE 5: EXÃ‰CUTION DU BACKTEST ANTICOR(w=30)
# =============================================================================
print("\nðŸš€ Ã‰tape 5: Lancement du backtest de la stratÃ©gie Anticor(w=30)...")
resultats_strategie = run_anticor_strategy(final_matrix_relatives, w=30, permno_to_ticker=permno_to_ticker)
resultats_strategie['profit_cumule'] = (1 + resultats_strategie['daily_profit']).cumprod()
print("\nâœ… Backtest Anticor terminÃ© !")

# =============================================================================
# Ã‰TAPE 6: CALCUL DES BENCHMARKS
# =============================================================================
print("\nðŸš€ Ã‰tape 6: Calcul des benchmarks (Meilleur Actif et Portefeuille Ã‰quipondÃ©rÃ©)...")
df_prix_charges = 100 * final_matrix_relatives.cumprod()
df_prix_charges.rename(columns=permno_to_ticker, inplace=True)
best_performing_ticker = df_prix_charges.iloc[-1].idxmax()
start_date_strat = resultats_strategie.index[0]
best_asset_perf = (df_prix_charges[best_performing_ticker].loc[start_date_strat:] / df_prix_charges[best_performing_ticker].loc[start_date_strat])
ewp_daily_returns = final_matrix_relatives.mean(axis=1) - 1
ewp_perf = (1 + ewp_daily_returns.loc[start_date_strat:]).cumprod()
print(f"âœ… Benchmarks calculÃ©s. Meilleur actif : {best_performing_ticker}")

# =============================================================================
# Ã‰TAPE 7: VISUALISATION ET KPIS
# =============================================================================
print("\nðŸ“Š Ã‰tape 7: GÃ©nÃ©ration du graphique et des indicateurs de performance...")
fig, ax = plt.subplots(figsize=(16, 8))
resultats_strategie['profit_cumule'].plot(ax=ax, label='StratÃ©gie Anticor (w=30)', lw=2.5, color='blue')
best_asset_perf.plot(ax=ax, label=f'Meilleur Actif (B&H): {best_performing_ticker}', linestyle='--', color='green')
ewp_perf.plot(ax=ax, label='Portefeuille Ã‰quipondÃ©rÃ© (EWP)', linestyle=':', color='red')
ax.set_title('Comparaison de Performance : Anticor vs. Benchmarks')
ax.set_ylabel('Performance Cumulative (Ã‰chelle Log)')
ax.set_xlabel('Date')
ax.set_yscale('log')
ax.legend(loc='upper left')
ax.grid(True, which='both', linestyle='--', linewidth=0.5)
plt.tight_layout()
plt.show()

# --- Calcul et affichage des KPIs ---
def calculate_performance_metrics(daily_returns_series, risk_free_rate=0.0):
    trading_days_per_year = 252
    cumulative_return = (1 + daily_returns_series).prod() - 1
    num_days = len(daily_returns_series)
    annualized_return = (1 + cumulative_return) ** (trading_days_per_year / num_days) - 1
    annualized_volatility = daily_returns_series.std() * np.sqrt(trading_days_per_year)
    sharpe_ratio = (annualized_return - risk_free_rate) / annualized_volatility if annualized_volatility > 0 else 0
    cumulative_series = (1 + daily_returns_series).cumprod()
    peak = cumulative_series.expanding(min_periods=1).max()
    drawdown = (cumulative_series - peak) / peak
    max_drawdown = drawdown.min()
    calmar_ratio = annualized_return / abs(max_drawdown) if max_drawdown < 0 else 0
    return {
        "Rendement CumulÃ©": cumulative_return, "Rendement AnnualisÃ©": annualized_return,
        "VolatilitÃ© AnnualisÃ©e": annualized_volatility, "Ratio de Sharpe": sharpe_ratio,
        "Max Drawdown": max_drawdown, "Ratio de Calmar": calmar_ratio
    }

metrics = {}
metrics['Anticor (w=30)'] = calculate_performance_metrics(resultats_strategie['daily_profit'])
metrics['EWP'] = calculate_performance_metrics(ewp_daily_returns.loc[start_date_strat:])
metrics[f'Meilleur Actif ({best_performing_ticker})'] = calculate_performance_metrics(best_asset_perf.pct_change().dropna())
results_table = pd.DataFrame(metrics).T
display(results_table.style.format({
    "Rendement CumulÃ©": "{:.2%}", "Rendement AnnualisÃ©": "{:.2%}",
    "VolatilitÃ© AnnualisÃ©e": "{:.2%}", "Ratio de Sharpe": "{:.2f}",
    "Max Drawdown": "{:.2%}", "Ratio de Calmar": "{:.2f}"
}))

ðŸš€ Ã‰tape 1: Connexion Ã  WRDS et dÃ©finition des paramÃ¨tres...


KeyboardInterrupt: Interrupted by user

In [None]:
# =============================================================================
# FONCTION POUR LA STRATÃ‰GIE LISSÃ‰E ANTIÂ¹ (BAH(ANTICOR))
# =============================================================================

def run_anti1_strategy(price_relatives: pd.DataFrame, max_W: int, permno_to_ticker: dict):
    """
    ExÃ©cute la stratÃ©gie lissÃ©e ANTIÂ¹ (BAH(ANTICOR)).
    Elle fait la moyenne des portefeuilles de ANTICOR(w) pour w allant de 2 Ã  max_W.
    """
    print(f"ðŸš€ Lancement du backtest pour ANTIÂ¹ avec W_max={max_W}...")
    
    n = len(price_relatives)
    m = price_relatives.shape[1]
    asset_names = price_relatives.columns
    
    # Dictionnaire pour stocker les backtests de chaque "expert" ANTICOR(w)
    expert_portfolios = {}
    
    # ExÃ©cuter un backtest pour chaque w et stocker les poids quotidiens
    for w in range(2, max_W + 1):
        print(f"  - Calcul de l'expert ANTICOR(w={w})...")
        # ExÃ©cuter la stratÃ©gie pour un w donnÃ©
        temp_results = run_anticor_strategy(price_relatives, w, permno_to_ticker)
        # Extraire uniquement les poids
        expert_portfolios[w] = temp_results.filter(like='weight_')

    # Aligner tous les dataframes de poids sur un index commun (l'index complet)
    # et trouver la date de dÃ©but commune (aprÃ¨s la plus longue pÃ©riode de chauffe)
    start_date = price_relatives.index[2 * max_W]
    
    # CrÃ©er un panel de poids (Jours x Experts x Actifs)
    weights_panel = pd.Panel({w: df.loc[start_date:] for w, df in expert_portfolios.items() if not df.loc[start_date:].empty})
    
    # Calculer le portefeuille moyen chaque jour
    mean_weights_df = weights_panel.mean(axis=0)
    
    # Calculer les rendements quotidiens de la stratÃ©gie ANTIÂ¹
    anti1_daily_returns = (mean_weights_df * (price_relatives.rename(columns=permno_to_ticker).loc[start_date:] - 1)).sum(axis=1)
    
    # CrÃ©er le DataFrame de rÃ©sultats final
    results_df = pd.DataFrame(anti1_daily_returns, columns=['daily_profit'])
    results_df['profit_cumule'] = (1 + results_df['daily_profit']).cumprod()
    
    print("âœ… Backtest ANTIÂ¹ terminÃ© !")
    return results_df


resultats_anti1 = run_anti1_strategy(final_matrix_relatives, max_W=30, permno_to_ticker=permno_to_ticker)


resultats_anti1['profit_cumule'].plot(ax=ax, label='StratÃ©gie ANTIÂ¹ (lissÃ©e)', lw=2.5, color='purple')
ax.legend()
plt.show()

ðŸš€ Lancement du backtest pour ANTIÂ¹ avec W_max=30...
  - Calcul de l'expert ANTICOR(w=2)...

Portefeuille initial pour aujourd'hui (b_t):
permno
10104    0.0400
10107    0.0400
11850    0.0400
13407    0.0400
14542    0.0400
14593    0.0400
18163    0.0400
22111    0.0400
47896    0.0400
50876    0.0400
55976    0.0400
59408    0.0400
66181    0.0400
83443    0.0400
84788    0.0400
86580    0.0400
87055    0.0400
89393    0.0400
90215    0.0400
90319    0.0400
91233    0.0400
92611    0.0400
92655    0.0400
93002    0.0400
93436    0.0400
dtype: object

--- Analyse des transferts potentiels (Claims) ---
  - Transfert envisagÃ©: ORCL -> MSFT
    - Perf. rÃ©cente (Î¼â‚‚): ORCL=0.0090 > MSFT=0.0011 (OK)
    - Corr. croisÃ©e M_cor(i,j): 1.0000 (OK > 0)
    - Auto-corr. ORCL (M_cor(i,i)): -1.0000 -> Bonus: 1.0000
    - Auto-corr. MSFT (M_cor(j,j)): -1.0000 -> Bonus: 1.0000
    - Claim final: 3.0000
  - Transfert envisagÃ©: ORCL -> XOM
    - Perf. rÃ©cente (Î¼â‚‚): ORCL=0.0090 > XOM=-0.00