# üöÄ Projet Final : Analyse Statistique Compl√®te de Donn√©es Financi√®res

## üéØ Objectif du Projet

R√©aliser une **analyse statistique professionnelle** compl√®te sur des donn√©es financi√®res r√©elles, en appliquant tous les concepts appris dans ce chapitre.

## üìã Cahier des Charges

Vous allez analyser les rendements de **5 actions** sur une p√©riode de **2 ans** (‚âà500 jours de trading).

### Votre mission :

1. **üìä Analyse Descriptive Compl√®te**
   - Statistiques de base (moyenne, m√©diane, √©cart-type)
   - Distribution des rendements
   - D√©tection d'anomalies

2. **üìà Visualisations Professionnelles**
   - Dashboard statistique multi-panels
   - Heatmap de corr√©lations
   - S√©ries temporelles

3. **üß™ Tests Statistiques**
   - Test de normalit√©
   - Test de moyenne (rendement > 0?)
   - Comparaison de performances

4. **üìè Intervalles de Confiance**
   - IC pour rendements moyens
   - IC pour volatilit√©

5. **üìà Mod√®le CAPM (R√©gression)**
   - Calcul des Œ≤ (betas)
   - Calcul des Œ± (alphas)
   - Validation du mod√®le

6. **üìë Rapport Final**
   - Synth√®se des r√©sultats
   - Recommandations d'investissement

---

## üíº Contexte Professionnel

Vous √™tes **Data Analyst** dans un fonds d'investissement. Votre manager vous demande d'analyser 5 actions pour d√©terminer lesquelles inclure dans un nouveau portefeuille.

In [None]:
# Imports
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from scipy.stats import norm, t, chi2
import statsmodels.api as sm
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

# Configuration
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")
%matplotlib inline

print("‚úÖ Environnement configur√©")

---

## üìä √âtape 1 : G√©n√©ration et Chargement des Donn√©es

### 1.1 Cr√©ation d'un Dataset R√©aliste

Nous allons cr√©er des donn√©es synth√©tiques mais r√©alistes pour 5 actions :

- **TECH_A** : Action technologique volatile (Œ≤=1.3)
- **FINANCE_B** : Action financi√®re stable (Œ≤=1.0)
- **HEALTH_C** : Action sant√© d√©fensive (Œ≤=0.7)
- **ENERGY_D** : Action √©nerg√©tique cyclique (Œ≤=1.5)
- **CONSUMER_E** : Action consommation (Œ≤=0.9)

In [None]:
# Param√®tres de simulation
np.random.seed(42)
n_jours = 504  # ~2 ans de trading (252 jours/an)

# G√©n√©ration du march√© (indice de r√©f√©rence)
rendements_marche = np.random.normal(0.0008, 0.012, n_jours)  # 0.08% par jour, œÉ=1.2%

# G√©n√©ration des actions selon le mod√®le CAPM : R = Œ± + Œ≤*R_march√© + Œµ
actions = {
    'TECH_A': {
        'alpha': 0.0003,  # +0.03% alpha par jour
        'beta': 1.3,
        'epsilon_std': 0.008
    },
    'FINANCE_B': {
        'alpha': 0.0001,
        'beta': 1.0,
        'epsilon_std': 0.006
    },
    'HEALTH_C': {
        'alpha': 0.0002,
        'beta': 0.7,
        'epsilon_std': 0.005
    },
    'ENERGY_D': {
        'alpha': -0.0001,  # Alpha n√©gatif (sous-performance)
        'beta': 1.5,
        'epsilon_std': 0.015
    },
    'CONSUMER_E': {
        'alpha': 0.0002,
        'beta': 0.9,
        'epsilon_std': 0.007
    }
}

# G√©n√©ration des rendements
data = {'Date': pd.date_range(start='2022-01-01', periods=n_jours, freq='B')}  # B = Business days
data['MARKET'] = rendements_marche

for nom, params in actions.items():
    epsilon = np.random.normal(0, params['epsilon_std'], n_jours)
    rendements = params['alpha'] + params['beta'] * rendements_marche + epsilon
    data[nom] = rendements

# Cr√©ation du DataFrame
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

print("üìä Dataset Cr√©√©")
print("="*60)
print(f"P√©riode : {df.index[0].date()} √† {df.index[-1].date()}")
print(f"Nombre de jours : {len(df)}")
print(f"Actions analys√©es : {', '.join([col for col in df.columns if col != 'MARKET'])}")
print("\nAper√ßu des donn√©es :")
print(df.head(10))

### 1.2 V√©rification de la Qualit√© des Donn√©es

In [None]:
# V√©rification des valeurs manquantes
print("üîç Contr√¥le Qualit√© des Donn√©es")
print("="*60)
print("\nValeurs manquantes :")
print(df.isnull().sum())

print("\nStatistiques de base :")
print(df.describe())

# V√©rification d'outliers extr√™mes
print("\n‚ö†Ô∏è D√©tection de rendements extr√™mes (>5% ou <-5%) :")
for col in df.columns:
    extreme = df[(df[col] > 0.05) | (df[col] < -0.05)][col]
    if len(extreme) > 0:
        print(f"   {col}: {len(extreme)} jours avec rendements extr√™mes")
    else:
        print(f"   {col}: Aucun rendement extr√™me d√©tect√© ‚úì")

---

## üìä √âtape 2 : Analyse Descriptive Compl√®te

### 2.1 Statistiques Descriptives par Action

In [None]:
# Calcul des statistiques pour chaque action
stats_df = pd.DataFrame()

actions_list = [col for col in df.columns if col != 'MARKET']

for action in actions_list:
    stats_df[action] = [
        df[action].mean(),                          # Moyenne quotidienne
        df[action].mean() * 252,                    # Rendement annualis√©
        df[action].median(),                        # M√©diane
        df[action].std(),                           # Volatilit√© quotidienne
        df[action].std() * np.sqrt(252),            # Volatilit√© annualis√©e
        stats.skew(df[action]),                     # Asym√©trie
        stats.kurtosis(df[action]),                 # Aplatissement
        df[action].min(),                           # Rendement minimum
        df[action].max(),                           # Rendement maximum
        df[action].quantile(0.05),                  # VaR 5%
        df[action].quantile(0.95)                   # Percentile 95%
    ]

stats_df.index = ['Moyenne quotidienne', 'Rendement annualis√©', 'M√©diane', 
                  'Volatilit√© quotidienne', 'Volatilit√© annualis√©e',
                  'Skewness', 'Kurtosis (exc√®s)', 'Min', 'Max', 'VaR 5%', 'Percentile 95%']

print("üìä STATISTIQUES DESCRIPTIVES COMPL√àTES")
print("="*80)
print(stats_df.to_string())

# Calcul du Sharpe Ratio (simplifi√©, sans taux sans risque)
print("\nüíé Ratio de Sharpe (simplifi√©, Rf=0) :")
print("="*60)
for action in actions_list:
    sharpe = (df[action].mean() * 252) / (df[action].std() * np.sqrt(252))
    print(f"   {action:12s} : {sharpe:.3f}")

### 2.2 Analyse de la Distribution des Rendements

In [None]:
# Cr√©ation d'un dashboard de distributions
fig, axes = plt.subplots(2, 3, figsize=(18, 10))
axes = axes.flatten()

for idx, action in enumerate(actions_list):
    data = df[action]
    mean = data.mean()
    std = data.std()
    
    # Histogramme
    axes[idx].hist(data, bins=40, density=True, alpha=0.7, 
                   color='skyblue', edgecolor='black')
    
    # Courbe normale
    x = np.linspace(data.min(), data.max(), 100)
    axes[idx].plot(x, norm.pdf(x, mean, std), 'r-', linewidth=2, label='Normale')
    
    # Moyenne
    axes[idx].axvline(mean, color='green', linestyle='--', linewidth=1.5, 
                      label=f'Œº={mean:.4%}')
    
    axes[idx].set_title(f'{action}\nSkew={stats.skew(data):.2f}, Kurt={stats.kurtosis(data):.2f}',
                        fontweight='bold')
    axes[idx].set_xlabel('Rendement quotidien')
    axes[idx].set_ylabel('Densit√©')
    axes[idx].legend(fontsize=8)
    axes[idx].grid(True, alpha=0.3)

# Supprimer le dernier subplot vide
fig.delaxes(axes[5])

plt.suptitle('üìä Distribution des Rendements par Action', 
             fontsize=16, fontweight='bold', y=1.00)
plt.tight_layout()
plt.show()

---

## üìà √âtape 3 : Visualisations Professionnelles

### 3.1 Dashboard Multi-Panel

In [None]:
# Cr√©ation d'un dashboard professionnel 2x2
fig = plt.figure(figsize=(16, 12))
gs = fig.add_gridspec(3, 2, hspace=0.3, wspace=0.3)

# 1. S√©ries temporelles des rendements cumul√©s
ax1 = fig.add_subplot(gs[0, :])
rendements_cumules = (1 + df[actions_list]).cumprod()
for action in actions_list:
    ax1.plot(rendements_cumules.index, rendements_cumules[action], 
             linewidth=2, label=action, alpha=0.8)
ax1.set_title('üìà Performance Cumul√©e (Base 100)', fontsize=14, fontweight='bold')
ax1.set_xlabel('Date')
ax1.set_ylabel('Valeur du portefeuille')
ax1.legend(loc='best')
ax1.grid(True, alpha=0.3)
ax1.axhline(1, color='black', linestyle='--', linewidth=1, alpha=0.5)

# 2. Boxplots comparatifs
ax2 = fig.add_subplot(gs[1, 0])
df[actions_list].boxplot(ax=ax2, patch_artist=True)
ax2.set_title('üì¶ Distribution Comparative (Boxplots)', fontsize=14, fontweight='bold')
ax2.set_ylabel('Rendement quotidien')
ax2.grid(True, alpha=0.3, axis='y')
ax2.axhline(0, color='red', linestyle='--', linewidth=1, alpha=0.5)

# 3. Heatmap de corr√©lation
ax3 = fig.add_subplot(gs[1, 1])
corr_matrix = df[actions_list].corr()
sns.heatmap(corr_matrix, annot=True, fmt='.2f', cmap='coolwarm', 
            center=0, vmin=-1, vmax=1, ax=ax3, cbar_kws={'label': 'Corr√©lation'})
ax3.set_title('üî• Matrice de Corr√©lation', fontsize=14, fontweight='bold')

# 4. Rendement vs Risque (Scatter)
ax4 = fig.add_subplot(gs[2, 0])
for action in actions_list:
    rend_annuel = df[action].mean() * 252
    vol_annuelle = df[action].std() * np.sqrt(252)
    ax4.scatter(vol_annuelle, rend_annuel, s=200, alpha=0.7, label=action)
    ax4.annotate(action, (vol_annuelle, rend_annuel), 
                fontsize=10, ha='center', va='bottom')
ax4.set_xlabel('Volatilit√© Annualis√©e (Risque)', fontsize=11)
ax4.set_ylabel('Rendement Annualis√©', fontsize=11)
ax4.set_title('üíé Rendement vs Risque', fontsize=14, fontweight='bold')
ax4.grid(True, alpha=0.3)
ax4.axhline(0, color='gray', linestyle='--', linewidth=1, alpha=0.5)

# 5. Histogramme des rendements quotidiens du march√©
ax5 = fig.add_subplot(gs[2, 1])
ax5.hist(df['MARKET'], bins=40, density=True, alpha=0.7, 
         color='gray', edgecolor='black', label='March√©')
x = np.linspace(df['MARKET'].min(), df['MARKET'].max(), 100)
ax5.plot(x, norm.pdf(x, df['MARKET'].mean(), df['MARKET'].std()), 
         'r-', linewidth=2, label='Normale')
ax5.axvline(df['MARKET'].mean(), color='green', linestyle='--', linewidth=2)
ax5.set_title('üìä Distribution du March√©', fontsize=14, fontweight='bold')
ax5.set_xlabel('Rendement quotidien')
ax5.set_ylabel('Densit√©')
ax5.legend()
ax5.grid(True, alpha=0.3)

plt.suptitle('üöÄ DASHBOARD ANALYTIQUE COMPLET', 
             fontsize=18, fontweight='bold', y=0.995)
plt.show()

---

## üß™ √âtape 4 : Tests Statistiques

### 4.1 Tests de Normalit√©

In [None]:
print("üß™ TESTS DE NORMALIT√â")
print("="*80)
print("\nH‚ÇÄ : Les rendements suivent une distribution normale")
print("H‚ÇÅ : Les rendements ne suivent PAS une distribution normale\n")

results_normalite = []

for action in actions_list:
    # Test de Shapiro-Wilk
    shapiro_stat, shapiro_p = stats.shapiro(df[action])
    
    # Test de Kolmogorov-Smirnov
    ks_stat, ks_p = stats.kstest(df[action], 'norm', 
                                  args=(df[action].mean(), df[action].std()))
    
    results_normalite.append({
        'Action': action,
        'Shapiro p-value': shapiro_p,
        'Shapiro d√©cision': 'Rejeter H‚ÇÄ' if shapiro_p < 0.05 else 'Ne pas rejeter H‚ÇÄ',
        'KS p-value': ks_p,
        'KS d√©cision': 'Rejeter H‚ÇÄ' if ks_p < 0.05 else 'Ne pas rejeter H‚ÇÄ'
    })

df_normalite = pd.DataFrame(results_normalite)
print(df_normalite.to_string(index=False))

print("\nüí° Interpr√©tation :")
print("   Si p-value < 0.05 ‚Üí Rejeter H‚ÇÄ (distribution NON normale)")
print("   Si p-value ‚â• 0.05 ‚Üí Ne pas rejeter H‚ÇÄ (distribution potentiellement normale)")

### 4.2 Tests de Rendement Moyen > 0

In [None]:
print("\nüß™ TESTS : RENDEMENT MOYEN SIGNIFICATIVEMENT > 0 ?")
print("="*80)
print("H‚ÇÄ : Œº = 0 (pas de rendement positif)")
print("H‚ÇÅ : Œº > 0 (rendement positif significatif)\n")

results_ttest = []

for action in actions_list:
    # T-test √† un √©chantillon (test unilat√©ral)
    t_stat, p_value_bilateral = stats.ttest_1samp(df[action], 0)
    p_value_unilateral = p_value_bilateral / 2 if t_stat > 0 else 1 - p_value_bilateral / 2
    
    rend_moyen = df[action].mean()
    rend_annuel = rend_moyen * 252
    
    results_ttest.append({
        'Action': action,
        'Rendement moyen': f"{rend_moyen:.6f}",
        'Rendement annuel': f"{rend_annuel:.4%}",
        'T-statistic': f"{t_stat:.4f}",
        'P-value': f"{p_value_unilateral:.6f}",
        'D√©cision (Œ±=0.05)': '‚úÖ Rendement > 0' if p_value_unilateral < 0.05 else '‚ùå Pas significatif'
    })

df_ttest = pd.DataFrame(results_ttest)
print(df_ttest.to_string(index=False))

### 4.3 Comparaison des Performances (ANOVA)

In [None]:
print("\nüß™ TEST ANOVA : Les actions ont-elles des rendements moyens diff√©rents ?")
print("="*80)
print("H‚ÇÄ : Toutes les actions ont le m√™me rendement moyen")
print("H‚ÇÅ : Au moins une action a un rendement moyen diff√©rent\n")

# ANOVA √† un facteur
f_stat, p_value = stats.f_oneway(*[df[action] for action in actions_list])

print(f"F-statistic : {f_stat:.4f}")
print(f"P-value     : {p_value:.6f}")
print(f"\nD√©cision (Œ±=0.05) : {'Rejeter H‚ÇÄ' if p_value < 0.05 else 'Ne pas rejeter H‚ÇÄ'}")

if p_value < 0.05:
    print("\n‚úÖ Il existe des diff√©rences significatives de performance entre les actions")
else:
    print("\n‚ùå Pas de diff√©rence significative d√©tect√©e entre les actions")

---

## üìè √âtape 5 : Intervalles de Confiance

### 5.1 IC pour les Rendements Moyens

In [None]:
print("üìè INTERVALLES DE CONFIANCE √Ä 95% POUR RENDEMENTS ANNUALIS√âS")
print("="*80)

results_ic = []

for action in actions_list:
    n = len(df[action])
    mean = df[action].mean()
    std_err = stats.sem(df[action])  # Erreur standard
    
    # IC avec distribution t
    ci = stats.t.interval(0.95, n-1, loc=mean, scale=std_err)
    
    # Annualisation
    ci_annuel = (ci[0] * 252, ci[1] * 252)
    mean_annuel = mean * 252
    largeur_ic = ci_annuel[1] - ci_annuel[0]
    
    results_ic.append({
        'Action': action,
        'Rendement annuel': f"{mean_annuel:.2%}",
        'IC 95% - Borne inf': f"{ci_annuel[0]:.2%}",
        'IC 95% - Borne sup': f"{ci_annuel[1]:.2%}",
        'Largeur IC': f"{largeur_ic:.2%}"
    })

df_ic = pd.DataFrame(results_ic)
print(df_ic.to_string(index=False))

print("\nüí° Interpr√©tation :")
print("   Nous sommes confiants √† 95% que le vrai rendement annuel se trouve dans cet intervalle")

### 5.2 Visualisation des Intervalles de Confiance

In [None]:
# Graphique des IC
fig, ax = plt.subplots(figsize=(12, 6))

positions = np.arange(len(actions_list))

for idx, action in enumerate(actions_list):
    n = len(df[action])
    mean = df[action].mean() * 252
    std_err = stats.sem(df[action]) * 252
    ci = stats.t.interval(0.95, n-1, loc=mean, scale=std_err)
    
    # Point estimate
    ax.plot(idx, mean, 'o', markersize=10, label=action)
    
    # Intervalle de confiance
    ax.errorbar(idx, mean, yerr=[[mean - ci[0]], [ci[1] - mean]], 
                fmt='o', capsize=5, capthick=2, linewidth=2)

ax.axhline(0, color='red', linestyle='--', linewidth=1.5, alpha=0.5, label='Rendement nul')
ax.set_xticks(positions)
ax.set_xticklabels(actions_list)
ax.set_ylabel('Rendement Annualis√©', fontsize=12)
ax.set_title('üìè Intervalles de Confiance √† 95% pour les Rendements Annualis√©s', 
             fontsize=14, fontweight='bold')
ax.legend()
ax.grid(True, alpha=0.3, axis='y')
plt.show()

---

## üìà √âtape 6 : Mod√®le CAPM et R√©gression Lin√©aire

### 6.1 Calcul des Betas et Alphas

In [None]:
print("üìà MOD√àLE CAPM : CALCUL DES BETAS ET ALPHAS")
print("="*80)
print("Mod√®le : R_action = Œ± + Œ≤ √ó R_march√© + Œµ\n")

results_capm = []

for action in actions_list:
    # R√©gression lin√©aire
    X = sm.add_constant(df['MARKET'])  # Ajout de la constante pour Œ±
    y = df[action]
    
    model = sm.OLS(y, X).fit()
    
    alpha = model.params['const']
    beta = model.params['MARKET']
    r_squared = model.rsquared
    p_value_beta = model.pvalues['MARKET']
    
    # Annualisation de l'alpha
    alpha_annuel = alpha * 252
    
    results_capm.append({
        'Action': action,
        'Alpha (quotidien)': f"{alpha:.6f}",
        'Alpha annualis√©': f"{alpha_annuel:.4%}",
        'Beta': f"{beta:.4f}",
        'R¬≤': f"{r_squared:.4f}",
        'P-value (Œ≤)': f"{p_value_beta:.6f}",
        'Œ≤ Significatif': '‚úÖ' if p_value_beta < 0.05 else '‚ùå'
    })

df_capm = pd.DataFrame(results_capm)
print(df_capm.to_string(index=False))

print("\nüí° Interpr√©tation du Beta :")
print("   Œ≤ = 1.0  ‚Üí Action suit le march√©")
print("   Œ≤ > 1.0  ‚Üí Action plus volatile que le march√© (aggressive)")
print("   Œ≤ < 1.0  ‚Üí Action moins volatile que le march√© (d√©fensive)")
print("\nüí° Interpr√©tation de l'Alpha :")
print("   Œ± > 0    ‚Üí Performance exc√©dentaire (sur-performance)")
print("   Œ± < 0    ‚Üí Sous-performance par rapport au march√©")

### 6.2 Visualisation des R√©gressions CAPM

In [None]:
# Scatter plots avec droites de r√©gression
fig, axes = plt.subplots(2, 3, figsize=(18, 10))
axes = axes.flatten()

for idx, action in enumerate(actions_list):
    X = df['MARKET']
    y = df[action]
    
    # R√©gression
    slope, intercept, r_value, p_value, std_err = stats.linregress(X, y)
    
    # Scatter
    axes[idx].scatter(X, y, alpha=0.5, s=20, color='steelblue')
    
    # Droite de r√©gression
    x_fit = np.linspace(X.min(), X.max(), 100)
    y_fit = intercept + slope * x_fit
    axes[idx].plot(x_fit, y_fit, 'r-', linewidth=2.5, 
                   label=f'Œ≤={slope:.2f}, Œ±={intercept:.5f}')
    
    axes[idx].set_xlabel('Rendement March√©', fontsize=10)
    axes[idx].set_ylabel(f'Rendement {action}', fontsize=10)
    axes[idx].set_title(f'{action}\nR¬≤={r_value**2:.3f}', fontweight='bold')
    axes[idx].legend(fontsize=9)
    axes[idx].grid(True, alpha=0.3)
    axes[idx].axhline(0, color='gray', linestyle='--', linewidth=0.8, alpha=0.5)
    axes[idx].axvline(0, color='gray', linestyle='--', linewidth=0.8, alpha=0.5)

# Supprimer le dernier subplot
fig.delaxes(axes[5])

plt.suptitle('üìà Mod√®le CAPM : R√©gressions Action vs March√©', 
             fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()

### 6.3 Analyse des R√©sidus (Validation du Mod√®le)

In [None]:
# Analyse des r√©sidus pour TECH_A (exemple)
action_test = 'TECH_A'

X = sm.add_constant(df['MARKET'])
y = df[action_test]
model = sm.OLS(y, X).fit()

# R√©sidus
residus = model.resid
fitted = model.fittedvalues

# Tests sur les r√©sidus
print(f"üîç ANALYSE DES R√âSIDUS POUR {action_test}")
print("="*80)

# 1. Test de normalit√© des r√©sidus
shapiro_stat, shapiro_p = stats.shapiro(residus)
print(f"\n1. Test de Normalit√© des R√©sidus (Shapiro-Wilk) :")
print(f"   P-value : {shapiro_p:.6f}")
print(f"   D√©cision: {'R√©sidus normaux ‚úì' if shapiro_p > 0.05 else 'R√©sidus NON normaux ‚úó'}")

# 2. Autocorr√©lation (Durbin-Watson)
from statsmodels.stats.stattools import durbin_watson
dw = durbin_watson(residus)
print(f"\n2. Test de Durbin-Watson (autocorr√©lation) :")
print(f"   Statistique DW : {dw:.4f}")
print(f"   Interpr√©tation : ", end="")
if 1.5 < dw < 2.5:
    print("Pas d'autocorr√©lation significative ‚úì")
elif dw < 1.5:
    print("Autocorr√©lation positive d√©tect√©e ‚úó")
else:
    print("Autocorr√©lation n√©gative d√©tect√©e ‚úó")

# Visualisation
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. R√©sidus vs Fitted
axes[0, 0].scatter(fitted, residus, alpha=0.5, s=20)
axes[0, 0].axhline(0, color='red', linestyle='--', linewidth=2)
axes[0, 0].set_xlabel('Valeurs Pr√©dites')
axes[0, 0].set_ylabel('R√©sidus')
axes[0, 0].set_title('R√©sidus vs Valeurs Pr√©dites', fontweight='bold')
axes[0, 0].grid(True, alpha=0.3)

# 2. Histogramme des r√©sidus
axes[0, 1].hist(residus, bins=30, density=True, alpha=0.7, edgecolor='black')
x = np.linspace(residus.min(), residus.max(), 100)
axes[0, 1].plot(x, norm.pdf(x, np.mean(residus), np.std(residus)), 'r-', linewidth=2)
axes[0, 1].set_xlabel('R√©sidus')
axes[0, 1].set_ylabel('Densit√©')
axes[0, 1].set_title('Distribution des R√©sidus', fontweight='bold')
axes[0, 1].grid(True, alpha=0.3)

# 3. Q-Q Plot
stats.probplot(residus, dist="norm", plot=axes[1, 0])
axes[1, 0].set_title('Q-Q Plot des R√©sidus', fontweight='bold')
axes[1, 0].grid(True, alpha=0.3)

# 4. R√©sidus dans le temps
axes[1, 1].plot(residus, linewidth=1, alpha=0.7)
axes[1, 1].axhline(0, color='red', linestyle='--', linewidth=1.5)
axes[1, 1].axhline(np.std(residus), color='orange', linestyle=':', linewidth=1)
axes[1, 1].axhline(-np.std(residus), color='orange', linestyle=':', linewidth=1)
axes[1, 1].set_xlabel('Observation')
axes[1, 1].set_ylabel('R√©sidu')
axes[1, 1].set_title('R√©sidus dans le Temps', fontweight='bold')
axes[1, 1].grid(True, alpha=0.3)

plt.suptitle(f'üîç Diagnostic des R√©sidus - {action_test}', 
             fontsize=14, fontweight='bold')
plt.tight_layout()
plt.show()

---

## üìë √âtape 7 : Rapport Final et Recommandations

### 7.1 Synth√®se des R√©sultats

In [None]:
# Cr√©ation d'un tableau de synth√®se
synthese = pd.DataFrame()

for action in actions_list:
    # Statistiques de base
    rend_annuel = df[action].mean() * 252
    vol_annuelle = df[action].std() * np.sqrt(252)
    sharpe = rend_annuel / vol_annuelle
    
    # CAPM
    X = sm.add_constant(df['MARKET'])
    model = sm.OLS(df[action], X).fit()
    alpha = model.params['const'] * 252
    beta = model.params['MARKET']
    r2 = model.rsquared
    
    # Skewness & Kurtosis
    skew = stats.skew(df[action])
    kurt = stats.kurtosis(df[action])
    
    synthese[action] = [
        f"{rend_annuel:.2%}",
        f"{vol_annuelle:.2%}",
        f"{sharpe:.3f}",
        f"{alpha:.2%}",
        f"{beta:.3f}",
        f"{r2:.3f}",
        f"{skew:.3f}",
        f"{kurt:.3f}"
    ]

synthese.index = ['Rendement annuel', 'Volatilit√© annuelle', 'Sharpe Ratio', 
                  'Alpha (CAPM)', 'Beta (CAPM)', 'R¬≤ (CAPM)', 
                  'Skewness', 'Kurtosis']

print("üìä TABLEAU DE SYNTH√àSE FINALE")
print("="*100)
print(synthese.to_string())

### 7.2 Recommandations d'Investissement

In [None]:
print("\n\nüíº RECOMMANDATIONS D'INVESTISSEMENT")
print("="*100)

# Classement par Sharpe Ratio
sharpe_ranking = {}
for action in actions_list:
    rend = df[action].mean() * 252
    vol = df[action].std() * np.sqrt(252)
    sharpe_ranking[action] = rend / vol

sorted_sharpe = sorted(sharpe_ranking.items(), key=lambda x: x[1], reverse=True)

print("\nüèÜ CLASSEMENT PAR SHARPE RATIO (Rendement ajust√© du risque) :")
print("-" * 60)
for rank, (action, sharpe) in enumerate(sorted_sharpe, 1):
    print(f"   {rank}. {action:12s} : Sharpe = {sharpe:.3f}")

# Analyse par profil d'investisseur
print("\n\nüìà RECOMMANDATIONS PAR PROFIL D'INVESTISSEUR :")
print("-" * 80)

# Profil Conservateur
print("\nüõ°Ô∏è  PROFIL CONSERVATEUR (faible risque) :")
vol_dict = {action: df[action].std() * np.sqrt(252) for action in actions_list}
conservateur = min(vol_dict, key=vol_dict.get)
print(f"   ‚û§ Recommandation : {conservateur}")
print(f"   ‚û§ Volatilit√© : {vol_dict[conservateur]:.2%}")
print(f"   ‚û§ Beta : {sm.OLS(df[conservateur], sm.add_constant(df['MARKET'])).fit().params['MARKET']:.3f}")

# Profil √âquilibr√©
print("\n‚öñÔ∏è  PROFIL √âQUILIBR√â (rendement/risque optimal) :")
equilibre = sorted_sharpe[0][0]
print(f"   ‚û§ Recommandation : {equilibre}")
print(f"   ‚û§ Sharpe Ratio : {sorted_sharpe[0][1]:.3f}")
print(f"   ‚û§ Rendement : {df[equilibre].mean() * 252:.2%}")
print(f"   ‚û§ Volatilit√© : {df[equilibre].std() * np.sqrt(252):.2%}")

# Profil Agressif
print("\nüöÄ PROFIL AGRESSIF (rendement maximal) :")
rend_dict = {action: df[action].mean() * 252 for action in actions_list}
agressif = max(rend_dict, key=rend_dict.get)
print(f"   ‚û§ Recommandation : {agressif}")
print(f"   ‚û§ Rendement annuel : {rend_dict[agressif]:.2%}")
print(f"   ‚û§ Beta : {sm.OLS(df[agressif], sm.add_constant(df['MARKET'])).fit().params['MARKET']:.3f}")

# Actions √† √©viter
print("\n\n‚ö†Ô∏è  ACTIONS √Ä √âVITER OU SURVEILLER :")
print("-" * 60)
for action in actions_list:
    alpha = sm.OLS(df[action], sm.add_constant(df['MARKET'])).fit().params['const'] * 252
    if alpha < 0:
        print(f"   ‚ö†Ô∏è  {action} : Alpha n√©gatif ({alpha:.2%}) - Sous-performance syst√©matique")

# Diversification
print("\n\nüß© RECOMMANDATIONS DE DIVERSIFICATION :")
print("-" * 80)
corr_matrix = df[actions_list].corr()
print("\nPaires d'actions faiblement corr√©l√©es (bonnes pour diversification) :")
for i in range(len(actions_list)):
    for j in range(i+1, len(actions_list)):
        corr = corr_matrix.iloc[i, j]
        if corr < 0.5:
            print(f"   ‚úÖ {actions_list[i]} & {actions_list[j]} : Corr√©lation = {corr:.3f}")

print("\n" + "="*100)
print("\n‚úÖ ANALYSE STATISTIQUE TERMIN√âE")
print("\nüìä Ce rapport fournit une base solide pour des d√©cisions d'investissement √©clair√©es.")
print("‚ö†Ô∏è  Rappel : Les performances pass√©es ne garantissent pas les performances futures.")

---

## üéì Conclusion du Projet

### ‚úÖ Comp√©tences D√©montr√©es

Dans ce projet, vous avez appliqu√© avec succ√®s :

1. **üìä Statistiques Descriptives**
   - Calcul et interpr√©tation de toutes les mesures de tendance centrale et dispersion
   - Analyse de distributions (skewness, kurtosis)
   - D√©tection d'anomalies statistiques

2. **üìà Visualisation de Donn√©es**
   - Cr√©ation de dashboards professionnels multi-panels
   - Heatmaps de corr√©lation
   - Graphiques de performance temporelle

3. **üß™ Tests d'Hypoth√®ses**
   - Tests de normalit√© (Shapiro-Wilk, Kolmogorov-Smirnov)
   - Tests t pour moyennes
   - ANOVA pour comparaisons multiples

4. **üìè Intervalles de Confiance**
   - Calcul d'IC pour rendements et volatilit√©s
   - Visualisation des incertitudes

5. **üìà R√©gression et Mod√©lisation**
   - Mod√®le CAPM complet (alpha, beta)
   - Analyse de la qualit√© du mod√®le (R¬≤)
   - Diagnostic des r√©sidus

6. **üíº Applications Finance**
   - Ratio de Sharpe
   - Analyse rendement/risque
   - Recommandations d'investissement

### üöÄ Prochaines √âtapes

Vous √™tes maintenant pr√™t pour :
- **Probabilit√©s avanc√©es** (Chapitre 09)
- **Machine Learning** avec bases statistiques solides
- **Finance quantitative** professionnelle

---

## üìö Ressources Compl√©mentaires

- üìñ [Cours complet](../../cours/Phase_1_Mathematiques/Maths_08_Statistiques.ipynb)
- üìù [Exercices pratiques](exercices_08_statistiques.ipynb)
- ‚úÖ [Solutions d√©taill√©es](solutions_08_statistiques.ipynb)

---

**F√©licitations pour avoir compl√©t√© ce projet ! üéâ**