In [5]:
# Importation des librairies de base
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm

import wrds
from scipy import stats
from scipy.stats import skew, kurtosis
import warnings

In [None]:
# Connexion √† la base de donn√©es WRDS
db = wrds.Connection(wrds_username='vince1209')

# Changer le nom apr√®s wrds_username pour te connecter, 
# entrer le nom d'utilisateur puis ton mot de passe dans la barre du haut, 
# puis "y" pour ne pas avoir √† te reconnecter √† chaque fois!

# Question 3

### Partie A

In [None]:
# Importation des librairies suppl√©mentaires
from scipy import stats
from scipy.stats import skew, kurtosis
import warnings
warnings.filterwarnings('ignore')

# Param√®tres de simulation
np.random.seed(42)  # Pour reproductibilit√©
n_obs = 10000  # Nombre d'observations

print(f"üéØ Param√®tres de simulation:")
print(f"  ‚Ä¢ Nombre d'observations: {n_obs}")
print(f"  ‚Ä¢ Graine al√©atoire: 42 (pour reproductibilit√©)")

# 1. Simulation de la distribution gaussienne standard
print(f"\nüìà 1. Simulation distribution gaussienne standard...")
returns_normal = np.random.normal(loc=0, scale=1, size=n_obs)
print(f"‚úÖ {len(returns_normal)} observations gaussiennes g√©n√©r√©es")

# 2. Simulation de la distribution Student-t (3 degr√©s de libert√©)
print(f"\nüìà 2. Simulation distribution Student-t (df=3)...")
returns_t = stats.t.rvs(df=3, size=n_obs)
print(f"‚úÖ {len(returns_t)} observations Student-t g√©n√©r√©es")

# 3. Normalisation pour m√™me variance inconditionnelle
print(f"\nüîß 3. Normalisation des variances...")
print(f"Variance avant normalisation:")
print(f"  ‚Ä¢ Gaussienne: {np.var(returns_normal):.4f}")
print(f"  ‚Ä¢ Student-t: {np.var(returns_t):.4f}")

# Normaliser Student-t pour avoir la m√™me variance que la gaussienne
target_variance = 1.0  # Variance de la gaussienne standard
returns_t_normalized = returns_t * np.sqrt(target_variance / np.var(returns_t))

print(f"Variance apr√®s normalisation:")
print(f"  ‚Ä¢ Gaussienne: {np.var(returns_normal):.4f}")
print(f"  ‚Ä¢ Student-t normalis√©e: {np.var(returns_t_normalized):.4f}")

# 4. Calcul des statistiques sommaires
print(f"\nüìä 4. Statistiques sommaires:")

def calc_summary_stats(data, name):
    """Calcule les statistiques sommaires d'une s√©rie"""
    stats_dict = {
        'Moyenne': np.mean(data),
        '√âcart-type': np.std(data),
        'Asym√©trie (Skewness)': skew(data),
        'Aplatissement (Kurtosis)': kurtosis(data, fisher=True),  # Exc√®s de kurtosis
        'Minimum': np.min(data),
        'Maximum': np.max(data)
    }
    
    print(f"\n{name}:")
    for stat_name, value in stats_dict.items():
        print(f"  ‚Ä¢ {stat_name}: {value:.4f}")
    
    return stats_dict

# Statistiques pour les deux distributions
stats_normal = calc_summary_stats(returns_normal, "Distribution Gaussienne")
stats_t = calc_summary_stats(returns_t_normalized, "Distribution Student-t (df=3, normalis√©e)")

In [None]:
# 5. Visualisation des distributions
print(f"\nüìà 5. Visualisation comparative des distributions...")

# Configuration des graphiques
plt.style.use('default')
fig, axes = plt.subplots(2, 2, figsize=(15, 12))
fig.suptitle('Comparaison: Distribution Gaussienne vs Student-t (df=3)', fontsize=16, y=0.98)

# Graphique 1: Histogrammes superpos√©s
axes[0, 0].hist(returns_normal, bins=50, alpha=0.7, label='Gaussienne', color='blue', density=True)
axes[0, 0].hist(returns_t_normalized, bins=50, alpha=0.7, label='Student-t (df=3)', color='red', density=True)
axes[0, 0].set_title('Histogrammes superpos√©s')
axes[0, 0].set_xlabel('Rendements')
axes[0, 0].set_ylabel('Densit√©')
axes[0, 0].legend()
axes[0, 0].grid(True, alpha=0.3)

# Graphique 2: Estimation de densit√© par noyau (KDE)
from scipy.stats import gaussian_kde

kde_normal = gaussian_kde(returns_normal)
kde_t = gaussian_kde(returns_t_normalized)

x_range = np.linspace(-6, 6, 1000)
axes[0, 1].plot(x_range, kde_normal(x_range), label='Gaussienne', color='blue', linewidth=2)
axes[0, 1].plot(x_range, kde_t(x_range), label='Student-t (df=3)', color='red', linewidth=2)
axes[0, 1].set_title('Estimation de densit√© par noyau (KDE)')
axes[0, 1].set_xlabel('Rendements')
axes[0, 1].set_ylabel('Densit√©')
axes[0, 1].legend()
axes[0, 1].grid(True, alpha=0.3)

# Graphique 3: Q-Q plots pour √©valuer la normalit√©
from scipy.stats import probplot

probplot(returns_normal, dist="norm", plot=axes[1, 0])
axes[1, 0].set_title('Q-Q Plot: Gaussienne vs Normale th√©orique')
axes[1, 0].grid(True, alpha=0.3)

probplot(returns_t_normalized, dist="norm", plot=axes[1, 1])
axes[1, 1].set_title('Q-Q Plot: Student-t vs Normale th√©orique')
axes[1, 1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# 6. Analyse des queues de distribution
print(f"\nüîç 6. Analyse d√©taill√©e des queues de distribution:")

# Calcul des quantiles extr√™mes
quantiles = [0.01, 0.05, 0.95, 0.99]
print(f"\nQuantiles de distribution:")
print(f"{'Quantile':<10} {'Gaussienne':<12} {'Student-t':<12} {'Diff√©rence':<12}")
print("-" * 50)

for q in quantiles:
    q_normal = np.quantile(returns_normal, q)
    q_t = np.quantile(returns_t_normalized, q)
    diff = abs(q_t) - abs(q_normal)  # Diff√©rence en valeur absolue
    
    print(f"{q:<10.2f} {q_normal:<12.4f} {q_t:<12.4f} {diff:<12.4f}")

# Analyse des valeurs extr√™mes
print(f"\nüìä Analyse des √©v√©nements extr√™mes:")
threshold_2sigma = 2.0  # Seuil √† 2 √©carts-types
threshold_3sigma = 3.0  # Seuil √† 3 √©carts-types

extreme_normal_2s = np.sum(np.abs(returns_normal) > threshold_2sigma)
extreme_t_2s = np.sum(np.abs(returns_t_normalized) > threshold_2sigma)

extreme_normal_3s = np.sum(np.abs(returns_normal) > threshold_3sigma)
extreme_t_3s = np.sum(np.abs(returns_t_normalized) > threshold_3sigma)

print(f"√âv√©nements |rendement| > 2œÉ:")
print(f"  ‚Ä¢ Gaussienne: {extreme_normal_2s} ({extreme_normal_2s/n_obs*100:.2f}%)")
print(f"  ‚Ä¢ Student-t: {extreme_t_2s} ({extreme_t_2s/n_obs*100:.2f}%)")
print(f"  ‚Ä¢ Th√©orique (normale): {0.0455*100:.2f}%")

print(f"\n√âv√©nements |rendement| > 3œÉ:")
print(f"  ‚Ä¢ Gaussienne: {extreme_normal_3s} ({extreme_normal_3s/n_obs*100:.2f}%)")
print(f"  ‚Ä¢ Student-t: {extreme_t_3s} ({extreme_t_3s/n_obs*100:.2f}%)")
print(f"  ‚Ä¢ Th√©orique (normale): {0.0027*100:.2f}%")

In [None]:
# 7. Interpr√©tation et discussion des r√©sultats
print(f"\nüìù 7. INTERPR√âTATION ET DISCUSSION:")
print("="*60)

print(f"\nüîç √âCARTS PAR RAPPORT √Ä LA NORMALIT√â:")

print(f"\n1. ASYM√âTRIE (Skewness):")
skew_normal = skew(returns_normal)
skew_t = skew(returns_t_normalized)
print(f"   ‚Ä¢ Gaussienne: {skew_normal:.4f} (proche de 0 = sym√©trique)")
print(f"   ‚Ä¢ Student-t: {skew_t:.4f}")
if abs(skew_t) > 0.5:
    print(f"   ‚ö†Ô∏è  Student-t montre une asym√©trie notable")
else:
    print(f"   ‚úÖ Les deux distributions sont approximativement sym√©triques")

print(f"\n2. APLATISSEMENT (Kurtosis excess):")
kurt_normal = kurtosis(returns_normal, fisher=True)
kurt_t = kurtosis(returns_t_normalized, fisher=True)
print(f"   ‚Ä¢ Gaussienne: {kurt_normal:.4f} (proche de 0 = normale)")
print(f"   ‚Ä¢ Student-t: {kurt_t:.4f}")
print(f"   üìä Diff√©rence de kurtosis: {kurt_t - kurt_normal:.4f}")

if kurt_t > 1:
    print(f"   ‚ö†Ô∏è  Student-t pr√©sente un EXC√àS DE KURTOSIS significatif")
    print(f"   üìà Cela indique des QUEUES PLUS √âPAISSES que la normale")
else:
    print(f"   ‚úÖ Kurtosis proche de la normale")

print(f"\n3. QUEUES DE DISTRIBUTION:")
print(f"   üìä La distribution Student-t (df=3) est connue pour avoir des queues plus √©paisses")
print(f"   üìà Probabilit√© d'√©v√©nements extr√™mes plus √©lev√©e que la gaussienne")
print(f"   ‚ö†Ô∏è  Sous-estimation du risque si on assume la normalit√© pour des donn√©es Student-t")

print(f"\n4. IMPLICATIONS POUR LE RISQUE FINANCIER:")
print(f"   üè¶ VaR Gaussienne sous-estimera le risque r√©el si les donn√©es suivent Student-t")
print(f"   üìâ Les pertes extr√™mes seront plus fr√©quentes que pr√©vu")
print(f"   üéØ Importance de tester les hypoth√®ses distributionnelles")

print(f"\n5. TESTS DE NORMALIT√â RECOMMAND√âS:")
# Test de Jarque-Bera
from scipy.stats import jarque_bera

jb_normal, p_normal = jarque_bera(returns_normal)
jb_t, p_t = jarque_bera(returns_t_normalized)

print(f"   Test de Jarque-Bera (H0: normalit√©):")
print(f"   ‚Ä¢ Gaussienne: JB = {jb_normal:.4f}, p-value = {p_normal:.6f}")
print(f"   ‚Ä¢ Student-t: JB = {jb_t:.4f}, p-value = {p_t:.6f}")

if p_normal > 0.05:
    print(f"   ‚úÖ Gaussienne: On ne rejette pas H0 (normalit√© accept√©e)")
else:
    print(f"   ‚ùå Gaussienne: Rejet de H0 (non-normalit√©)")

if p_t > 0.05:
    print(f"   ‚úÖ Student-t: On ne rejette pas H0 (normalit√© accept√©e)")
else:
    print(f"   ‚ùå Student-t: Rejet de H0 (non-normalit√© d√©tect√©e)")

print(f"\nüéØ CONCLUSION PARTIE A:")
print(f"   La distribution Student-t (df=3) pr√©sente des caract√©ristiques distinctes:")
print(f"   ‚Ä¢ Queues plus √©paisses (kurtosis √©lev√©e)")
print(f"   ‚Ä¢ Plus d'√©v√©nements extr√™mes")
print(f"   ‚Ä¢ Risque sous-estim√© par les mod√®les gaussiens")
print(f"   ‚Ä¢ N√©cessit√© de mod√®les de VaR robustes aux queues √©paisses")

print(f"\n‚úÖ Simulation et analyse termin√©es!")