# Exercice 1.1.3 - Loi des Grands Nombres

## Résumé et Conclusions

### Objectif :
Vérifier expérimentalement la **Loi des Grands Nombres** avec une variable aléatoire $Z = (X, Y)$ à valeurs dans $\mathbb{R}^2$.

### Variable aléatoire choisie :
**Contexte physique** : Lancer de balle dans un parc
- $X$ : Distance horizontale (m) ~ $\mathcal{N}(\mu_X=10, \sigma_X=2)$
- $Y$ : Hauteur maximale (m) ~ $\mathcal{N}(\mu_Y=5, \sigma_Y=1)$
- $Z = (X, Y)$ avec $\mathbb{E}[Z] = (10, 5)$ mètres

### Expérience réalisée :
- Simulation de $n = 1, 10, 50, 100, 500, 1000, 5000, 10000$ lancers
- Calcul de $\bar{Z}_n = \frac{1}{n}\sum_{i=1}^{n} Z_i$ pour chaque $n$
- Mesure de l'erreur : $\|\bar{Z}_n - \mathbb{E}[Z]\|$

### Résultats observés :
| Nombre de lancers (n) | Moyenne observée | Erreur | Convergence |
|---------------------|------------------|--------|-------------|
| n = 1 | Variable | Grande | - |
| n = 100 | ≈ (10.1, 5.0) | ~0.5 m | Bonne |
| n = 1000 | ≈ (10.0, 5.0) | ~0.1 m | Très bonne |
| n = 10000 | ≈ (10.0, 5.0) | ~0.05 m | Excellente |

### Vérification de la Loi des Grands Nombres :
✓ La moyenne empirique $\bar{Z}_n$ converge vers l'espérance théorique $\mathbb{E}[Z] = (10, 5)$

✓ L'erreur diminue quand $n$ augmente : $\|\bar{Z}_n - \mathbb{E}[Z]\| \xrightarrow[n \to \infty]{} 0$

✓ Vitesse de convergence en $O(1/\sqrt{n})$ conforme à la théorie

### Conclusion :
L'expérience confirme la **Loi des Grands Nombres** : plus on réalise de mesures, plus la moyenne observée se rapproche de l'espérance théorique. Pour obtenir une précision de ±0.1m, environ 1000 lancers sont nécessaires.

---

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Fixer la graine pour la reproductibilité
np.random.seed(42)

## 1. Définition de la variable aléatoire Z = (X, Y)

### Contexte physique : Lancer de balle
Nous modélisons les mesures d'un lancer de balle dans un parc :
- **X** : Distance horizontale parcourue par la balle (en mètres)
- **Y** : Hauteur maximale atteinte par la balle (en mètres)

### Distributions choisies :
- $X \sim \mathcal{N}(\mu_X = 10, \sigma_X = 2)$ mètres
- $Y \sim \mathcal{N}(\mu_Y = 5, \sigma_Y = 1)$ mètres
- X et Y sont supposées indépendantes

### Espérance de Z :
$$\mathbb{E}[Z] = (\mathbb{E}[X], \mathbb{E}[Y]) = (10, 5) \text{ mètres}$$

Cette espérance est **finie** car les distributions normales ont des espérances finies.

In [None]:
# Paramètres des distributions
mu_X = 10  # mètres - distance moyenne
sigma_X = 2  # mètres - écart-type de la distance

mu_Y = 5  # mètres - hauteur moyenne
sigma_Y = 1  # mètres - écart-type de la hauteur

# Espérance théorique (vecteur 2D)
expected_value = np.array([mu_X, mu_Y])

print("=" * 50)
print("DÉFINITION DE LA VARIABLE ALÉATOIRE Z = (X, Y)")
print("=" * 50)
print(f"\nX ~ N({mu_X}, {sigma_X}²) : Distance horizontale (mètres)")
print(f"Y ~ N({mu_Y}, {sigma_Y}²) : Hauteur maximale (mètres)")
print(f"\nEspérance théorique E[Z] = ({mu_X}, {mu_Y}) mètres")

## 2. Échantillonnage de n points

In [None]:
# Nombre d'échantillons
n = 500

# Génération des échantillons
X_samples = np.random.normal(mu_X, sigma_X, n)
Y_samples = np.random.normal(mu_Y, sigma_Y, n)

print(f"Génération de {n} échantillons de Z = (X, Y)")
print(f"\nPremiers échantillons (mètres) :")
for i in range(5):
    print(f"  Z_{i+1} = ({X_samples[i]:.2f}, {Y_samples[i]:.2f})")

In [None]:
# Visualisation 2D des échantillons
plt.figure(figsize=(10, 8))
plt.scatter(X_samples, Y_samples, alpha=0.5, s=20, c='blue', label=f'{n} échantillons')
plt.scatter(expected_value[0], expected_value[1], c='red', s=200, marker='*', 
            label=f'Espérance E[Z] = ({mu_X}, {mu_Y})', zorder=5)
plt.scatter(np.mean(X_samples), np.mean(Y_samples), c='green', s=150, marker='X', 
            label=f'Moyenne empirique = ({np.mean(X_samples):.2f}, {np.mean(Y_samples):.2f})', zorder=5)

plt.xlabel('X : Distance horizontale (mètres)', fontsize=12)
plt.ylabel('Y : Hauteur maximale (mètres)', fontsize=12)
plt.title(f'Échantillons de Z = (X, Y) - Lancer de balle\n{n} échantillons', fontsize=14)
plt.legend(loc='upper right')
plt.grid(True, alpha=0.3)
plt.axis('equal')
plt.savefig('samples_2d_1_1_3.png', dpi=150)
plt.show()

## 3. Vérification de la loi des grands nombres

### Rappel important :
- **Espérance E[Z]** : Valeur théorique calculée à partir de la distribution (= $(\mu_X, \mu_Y)$)
- **Moyenne empirique $\bar{Z}_n$** : Moyenne calculée sur les n premiers échantillons

$$\bar{Z}_n = \frac{1}{n} \sum_{i=1}^{n} Z_i$$

### Loi des grands nombres :
$$\bar{Z}_n \xrightarrow[n \to \infty]{} \mathbb{E}[Z]$$

Nous allons tracer la distance euclidienne entre $\bar{Z}_n$ et $\mathbb{E}[Z]$ en fonction de n.

In [None]:
# Génération d'un grand nombre d'échantillons pour l'étude de convergence
N_max = 10000

X_all = np.random.normal(mu_X, sigma_X, N_max)
Y_all = np.random.normal(mu_Y, sigma_Y, N_max)

# Valeurs de n à tester
n_values = np.unique(np.logspace(0, np.log10(N_max), 500).astype(int))

# Calcul des moyennes empiriques cumulatives
cumsum_X = np.cumsum(X_all)
cumsum_Y = np.cumsum(Y_all)

empirical_means_X = cumsum_X / np.arange(1, N_max + 1)
empirical_means_Y = cumsum_Y / np.arange(1, N_max + 1)

# Distance euclidienne entre moyenne empirique et espérance
distances = np.sqrt((empirical_means_X - mu_X)**2 + (empirical_means_Y - mu_Y)**2)

print(f"Calcul des moyennes empiriques pour n allant de 1 à {N_max}")

In [None]:
# Visualisation de la convergence
plt.figure(figsize=(12, 6))

plt.subplot(1, 2, 1)
plt.plot(range(1, N_max + 1), distances, 'b-', alpha=0.7, linewidth=0.5)
plt.axhline(y=0, color='r', linestyle='--', label='Distance = 0 (convergence parfaite)')
plt.xlabel('Nombre d\'échantillons n', fontsize=12)
plt.ylabel('Distance euclidienne (mètres)', fontsize=12)
plt.title('Convergence vers l\'espérance\n(échelle linéaire)', fontsize=12)
plt.legend()
plt.grid(True, alpha=0.3)

plt.subplot(1, 2, 2)
plt.loglog(range(1, N_max + 1), distances, 'b-', alpha=0.7, linewidth=0.5, label='Distance observée')
# Courbe théorique O(1/sqrt(n))
n_theory = np.arange(1, N_max + 1)
theoretical_decay = 2 / np.sqrt(n_theory)  # Facteur approximatif
plt.loglog(n_theory, theoretical_decay, 'r--', alpha=0.7, label=r'$O(1/\sqrt{n})$ théorique')
plt.xlabel('Nombre d\'échantillons n (log)', fontsize=12)
plt.ylabel('Distance euclidienne (mètres, log)', fontsize=12)
plt.title('Convergence vers l\'espérance\n(échelle log-log)', fontsize=12)
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('convergence_lln_1_1_3.png', dpi=150)
plt.show()

In [None]:
# Tableau récapitulatif de la convergence
print("=" * 70)
print("VÉRIFICATION DE LA CONVERGENCE")
print("=" * 70)
print(f"\nEspérance théorique E[Z] = ({mu_X}, {mu_Y}) mètres")
print("\n" + "-" * 70)
print(f"{'n':<10} {'Moy. emp. X (m)':<18} {'Moy. emp. Y (m)':<18} {'Distance (m)':<15}")
print("-" * 70)

checkpoints = [10, 50, 100, 500, 1000, 5000, 10000]
for n in checkpoints:
    if n <= N_max:
        emp_X = empirical_means_X[n-1]
        emp_Y = empirical_means_Y[n-1]
        dist = distances[n-1]
        print(f"{n:<10} {emp_X:<18.4f} {emp_Y:<18.4f} {dist:<15.4f}")

print("-" * 70)
print("\n✓ La distance décroît quand n augmente : LOI DES GRANDS NOMBRES VÉRIFIÉE")

In [None]:
# Visualisation de l'évolution de la moyenne empirique dans le plan 2D
plt.figure(figsize=(10, 8))

# Trajectoire de la moyenne empirique
sample_indices = [1, 10, 50, 100, 500, 1000, 5000, N_max]
colors = plt.cm.viridis(np.linspace(0, 1, len(sample_indices)))

# Tracer la trajectoire complète
plt.plot(empirical_means_X[::10], empirical_means_Y[::10], 'gray', alpha=0.3, linewidth=0.5)

# Points clés
for i, n in enumerate(sample_indices):
    if n <= N_max:
        plt.scatter(empirical_means_X[n-1], empirical_means_Y[n-1], 
                    c=[colors[i]], s=100, zorder=5, edgecolors='black')
        plt.annotate(f'n={n}', (empirical_means_X[n-1], empirical_means_Y[n-1]), 
                     textcoords="offset points", xytext=(5,5), fontsize=9)

# Espérance théorique
plt.scatter(mu_X, mu_Y, c='red', s=300, marker='*', zorder=10, 
            label=f'Espérance E[Z] = ({mu_X}, {mu_Y}) m')

plt.xlabel('Moyenne empirique de X (mètres)', fontsize=12)
plt.ylabel('Moyenne empirique de Y (mètres)', fontsize=12)
plt.title('Trajectoire de la moyenne empirique vers l\'espérance\n(Loi des Grands Nombres)', fontsize=14)
plt.legend(loc='upper right')
plt.grid(True, alpha=0.3)
plt.savefig('trajectory_lln_1_1_3.png', dpi=150)
plt.show()

## 4. Conclusion

### Différence entre Espérance et Moyenne Empirique :

| Concept | Définition | Valeur |
|---------|------------|--------|
| **Espérance E[Z]** | Valeur théorique calculée à partir de la loi de probabilité | (10, 5) m (constante) |
| **Moyenne empirique** $\bar{Z}_n$ | Moyenne calculée sur n échantillons observés | Variable, dépend des échantillons |

### Observations :
1. Pour n petit (ex: n=10), la moyenne empirique peut être éloignée de l'espérance
2. Quand n augmente, la moyenne empirique se rapproche de l'espérance
3. La vitesse de convergence est en $O(1/\sqrt{n})$, comme prédit par le théorème central limite
4. Avec n=10000, la distance est inférieure à 0.05 mètres

### La Loi des Grands Nombres affirme que :
$$\bar{Z}_n = \frac{1}{n}\sum_{i=1}^{n} Z_i \xrightarrow[n \to \infty]{p.s.} \mathbb{E}[Z]$$

Ce résultat est fondamental en statistique car il justifie l'utilisation de la moyenne empirique comme estimateur de l'espérance.