# Exercice loi des grands nombres

La notation mathématique peut paraître "barbare" $$\lim\limits_{n \rightarrow +\infty} \hat{X}_n = E(X)$$
En réalité, le principe est très simple : plus l'échantillon grandi, plus la moyenne de l'échantillon est proche de l'espérance c'est-à-dire la "vraie" moyenne.

*Exemple "pile ou face" :*
- sur 10 tirages on peut très bien avoir 7 piles/3 faces
- sur 100 tirages, peu probable d'avoir 70 piles/ 30 faces, on sera plus proche de 55 piles / 45 faces par exemple
- sur 1000 tirages, c'est quasi impossible d'avoir 700 faces et 300 piles à moins que la pièce soit pipée...on sera plus autour de 520/480 par exemple

La loi normale centrée réduite (c'est à dire une loi normale d'espérance 0 et de variance 1)

<img src="normale_0_1.png">

On va tester la loi des grands nombre pour un échantillon de taille *n* suivant une loi normale centrée réduite :
- créer une échantillon de taille n qui suit une loi normale centrée réduite *indication: on utilisera la fonction randn()*
- calculer le nombre d'éléments de l'échantillon compris entre -1 et 1 diviser ce nombre par n (cela donne donc la probabilité empirique d'être compris entre -1 et 1)
- selon la distribution de la loi normale centrée réduite, on sait que l'espérance est de 68,3% et selon la loi des grands nombre notre moyenne doit tendre vers cette espérance lorsque n augmente : vérifier ce dernier point

In [1]:
#import numpy as np
from numpy.random import randn

In [26]:
n = 100
def LGN(n):
    # défini un échantillon de taille n qui suit une loi normale centrée réduite
    echantillon = randn(n)

    # calcul du nombre de valeurs dans [-1,1] et [-3,-1]
    cpt = 0
    cpt2 = 0
    for x in echantillon:
        if -1<=x<=1:
            cpt += 1
        if -3<=x<=-1:
            cpt2 += 1

    # calcul des probas empiriques (division par n)
    p1 = cpt/n
    p2 = cpt2/n

    # calcul de la moyenne
    m = sum(echantillon)/n
    
    return m, p1, p2

In [28]:
LGN(10000)

(0.001071966979628723, 0.6851, 0.1583)

In [32]:
for i in range(6):
    for k in [1,2,5]:
        n=k*10**i
        res = LGN(n)
        print(f"pour {n=} : moyenne = {res[0]}, P([-1,1]) = {res[1]}, P([-3,-1]) = {res[2]}")

pour n=1 : moyenne = -1.6335568284270623, P([-1,1]) = 0.0, P([-3,-1]) = 1.0
pour n=2 : moyenne = 0.38533835537504285, P([-1,1]) = 1.0, P([-3,-1]) = 0.0
pour n=5 : moyenne = 0.6575313015990358, P([-1,1]) = 0.6, P([-3,-1]) = 0.0
pour n=10 : moyenne = 0.10339873608787183, P([-1,1]) = 0.6, P([-3,-1]) = 0.2
pour n=20 : moyenne = 0.12997379005096224, P([-1,1]) = 0.55, P([-3,-1]) = 0.2
pour n=50 : moyenne = -0.027571193918152753, P([-1,1]) = 0.7, P([-3,-1]) = 0.14
pour n=100 : moyenne = -0.3359247863879694, P([-1,1]) = 0.71, P([-3,-1]) = 0.19
pour n=200 : moyenne = 0.04062098371286494, P([-1,1]) = 0.65, P([-3,-1]) = 0.165
pour n=500 : moyenne = -0.05958774601701282, P([-1,1]) = 0.712, P([-3,-1]) = 0.156
pour n=1000 : moyenne = 0.030411774218800123, P([-1,1]) = 0.715, P([-3,-1]) = 0.133
pour n=2000 : moyenne = -0.041381831618207465, P([-1,1]) = 0.682, P([-3,-1]) = 0.164
pour n=5000 : moyenne = -0.007520226153967623, P([-1,1]) = 0.688, P([-3,-1]) = 0.1576
pour n=10000 : moyenne = 0.006646821187