---

**Domaine** : probabilité

**Secteur** : Concentration et loi des grands nombres

**Exemple d'algorithmes** : 

Simuler $N$ échantillons de taille $n$ d’une variable aléatoire d’espérance $\mu$ et d’écart type $\sigma$. Calculer l’écart type $s$ de la série des moyennes des échantillons observés, à comparer à $\frac{\sigma}{\sqrt{n}}$.
%  la proportion des échantillons pour lesquels l’écart entre la moyenne et $\mu$ est inférieur ou égal à $ks$, ou à 𝑘𝜎/√𝑛, pour 𝑘=1,2,3.

---

Soit une variable aléatoire $X$ dont on connait la loi de probabilité.

| $k$ | -1            |     1           |   10       |
|---- |:------------: |: -------------: |: ---------: |
| $P(X=k)$| 0.9           |        0.15       |      0.05 |



In [2]:
X=[-1,1,10]
P=[0.8,0.15,0.05]

# Calcul du couple $(\mu, \sigma)$
1. Déterminons dans un premier temps l'espérance $\mu$ de cette loi.

In [3]:
def mu(X, P):
    """Renvoie l'espérance mathématique d'une loi de probabilité discrète """
    n = len(X)
    esperance = 0
    for i in range(n):
        esperance = esperance + X[i] * P[i]
    return esperance

In [4]:
mu(X, P)

-0.15000000000000002

2. Déterminons la variance $V$ puis l'écart type $\sigma$ de cette variable aléatoire $X$.

In [5]:
def var(X,P):
    """Renvoie la variance d'une loi de probabilité discrète """
    n = len(X)
    esperance = mu(X,P)
    variance = 0
    for i in range(n):
        variance = variance + P[i]*(X[i]-esperance)**2
    return variance

In [6]:
var(X, P)

5.9275

In [7]:
from math import sqrt
def sigma(X, P):
    """Renvoie l'écart type d'une loi de probabilité discrète """
    return sqrt(var(X,P))

In [8]:
sigma(X, P)

2.43464576478797

# Simulation de la variable aléatoire 

1. Simulation d'un tirage

In [9]:
from random import random

def simulation(X, P):
    n = len(X)
    tirage = random()
    inf = 0
    sup = P[0]
    for i in range(n) :
        if inf <= tirage and tirage <= sup :
            return X[i]
        inf = inf + P[i]
        sup = sup + P[i+1]

   2. Simulons $n$ tirages dans une fonction 

In [10]:
def echantillon(X, P, n):
    """
    Simulation d'un échantillon de taille N de la v.a X
    n est la taille de l'échantillon
    """
    list = []
    for i in range(n):
        k = simulation(X, P)
        list.append(k)
    return list

In [11]:
def moyenne(list):
    """ 
    n est la taille de l'échantillon 
    renvoie la moyenne d'une série générer aléatoirement
    """
    n = len(list)
    total = 0
    for valeur in list :
        total = total + valeur
    return total/n

In [12]:
moyenne(echantillon(X, P, 1000))

-0.09

# Moyenne et écart type de la série

Il nous faut générer une série de moyenne de taille $N$. 


In [13]:
def serie_moyenne(X, P, n, N):
    """
    n = taille des échantillons
    N = nombre d'échantillons
    Renvoie une série de N moyenne générer aléatoirement
    """
    serie=[]
    for i in range(N):
        serie.append(moyenne(echantillon(X,P,1000)))
    return serie

In [14]:
l=serie_moyenne(X,P,1000,200)
print(l)

[-0.121, -0.158, -0.11, -0.236, -0.164, -0.238, -0.088, -0.182, -0.19, -0.037, -0.113, -0.086, -0.027, -0.166, -0.077, -0.174, -0.119, -0.058, -0.2, -0.012, -0.087, -0.149, -0.121, -0.23, -0.092, -0.132, -0.22, -0.185, -0.064, -0.15, -0.018, -0.206, -0.194, -0.276, -0.075, -0.087, -0.086, -0.101, 0.01, -0.138, -0.137, -0.206, -0.148, -0.211, -0.182, -0.206, -0.115, -0.229, -0.241, -0.246, -0.235, -0.209, -0.17, -0.196, -0.146, -0.177, -0.138, -0.129, -0.124, -0.184, -0.154, -0.141, -0.282, 0.053, -0.33, -0.17, -0.116, -0.092, -0.052, -0.022, -0.094, -0.184, -0.223, -0.068, -0.265, -0.137, -0.198, -0.125, -0.149, -0.251, -0.142, -0.178, -0.182, -0.168, -0.23, -0.131, -0.14, -0.076, -0.139, -0.24, -0.103, -0.271, -0.189, -0.21, -0.15, -0.264, -0.165, -0.119, -0.172, -0.141, 0.066, -0.218, -0.309, -0.184, -0.248, -0.149, -0.031, -0.007, -0.083, -0.099, -0.128, 0.009, -0.253, -0.226, -0.107, -0.066, -0.165, -0.206, -0.227, -0.17, -0.298, -0.099, -0.172, -0.149, -0.183, -0.038, -0.104, -0.1

Il nous reste à comparer $\sigma$ l'écart type de la loi (théorie) à l'écart type $s$ de cette série des moyennes.

In [15]:
def variance_list(list):
    """ Renvoie la variance d'une série statistique """
    somme_carre = 0
    x_bar = moyenne(list)
    for valeur in list :
        somme_carre = somme_carre + (valeur-x_bar)**2
    return somme_carre / len(list)

def sigma_list(list):
    """ Renvoie l'écart type d'une série statistique """
    return sqrt(variance_list(list))

In [16]:
# Exemple pour vérifier
print(variance_list([1,2,3,4,5]))
print(sigma_list([1,2,3,4,5]))

2.0
1.4142135623730951


# Cherchons à conclure sur : calculer l’écart type $s$ de la série des moyennes des échantillons observés, à comparer à $\frac{\sigma}{\sqrt{n}}$.

3. Calculons l'écart type de ce tirage $l$, il est à comparer à l'écart type trouvé divisé par $\sqrt{n}$.

In [17]:
print(sigma_list(l),sigma(X,P)/sqrt(1000))

0.07352604283517507 0.07699025912412556


# Justifions cela par la théorie disponible

$\displaystyle S_n = X_1 + X_2 + \cdots + X_n = \sum_{i=1}^n X_i$ d'où $V(S_n) = V(X_1) + V(X_2) + \cdots + V(X_n) = V + V + \cdots + V = nV = n \sigma^2$

$M_n = \dfrac{S_n}{n}$ d'où $V(M_n) = V \left( \frac{1}{n} (S_n) \right) = \left( \dfrac{1}{n} \right) V(S_n) = \left( \dfrac{1}{n} \right) n \sigma^2 = \dfrac{\sigma^2}{n}$

et l'écart type est $\sigma (M_n)  =  \sqrt{V(M_n)} = \dfrac{\sigma}{\sqrt{n}}$



