# **TP : Étude de l'Échantillonnage Statistique**  

### **Auteur : KHELID Lilya-Nada**  

---

## **Objectifs :**  
Dans ce notebook, nous allons explorer l’utilisation des **méthodes d’échantillonnage statistique** afin d’analyser et d’estimer les caractéristiques d’une population à partir d’un sous-ensemble de données. L’objectif est de comprendre et d’implémenter différentes stratégies d’échantillonnage pour assurer une estimation fiable et représentative.  

Les thématiques principales abordées sont :  

1. **Types d’échantillonnage et leurs implications sur les résultats.**  
2. **Méthodes de sélection d’un échantillon représentatif.**  
3. **Estimation des paramètres d’une population à partir d’un échantillon.**  
4. **Comparaison des erreurs d’échantillonnage et impact de la taille de l’échantillon.**  

---

### 📥 Importation des librairies

In [1]:
import numpy as np
from scipy.stats import poisson,norm 

>### Exercice 1 : Contrôle progressif d'un lot d'articles

#### Paramètre :
- $p$ : proportion d'articles défectueux dans le lot

#### Objectif :
Retourne la probabilité de refus du lot et l'espérance du nombre d'articles prélevés.

#### Règle de décision :
1. On prélève un article au hasard :
   - S'il est mauvais, on refuse le lot.
   - S'il est bon, on prélève un deuxième article :
     - S'il est mauvais, on refuse le lot.
     - S'il est bon, on prélève un troisième article :
       - S'il est mauvais, on refuse le lot.
       - S'il est bon, on accepte le lot.

In [46]:
def exercice1(p):
    # probabilité de refuser le lot
    P_refus = p + (1 - p) * p + (1 - p) ** 2 * p  
    
    # Espérance 
    E_X = 1 + (1 - p) + (1 - p) ** 2  
    
    return P_refus, E_X

Exemple :

In [47]:
p = 0.1  # Exemple : 10% d'articles défectueux
probabilite_refus, esperance_articles = exercice1(p)
print(f"Probabilité de refuser le lot : {probabilite_refus:.4f}")
print(f"Espérance du nombre d'articles prélevés : {esperance_articles:.2f}")

Probabilité de refuser le lot : 0.2710
Espérance du nombre d'articles prélevés : 2.71


>#### Exercice 2 : Contrôle d'un lot avec un échantillonnage fixe

##### **Paramètres :**  
- **n1** : taille du premier échantillon  
- **k1** : seuil d'acceptation du premier échantillon  
- **α** : proportion maximale de déchets tolérée  
- **n2** : taille du deuxième échantillon (dans le cas de la deuxième règle)  
- **k2** : seuil d'acceptation pour l'échantillon de taille 200  

##### **Retourne :**  
- **Risque d'accepter un lot contenant plus de 8% de déchets**  
- **Risque de refuser un lot contenant moins de 3% de déchets**  
- **Risques équivalents avec un échantillon plus grand**  

In [48]:
def exercice2(n1=100, k1=3, alpha=0.08, n2=200, k2=9):

    # Risque d'accepter un lot contenant plus de 8% de déchets
    p_risque1 = 1 - poisson.cdf(k1, n1 * alpha)
    
    # Risque de refuser un lot contenant moins de 3% de déchets
    p_risque2 = poisson.cdf(k1, n1 * 0.03)
    
    # Risque d'accepter un lot contenant plus de 8% de déchets avec un échantillon plus grand
    p_risque1_2 = 1 - poisson.cdf(k2, n2 * alpha)
    
    # Risque de refuser un lot contenant moins de 3% de déchets avec un échantillon plus grand
    p_risque2_2 = poisson.cdf(k2, n2 * 0.03)
    
    return p_risque1, p_risque2, p_risque1_2, p_risque2_2

In [49]:
risques = exercice2()
print(f"Risque d'accepter un lot contenant plus de 8% de déchets (n=100) : {risques[0]:.4f}")
print(f"Risque de refuser un lot contenant moins de 3% de déchets (n=100) : {risques[1]:.4f}")
print(f"Risque d'accepter un lot contenant plus de 8% de déchets (n=200) : {risques[2]:.4f}")
print(f"Risque de refuser un lot contenant moins de 3% de déchets (n=200) : {risques[3]:.4f}")

Risque d'accepter un lot contenant plus de 8% de déchets (n=100) : 0.9576
Risque de refuser un lot contenant moins de 3% de déchets (n=100) : 0.6472
Risque d'accepter un lot contenant plus de 8% de déchets (n=200) : 0.9567
Risque de refuser un lot contenant moins de 3% de déchets (n=200) : 0.9161


>#### Exercice 3 : Comparaison des méthodes A et B pour l'acceptation d'un lot  

##### **Paramètres :**  
- **n** : taille de l'échantillon prélevé  
- **a, b** : seuils de rejet et d'acceptation  
- **μ** : moyenne des diamètres  
- **σ** : écart-type des diamètres  

##### **Retourne :**  
- **Probabilité de rejeter un lot avec la méthode A**  
- **Probabilité de rejeter un lot avec la méthode B**  

In [50]:
def exercice3(n, a, b, mu=110, sigma=8):
    
    # Méthode A : Test basé sur la moyenne
    p_rej_A = 1 - norm.cdf(b, loc=mu, scale=sigma / np.sqrt(n)) + norm.cdf(a, loc=mu, scale=sigma / np.sqrt(n))
    
    # Méthode B : Test basé sur le comptage des défectueux
    p_defaut = 0.0124  # Proportion de déchets quand la machine est bien réglée
    p_rej_B = 1 - poisson.cdf(8, 300 * p_defaut)
    
    return p_rej_A, p_rej_B


In [51]:
n = 30  # Taille de l'échantillon
a, b = 95, 125  # Seuils d'acceptation
p_rej_A, p_rej_B = exercice3(n, a, b)

print(f"Probabilité de rejet avec la méthode A : {p_rej_A:.4f}")
print(f"Probabilité de rejet avec la méthode B : {p_rej_B:.4f}")

Probabilité de rejet avec la méthode A : 0.0000
Probabilité de rejet avec la méthode B : 0.0141


>#### Exercice 4 : Probabilité qu'une mesure dépasse 7.7 ppm

##### **Paramètres :**  
- **μ** : moyenne de la teneur du polluant  
- **σ** : écart-type de la teneur du polluant  
- **mesure_erreur** : écart-type de l'erreur de mesure  

##### **Retourne :**  
- **Probabilité qu'une mesure unique dépasse 7.7 ppm**  
- **Probabilité que la moyenne de deux mesures dépasse 7.7 ppm**  

In [52]:
def exercice4(mu=7.6, sigma=0.04, mesure_erreur=0.03):

    # Écart-type combiné pour une seule mesure
    sigma_total_1 = np.sqrt(sigma**2 + mesure_erreur**2)
    p_1 = 1 - norm.cdf(7.7, loc=mu, scale=sigma_total_1)

    # Écart-type combiné pour la moyenne de deux mesures
    sigma_total_2 = np.sqrt(sigma**2 / 2 + mesure_erreur**2 / 2)
    p_2 = 1 - norm.cdf(7.7, loc=mu, scale=sigma_total_2)

    return p_1, p_2

In [53]:
p_1, p_2 = exercice4()

print(f"Probabilité qu'une mesure dépasse 7.7 ppm : {p_1:.4f}")
print(f"Probabilité que la moyenne de 2 mesures dépasse 7.7 ppm : {p_2:.4f}")

Probabilité qu'une mesure dépasse 7.7 ppm : 0.0228
Probabilité que la moyenne de 2 mesures dépasse 7.7 ppm : 0.0023


>#### Exercice 5 : Détermination du nombre d'échantillons nécessaires pour un test de résistance  

##### **Paramètres :**  
- **n** : nombre d'éprouvettes testées  
- **x** : seuil de résistance moyen pour accepter ou refuser le lot  
- **σ** : écart-type de la résistance des éprouvettes (fixé à 20 kg/mm²)  

##### **Retourne :**  
- **Nombre minimal d'éprouvettes pour que la probabilité d'accepter un lot de résistance ≤ 80 soit au plus 0.001**  
- **Nombre minimal d'éprouvettes pour que la probabilité de refuser un lot de résistance ≥ 100 soit au plus 0.01**  

In [54]:
def exercice5(n, x, sigma=20):

    # Seuils de probabilité pour 80 kg/mm² et 100 kg/mm²
    z1 = norm.ppf(0.001)  # Quantile pour probabilité 0.001
    z2 = norm.ppf(0.99)   # Quantile pour probabilité 0.01

    # Calcul du nombre minimal d'éprouvettes à tester
    n_min = ((z1 * sigma) / (80 - x))**2
    n_max = ((z2 * sigma) / (100 - x))**2

    return np.ceil(n_min), np.ceil(n_max)

In [55]:
n_min, n_max = exercice5(n=10, x=90)  # Exemple avec un seuil de 90 kg/mm²

print(f"Nombre minimal d'éprouvettes pour que la probabilité d'accepter un lot ≤ 80 soit au plus 0.001 : {n_min}")
print(f"Nombre minimal d'éprouvettes pour que la probabilité de refuser un lot ≥ 100 soit au plus 0.01 : {n_max}")

Nombre minimal d'éprouvettes pour que la probabilité d'accepter un lot ≤ 80 soit au plus 0.001 : 39.0
Nombre minimal d'éprouvettes pour que la probabilité de refuser un lot ≥ 100 soit au plus 0.01 : 22.0


>#### Exercice 6 : Vérification de l'état d'un lot de fusées après stockage de 2 ans  

##### **Paramètres :**  
- **n** : nombre de fusées testées  
- **μ** : portée moyenne initiale des fusées (2000 mètres)  
- **σ** : écart-type de la portée des fusées (100 mètres)  
- **Δ** : diminution de la portée moyenne considérée (100 mètres)  

##### **Retourne :**  
- **Probabilité de réformer le lot si la portée moyenne a diminué de 100 mètres**  
- **Probabilité de réformer le lot si la portée moyenne n'a pas changé**  

In [56]:
def exercice6(n, mu=2000, sigma=100, delta=100):

    # Probabilité de reformer le lot si la portée moyenne a diminué de 100 mètres
    p_reforme_diminution = 1 - norm.cdf(mu - delta, loc=mu, scale=sigma / np.sqrt(n))
    
    # Probabilité de reformer le lot si la portée moyenne est restée stable
    p_reforme_stable = 1 - norm.cdf(mu, loc=mu, scale=sigma / np.sqrt(n))

    return p_reforme_diminution, p_reforme_stable

In [57]:
n = 30  # Nombre de fusées testées
p_reforme_diminution, p_reforme_stable = exercice6(n)

print(f"Probabilité de réformer le lot si la portée moyenne a diminué de 100 mètres : {p_reforme_diminution:.4f}")
print(f"Probabilité de réformer le lot si la portée moyenne est restée la même : {p_reforme_stable:.4f}")

Probabilité de réformer le lot si la portée moyenne a diminué de 100 mètres : 1.0000
Probabilité de réformer le lot si la portée moyenne est restée la même : 0.5000
