# **TP : √âtude de l'√âchantillonnage Statistique**  

### **Auteur : KHELID Lilya-Nada**  

---

## **Objectifs :**  
Dans ce notebook, nous allons explorer l‚Äôutilisation des **m√©thodes d‚Äô√©chantillonnage statistique** afin d‚Äôanalyser et d‚Äôestimer les caract√©ristiques d‚Äôune population √† partir d‚Äôun sous-ensemble de donn√©es. L‚Äôobjectif est de comprendre et d‚Äôimpl√©menter diff√©rentes strat√©gies d‚Äô√©chantillonnage pour assurer une estimation fiable et repr√©sentative.  

Les th√©matiques principales abord√©es sont :  

1. **Types d‚Äô√©chantillonnage et leurs implications sur les r√©sultats.**  
2. **M√©thodes de s√©lection d‚Äôun √©chantillon repr√©sentatif.**  
3. **Estimation des param√®tres d‚Äôune population √† partir d‚Äôun √©chantillon.**  
4. **Comparaison des erreurs d‚Äô√©chantillonnage et impact de la taille de l‚Äô√©chantillon.**  

---

### üì• Importation des librairies

In [1]:
import numpy as np
from scipy.stats import poisson,norm 

>### Exercice 1 : Contr√¥le progressif d'un lot d'articles

#### Param√®tre :
- $p$ : proportion d'articles d√©fectueux dans le lot

#### Objectif :
Retourne la probabilit√© de refus du lot et l'esp√©rance du nombre d'articles pr√©lev√©s.

#### R√®gle de d√©cision :
1. On pr√©l√®ve un article au hasard :
   - S'il est mauvais, on refuse le lot.
   - S'il est bon, on pr√©l√®ve un deuxi√®me article :
     - S'il est mauvais, on refuse le lot.
     - S'il est bon, on pr√©l√®ve un troisi√®me article :
       - S'il est mauvais, on refuse le lot.
       - S'il est bon, on accepte le lot.

In [46]:
def exercice1(p):
    # probabilit√© de refuser le lot
    P_refus = p + (1 - p) * p + (1 - p) ** 2 * p  
    
    # Esp√©rance 
    E_X = 1 + (1 - p) + (1 - p) ** 2  
    
    return P_refus, E_X

Exemple :

In [47]:
p = 0.1  # Exemple : 10% d'articles d√©fectueux
probabilite_refus, esperance_articles = exercice1(p)
print(f"Probabilit√© de refuser le lot : {probabilite_refus:.4f}")
print(f"Esp√©rance du nombre d'articles pr√©lev√©s : {esperance_articles:.2f}")

Probabilit√© de refuser le lot : 0.2710
Esp√©rance du nombre d'articles pr√©lev√©s : 2.71


>#### Exercice 2 : Contr√¥le d'un lot avec un √©chantillonnage fixe

##### **Param√®tres :**  
- **n1** : taille du premier √©chantillon  
- **k1** : seuil d'acceptation du premier √©chantillon  
- **Œ±** : proportion maximale de d√©chets tol√©r√©e  
- **n2** : taille du deuxi√®me √©chantillon (dans le cas de la deuxi√®me r√®gle)  
- **k2** : seuil d'acceptation pour l'√©chantillon de taille 200  

##### **Retourne :**  
- **Risque d'accepter un lot contenant plus de 8% de d√©chets**  
- **Risque de refuser un lot contenant moins de 3% de d√©chets**  
- **Risques √©quivalents avec un √©chantillon plus grand**  

In [48]:
def exercice2(n1=100, k1=3, alpha=0.08, n2=200, k2=9):

    # Risque d'accepter un lot contenant plus de 8% de d√©chets
    p_risque1 = 1 - poisson.cdf(k1, n1 * alpha)
    
    # Risque de refuser un lot contenant moins de 3% de d√©chets
    p_risque2 = poisson.cdf(k1, n1 * 0.03)
    
    # Risque d'accepter un lot contenant plus de 8% de d√©chets avec un √©chantillon plus grand
    p_risque1_2 = 1 - poisson.cdf(k2, n2 * alpha)
    
    # Risque de refuser un lot contenant moins de 3% de d√©chets avec un √©chantillon plus grand
    p_risque2_2 = poisson.cdf(k2, n2 * 0.03)
    
    return p_risque1, p_risque2, p_risque1_2, p_risque2_2

In [49]:
risques = exercice2()
print(f"Risque d'accepter un lot contenant plus de 8% de d√©chets (n=100) : {risques[0]:.4f}")
print(f"Risque de refuser un lot contenant moins de 3% de d√©chets (n=100) : {risques[1]:.4f}")
print(f"Risque d'accepter un lot contenant plus de 8% de d√©chets (n=200) : {risques[2]:.4f}")
print(f"Risque de refuser un lot contenant moins de 3% de d√©chets (n=200) : {risques[3]:.4f}")

Risque d'accepter un lot contenant plus de 8% de d√©chets (n=100) : 0.9576
Risque de refuser un lot contenant moins de 3% de d√©chets (n=100) : 0.6472
Risque d'accepter un lot contenant plus de 8% de d√©chets (n=200) : 0.9567
Risque de refuser un lot contenant moins de 3% de d√©chets (n=200) : 0.9161


>#### Exercice 3 : Comparaison des m√©thodes A et B pour l'acceptation d'un lot  

##### **Param√®tres :**  
- **n** : taille de l'√©chantillon pr√©lev√©  
- **a, b** : seuils de rejet et d'acceptation  
- **Œº** : moyenne des diam√®tres  
- **œÉ** : √©cart-type des diam√®tres  

##### **Retourne :**  
- **Probabilit√© de rejeter un lot avec la m√©thode A**  
- **Probabilit√© de rejeter un lot avec la m√©thode B**  

In [50]:
def exercice3(n, a, b, mu=110, sigma=8):
    
    # M√©thode A : Test bas√© sur la moyenne
    p_rej_A = 1 - norm.cdf(b, loc=mu, scale=sigma / np.sqrt(n)) + norm.cdf(a, loc=mu, scale=sigma / np.sqrt(n))
    
    # M√©thode B : Test bas√© sur le comptage des d√©fectueux
    p_defaut = 0.0124  # Proportion de d√©chets quand la machine est bien r√©gl√©e
    p_rej_B = 1 - poisson.cdf(8, 300 * p_defaut)
    
    return p_rej_A, p_rej_B


In [51]:
n = 30  # Taille de l'√©chantillon
a, b = 95, 125  # Seuils d'acceptation
p_rej_A, p_rej_B = exercice3(n, a, b)

print(f"Probabilit√© de rejet avec la m√©thode A : {p_rej_A:.4f}")
print(f"Probabilit√© de rejet avec la m√©thode B : {p_rej_B:.4f}")

Probabilit√© de rejet avec la m√©thode A : 0.0000
Probabilit√© de rejet avec la m√©thode B : 0.0141


>#### Exercice 4 : Probabilit√© qu'une mesure d√©passe 7.7 ppm

##### **Param√®tres :**  
- **Œº** : moyenne de la teneur du polluant  
- **œÉ** : √©cart-type de la teneur du polluant  
- **mesure_erreur** : √©cart-type de l'erreur de mesure  

##### **Retourne :**  
- **Probabilit√© qu'une mesure unique d√©passe 7.7 ppm**  
- **Probabilit√© que la moyenne de deux mesures d√©passe 7.7 ppm**  

In [52]:
def exercice4(mu=7.6, sigma=0.04, mesure_erreur=0.03):

    # √âcart-type combin√© pour une seule mesure
    sigma_total_1 = np.sqrt(sigma**2 + mesure_erreur**2)
    p_1 = 1 - norm.cdf(7.7, loc=mu, scale=sigma_total_1)

    # √âcart-type combin√© pour la moyenne de deux mesures
    sigma_total_2 = np.sqrt(sigma**2 / 2 + mesure_erreur**2 / 2)
    p_2 = 1 - norm.cdf(7.7, loc=mu, scale=sigma_total_2)

    return p_1, p_2

In [53]:
p_1, p_2 = exercice4()

print(f"Probabilit√© qu'une mesure d√©passe 7.7 ppm : {p_1:.4f}")
print(f"Probabilit√© que la moyenne de 2 mesures d√©passe 7.7 ppm : {p_2:.4f}")

Probabilit√© qu'une mesure d√©passe 7.7 ppm : 0.0228
Probabilit√© que la moyenne de 2 mesures d√©passe 7.7 ppm : 0.0023


>#### Exercice 5 : D√©termination du nombre d'√©chantillons n√©cessaires pour un test de r√©sistance  

##### **Param√®tres :**  
- **n** : nombre d'√©prouvettes test√©es  
- **x** : seuil de r√©sistance moyen pour accepter ou refuser le lot  
- **œÉ** : √©cart-type de la r√©sistance des √©prouvettes (fix√© √† 20 kg/mm¬≤)  

##### **Retourne :**  
- **Nombre minimal d'√©prouvettes pour que la probabilit√© d'accepter un lot de r√©sistance ‚â§ 80 soit au plus 0.001**  
- **Nombre minimal d'√©prouvettes pour que la probabilit√© de refuser un lot de r√©sistance ‚â• 100 soit au plus 0.01**  

In [54]:
def exercice5(n, x, sigma=20):

    # Seuils de probabilit√© pour 80 kg/mm¬≤ et 100 kg/mm¬≤
    z1 = norm.ppf(0.001)  # Quantile pour probabilit√© 0.001
    z2 = norm.ppf(0.99)   # Quantile pour probabilit√© 0.01

    # Calcul du nombre minimal d'√©prouvettes √† tester
    n_min = ((z1 * sigma) / (80 - x))**2
    n_max = ((z2 * sigma) / (100 - x))**2

    return np.ceil(n_min), np.ceil(n_max)

In [55]:
n_min, n_max = exercice5(n=10, x=90)  # Exemple avec un seuil de 90 kg/mm¬≤

print(f"Nombre minimal d'√©prouvettes pour que la probabilit√© d'accepter un lot ‚â§ 80 soit au plus 0.001 : {n_min}")
print(f"Nombre minimal d'√©prouvettes pour que la probabilit√© de refuser un lot ‚â• 100 soit au plus 0.01 : {n_max}")

Nombre minimal d'√©prouvettes pour que la probabilit√© d'accepter un lot ‚â§ 80 soit au plus 0.001 : 39.0
Nombre minimal d'√©prouvettes pour que la probabilit√© de refuser un lot ‚â• 100 soit au plus 0.01 : 22.0


>#### Exercice 6 : V√©rification de l'√©tat d'un lot de fus√©es apr√®s stockage de 2 ans  

##### **Param√®tres :**  
- **n** : nombre de fus√©es test√©es  
- **Œº** : port√©e moyenne initiale des fus√©es (2000 m√®tres)  
- **œÉ** : √©cart-type de la port√©e des fus√©es (100 m√®tres)  
- **Œî** : diminution de la port√©e moyenne consid√©r√©e (100 m√®tres)  

##### **Retourne :**  
- **Probabilit√© de r√©former le lot si la port√©e moyenne a diminu√© de 100 m√®tres**  
- **Probabilit√© de r√©former le lot si la port√©e moyenne n'a pas chang√©**  

In [56]:
def exercice6(n, mu=2000, sigma=100, delta=100):

    # Probabilit√© de reformer le lot si la port√©e moyenne a diminu√© de 100 m√®tres
    p_reforme_diminution = 1 - norm.cdf(mu - delta, loc=mu, scale=sigma / np.sqrt(n))
    
    # Probabilit√© de reformer le lot si la port√©e moyenne est rest√©e stable
    p_reforme_stable = 1 - norm.cdf(mu, loc=mu, scale=sigma / np.sqrt(n))

    return p_reforme_diminution, p_reforme_stable

In [57]:
n = 30  # Nombre de fus√©es test√©es
p_reforme_diminution, p_reforme_stable = exercice6(n)

print(f"Probabilit√© de r√©former le lot si la port√©e moyenne a diminu√© de 100 m√®tres : {p_reforme_diminution:.4f}")
print(f"Probabilit√© de r√©former le lot si la port√©e moyenne est rest√©e la m√™me : {p_reforme_stable:.4f}")

Probabilit√© de r√©former le lot si la port√©e moyenne a diminu√© de 100 m√®tres : 1.0000
Probabilit√© de r√©former le lot si la port√©e moyenne est rest√©e la m√™me : 0.5000
