<a href="https://colab.research.google.com/github/Yasmine-edl/Math-matiques-statistiques/blob/main/Statistiques_et_probabilit%C3%A9s.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# model_statistiques.py

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error
from scipy.stats import binom, poisson


# Activité 1 : Loi de Bernoulli

def activite_1_bernoulli(path):
    df = pd.read_csv(path)
    p = df['Defectueux'].mean()
    print(f"\n[Activité 1] Estimation de p (défaut) : {p:.4f}")


# Activité 2 : Loi Binomiale

def activite_2_binomiale(path):
    df = pd.read_csv(path)
    moyenne = df['Puces_defectueuses'].mean()
    proportion = moyenne / 20

    print(f"\n[Activité 2] Proportion moyenne de défauts : {proportion:.4f}")

    plt.hist(df['Puces_defectueuses'], bins=range(0, 21), edgecolor='black', align='left')
    plt.xlabel("Nombre de puces défectueuses")
    plt.ylabel("Nombre de lots")
    plt.title("Histogramme des défauts par lot")
    plt.grid(True)
    plt.show()

    proba_5plus = (df['Puces_defectueuses'] >= 5).mean()
    print(f"Probabilité qu’un lot ait ≥ 5 défauts : {proba_5plus:.4f}")
    print(f"Pourcentage de lots rejetés : {proba_5plus * 100:.2f} %")

    # Recherche du taux p maximal
    p_vals = np.linspace(0.01, 0.1, 100)
    seuil_p = max([p for p in p_vals if 1 - binom.cdf(4, 20, p) <= 0.05])
    print(f"Taux de défaut max pour ≤ 5 % de rejet : {seuil_p:.4f}")


# Activité 3 : Loi de Poisson

def activite_3_poisson():
    lambda_base = 30
    employe_capacite = 5

    # 1. Dimensionnement (sous 10 % de risque)
    n_employes = 0
    while poisson.cdf(n_employes * employe_capacite, lambda_base) < 0.90:
        n_employes += 1
    print(f"\n[Activité 3] Employés nécessaires pour <10% d’engorgement : {n_employes}")

    # 2. Proba > 40 commandes
    proba_plus_40 = 1 - poisson.cdf(40, lambda_base)
    print(f"Proba > 40 commandes/h : {proba_plus_40:.4f}")

    # 3. Capacité camion (60 commandes / 2h)
    lambda_2h = lambda_base * 2
    proba_debordement = 1 - poisson.cdf(60, lambda_2h)
    print(f"Proba camion dépassé (2h, 60 commandes) : {proba_debordement:.4f}")

    # 4. Samedi +20%
    lambda_samedi = lambda_base * 1.2
    n_employes_samedi = 0
    while poisson.cdf(n_employes_samedi * employe_capacite, lambda_samedi) < 0.95:
        n_employes_samedi += 1
    print(f"Employés nécessaires samedi (<5% engorgement) : {n_employes_samedi}")

    # 5. Pic exceptionnel (Black Friday)
    lambda_pic = 60
    n_employes_pic = 0
    while poisson.cdf(n_employes_pic * employe_capacite, lambda_pic) < 0.95:
        n_employes_pic += 1
    print(f"Si λ=60, employés requis pour <5% d’engorgement : {n_employes_pic}")
    print("🔎 Discussion : selon le coût, embaucher temporairement ou doubler les camions peut être étudié.")


# Activité 4 : Monte Carlo (estimation de π)

def activite_4_monte_carlo(n_points=10000):
    np.random.seed(42)
    x = np.random.uniform(-1, 1, n_points)
    y = np.random.uniform(-1, 1, n_points)
    inside_circle = x**2 + y**2 <= 1
    pi_estimate = 4 * np.mean(inside_circle)
    relative_error = abs(np.pi - pi_estimate) / np.pi

    print(f"\n[Activité 4] Estimation de π avec {n_points} points : {pi_estimate:.5f}")
    print(f"Erreur relative : {relative_error:.5%}")

    plt.figure(figsize=(6,6))
    plt.scatter(x[inside_circle], y[inside_circle], color='green', s=1, label='Dans le cercle')
    plt.scatter(x[~inside_circle], y[~inside_circle], color='red', s=1, label='Hors du cercle')
    plt.title("Méthode de Monte Carlo pour π")
    plt.axis('equal')
    plt.legend()
    plt.grid(True)
    plt.show()

# Main

if __name__ == "__main__":
    activite_1_bernoulli("Dataset_composants_defectueux.csv")
    activite_2_binomiale("Dataset_lot_puce_defectueuses.csv")
    activite_3_poisson()
    activite_4_monte_carlo(10000)
    activite_4_monte_carlo(100000)


KeyError: 'Defectueux'