# Exercices Pratiques : Estimation Ponctuelle en Statistique Inférentielle

#### En R

Ce notebook présente des exercices pratiques pour apprendre et comprendre le concept d'**estimation ponctuelle** en utilisant R et Python.

L'estimation ponctuelle consiste à utiliser les données d'un échantillon pour calculer une valeur unique, appelée "estimation ponctuelle", qui sert de meilleure estimation d'un paramètre inconnu de la population (comme la moyenne, la variance ou une proportion).

**Note** : Pour exécuter les cellules R, vous devez avoir installé un noyau R pour Jupyter (par exemple, `IRkernel`). Si vous utilisez un environnement Python, vous pouvez utiliser la bibliothèque `rpy2` et le magic `%%R` en tête de chaque cellule R.

### Exercice 1 : Estimer la taille moyenne d'une population

Imaginez que vous disposez d'un jeu de données sur la taille en centimètres d'un échantillon d'individus. Votre objectif est d'estimer la taille moyenne de la population entière.

#### En Python

In [None]:
import numpy as np

# Générer un échantillon de données (simulées pour l'exercice)
taille_echantillon = np.array([175, 182, 169, 171, 178, 185, 163, 176, 188, 170])

# Calculer la moyenne de l'échantillon
moyenne_estimee = np.mean(taille_echantillon)
print(f"L'estimation ponctuelle de la taille moyenne est : {moyenne_estimee}")

# Calculer la médiane comme autre estimateur de la tendance centrale
mediane_estimee = np.median(taille_echantillon)
print(f"L'estimation ponctuelle de la taille médiane est : {mediane_estimee}")

L'estimation ponctuelle de la taille moyenne est : 175.7
L'estimation ponctuelle de la taille médiane est : 175.5


### Exercice 2 : Estimer la proportion d'électeurs

Supposons que vous ayez les résultats d'un sondage pour une élection à deux candidats. Vous voulez estimer la proportion d'électeurs qui ont l'intention de voter pour le candidat A.

#### En R

#### En Python

In [None]:
import numpy as np

# Données de sondage (1 pour le candidat A, 0 pour le candidat B)
intentions_vote = np.array([1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0])

# Calculer la proportion d'intentions de vote pour le candidat A
proportion_estimee = np.mean(intentions_vote)
print(f"L'estimation ponctuelle de la proportion d'électeurs pour le candidat A est : {proportion_estimee}")

L'estimation ponctuelle de la proportion d'électeurs pour le candidat A est : 0.5833333333333334


### Exercice 3 : Estimer la variance des notes d'un examen

Vous avez les notes d'un échantillon d'étudiants à un examen et vous souhaitez estimer la variance des notes pour l'ensemble de la population étudiante.

#### En R

#### En Python

In [None]:
import numpy as np

# Notes d'un échantillon d'étudiants
notes_examen = np.array([85, 92, 78, 88, 95, 81, 75, 89, 93, 80])

# Calculer la variance de l'échantillon (avec ddof=1 pour un estimateur non biaisé)
# ddof signifie 'Delta Degrees of Freedom'. Mettre ddof=1 revient à diviser par (n-1) au lieu de n.
variance_estimee = np.var(notes_examen, ddof=1)
print(f"L'estimation ponctuelle de la variance des notes est : {variance_estimee}")

L'estimation ponctuelle de la variance des notes est : 47.15555555555556


### Aller plus loin : La Méthode du Maximum de Vraisemblance

Une autre technique importante pour l'estimation ponctuelle est la méthode du maximum de vraisemblance (Maximum Likelihood Estimation - MLE). Elle consiste à trouver la valeur du paramètre qui maximise la probabilité d'observer les données de l'échantillon.

Par exemple, pour une variable suivant une loi de Bernoulli (comme dans notre sondage de l'exercice 2), l'estimateur du maximum de vraisemblance pour la proportion de succès est simplement la moyenne de l'échantillon, ce que nous avons déjà calculé !

In [1]:
import numpy as np

# ----------------------------
# PARAMÈTRES
# ----------------------------
Nsim = 10000     # nombre de simulations
n = 30           # taille d'échantillon

# --- Loi normale ---
mu = 5
sigma2 = 4       # variance connue
sigma = np.sqrt(sigma2)

# --- Loi exponentielle ---
lambda_true = 2


# ==============================
# 1) LOI NORMALE
# ==============================
means_normal = []

for _ in range(Nsim):
    sample = np.random.normal(mu, sigma, n)
    means_normal.append(np.mean(sample))

means_normal = np.array(means_normal)

# Théorie
var_theo_normal = sigma2 / n

print("=== LOI NORMALE ===")
print("Valeur théorique de µ :", mu)
print("Moyenne empirique des estimateurs :", means_normal.mean())
print("Variance théorique de l'estimateur :", var_theo_normal)
print("Variance empirique :", means_normal.var())


# ==============================
# 2) LOI EXPONENTIELLE
# ==============================
lambdas_exp = []

for _ in range(Nsim):
    sample = np.random.exponential(1/lambda_true, n)
    lambdas_exp.append(1 / sample.mean())  # EMV : 1/moyenne

lambdas_exp = np.array(lambdas_exp)

# Théorie : Var(λ̂) = λ² / n
var_theo_exp = (lambda_true**2) / n

print("\n=== LOI EXPONENTIELLE ===")
print("Valeur théorique de λ :", lambda_true)
print("Moyenne empirique des estimateurs :", lambdas_exp.mean())
print("Variance théorique :", var_theo_exp)
print("Variance empirique :", lambdas_exp.var())

=== LOI NORMALE ===
Valeur théorique de µ : 5
Moyenne empirique des estimateurs : 4.997605969978393
Variance théorique de l'estimateur : 0.13333333333333333
Variance empirique : 0.13107208881650387

=== LOI EXPONENTIELLE ===
Valeur théorique de λ : 2
Moyenne empirique des estimateurs : 2.0663290678268624
Variance théorique : 0.13333333333333333
Variance empirique : 0.15178847360419373
