# Notion d'erreur sur une mesure

Comme nous l'avons discuté dans le chapitre précédent, un des objectifs de la physique expérimentale est d'estimer les paramètres physiques des modèles que l'on considère, et ce avec une certaine précision.
En effet si on se donne un modèle donnant la distribution de mesures expérimentales en fonction d'un ou plusieurs paramètres, on va vouloir tester la validité de ce modèle en estimant tout d'abord les valeurs des paramètres de ce modèle.
Ces estimations sont obtenues à partir d'un échantillon de mesures de certaines quantités issues d'une ou plusieurs expériences.
En général, on va associer à chaque estimation une \textbf{incertitude} (aussi appelée \textbf{erreur}) qui caractérise la précision que l'on \textit{pense} avoir sur cette estimation.
Cette incertitude permet aussi de comparer deux estimations, ou bien une estimation et une valeur théorique attendue et décider si elles sont en accord.

## Notion d'estimateurs

Un \textbf{estimateur} $\hat{A}$ d'un paramètre physique $A$ est une fonction des mesures expérimentales $\vec{x}$ qui renvoie une valeur approchée de la vraie valeur $A_0$ de $A$.
Puisque $\hat{A}$ est une fonction de mesures, c'est une variable aléatoire avec une pdf associée $f_{\hat{A}}$.

Intuitivement, on peut voir que la valeur moyenne de cet estimateur $\int a\times f_{\hat{A}}\mathrm{d}a$ doit être proche (ou égale) de sa valeur vraie et que la pdf de cet estimateur doit être relativement peu étalé afin qu'une réalisation de cet estimateur (avec des mesures expérimentales de $\vec{x}$) ait de grandes chances d'être proche de la valeur vraie.

Un bon estimateur doit donc respecter plusieurs propriétés:
\begin{itemize}
    \item Un estimateur doit converger vers la valeur vraie du paramètre associé.
    Si on considère un échantillon de mesures $\vec{x}$ de taille infinie, l'estimation de $A$ avec $\hat{A}$ doit être strictement égale à la valeur vraie $A_0$:
    \begin{equation}
        \lim _{n\rightarrow \infty} \hat{A} = A_0.
    \end{equation}
    \item L'estimateur ne doit pas être biaisé, c'est à dire que la moyenne (en probabilité) de $\hat{A}$ (que l'on note $\bar{\hat{A}}$ et calcule avec l'équation \eqref{eq:esperance}) doit être égale à la valeur vraie $A_0$.
    On définit le biais comme l'écart entre la valeur moyenne et la valeur vraie:
    \begin{equation}\label{eq:def-biais}
        b(\hat{A}) = \mathbb{E}(\hat{A}) - A_0.
    \end{equation}
    Un estimateur peut être non biaisé asymptotiquement, c'est-à-dire non biaisé pour une taille d'échantillon infinie.
    Cette propriété et la précédente sont reliées: on peut démontrer qu'un estimateur convergent vers la valeur vraie $A_0$ est non biaisé asymptotiquement.
    \item Un estimateur doit être efficace, c'est-à-dire qu'il doit converger le plus rapidement possible vers la vraie valeur du paramètre $A$.
    Grossièrement, plus un estimateur converge rapidement, plus son étalement diminue rapidement à mesure que la taille de l'échantillon de mesures $\vec{x}$ augmente.
\end{itemize}

## Définition d'un erreur

Souvent, quand on parle d'estimation d'un paramètre, on sous-entend que l'estimation donne une unique valeur numérique du paramètre estimé.
Ce type d'estimation renvoie à l'idée que l'estimateur est la \textit{valeur centrale de la série de mesures}: les estimateurs associés sont appelés \textbf{estimateurs paramétriques} et doivent respecter les propriétés de la section précédente.

Au lieu de donner une valeur unique estimant le paramètre $A$, on pourrait aussi définir un intervalle $[a_1, a_2]$ qui contient vraisemblablement la valeur vraie.
La largeur de cet intervalle correspond à la précision de la mesure ou des mesures que l'on a fait.
Par exemple, lorsqu'on utilise un pèse-personne pour estimer sa masse, la valeur affichée va être de $71.3~\mathrm{kg}\pm 0.1~\mathrm{kg}$, où le $\pm 0.1~\mathrm{kg}$ est la précision de la balance avancée par le constructeur de la balance: cela définit donc un intervalle $[ 71.2~\mathrm{kg}, 71.4~\mathrm{kg}]$ dans lequel il est vraisemblable que notre vraie masse se trouve réellement.
Ce type d'estimation du paramètre se nomme \textbf{estimation par intervalle}.

La définition d'un intervalle contenant vraisemblablement la valeur vraie revient finalement à définir une valeur centrale de l'intervalle comme étant la valeur de l'estimateur $\hat{A}$ et une \textbf{erreur} sur cet estimateur, notée généralement $\sigma _{\hat{A}}$, correspondant à l'étalement des valeurs vraisemblables de $A_0$.
Si cet étalement tend vers 0 lorsque la taille de l'échantillon tend vers l'infini ou 
\begin{equation}
    \lim _{n\rightarrow \infty} \sigma _{\hat{A}}^2 = 0,
\end{equation}
l'estimateur $\hat{A}$ est convergent: dans la limite infinie, on a alors un estimateur dont la moyenne est la valeur vraie $A_0$ et de variance nulle donc cet estimateur donne la vraie valeur de $A$.

Un point important à remarquer est qu'à chaque estimation de l'intervalle est associée notre certitude de la présence de la valeur vraie dans cet intervalle: être sûr et certain n'est bien évidemment pas la même chose qu'en être sur à 50~\% ou pas sûr du tout.
Aussi, un intervalle correspondant à un niveau de certitude de 95~\% relativement large pourrait être équivalent à un niveau de taille plus faible avec une certitude associée plus faible.
Généralement, en sciences expérimentales, les intervalles que l'on définit ont une certitude associée de 68~\%: ce choix à priori arbitraire est en fait relié aux intervalles pour des pdf gaussiennes.
Cependant nous n'aborderons pas en détails cette notion, mais il est important de garder en tête cela lorsque l'on mesure des quantités en physique expérimentale: à quel point est on sûr que l'intervalle que l'on vient de définir contient la valeur vraie du paramètre?

## Quelques exemples d'estimateurs empiriques

Un estimateur très répandu est celui de l'estimateur $\hat{\mu}$ de la moyenne d'un échantillon de valeurs $\left\{x_i\right\}$ non corrélée entre elles.
Si chaque valeur $x_i$ est une réalisation d'une même variable $X$, les $x_i$ valent en moyenne $\mathbb{E}(x_i) = \mu$ et ont une variance $var(x_i) = \sigma ^2$.
On peut vérifier que cet estimateur, appelé \textbf{estimateur de la moyenne empirique} n'est pas biaisé.
En effet, on peut démontrer
\begin{equation}\label{eq:estimateur-moyenne}
    \mathbb{E}(\hat{\mu}) = \mathbb{E}\left( \frac{1}{n}\sum _i x_i \right) = \frac{1}{n}\sum _i \mathbb{E}(x_i) = \frac{1}{n} \sum _i \mu = \mu,
\end{equation}
ce qui veut dire que le biais de cet estimateur est nul d'après l'équation \eqref{eq:def-biais}:
\begin{equation}
    b(\hat{\mu}) = \mathbb{E}(\hat{\mu}) - \mu = 0.
\end{equation}

On peut étudier la vitesse de convergence de cet estimateur en calculant la variance de cet estimateur\footnote{
Pour réaliser ce calcul, on utilise l'hypothèse d'indépendance des valeurs $x_i$ afin de pouvoir écrire $var \left( \sum _i x_i \right) = \sum _i var \left(  x_i  \right)$.}:
\begin{equation}
    \sigma ^2 _{\hat{\mu}} = var\left( \hat{\mu} \right) = var \left( \frac{1}{n} \sum _i x_i  \right) = \frac{1}{n^2} \sum _i var \left(  x_i  \right) = \frac{1}{n^2}  \sum _i \sigma ^2 = \frac{\sigma^2}{n}.
\end{equation}
On voit donc que pour un échantillon de taille infinie, la variance de cet estimateur vaut zéro, ce qui en fait un estimateur convergent.
On peut aussi remarquer la vitesse de convergence de cet estimateur.
En effet, l'incertitude notée $\Delta \hat{\mu}$ sur cet estimateur vaut:
\begin{equation}\label{eq:erreur-moyenne}
    \Delta \hat{\mu} = \frac{\sigma}{\sqrt{n}},
\end{equation}
avec $\sigma$ représentant l'erreur sur les valeurs des $x_i$.
Cela veut dire que l'incertitude $\Delta \hat{\mu}$ sur une moyenne est toujours plus faible que celle sur les valeurs individuelles et qu'il est toujours possible d'améliorer l'incertitude $\Delta \hat{\mu}$: si on augmente la taille de l'échantillon par un facteur 4, on réduit l'incertitude sur la moyenne par un facteur 2.

Un autre estimateur empirique d'intérêt est celui de la variance:
\begin{equation}
    \hat{\sigma} ^2 = \frac{1}{n-1} \sum _{i=0} ^n (x_i - \bar{x})^2.
\end{equation}
De façon similaire à la moyenne, on peut démontrer que cet estimateur est non biaisé avec une moyenne $\mu _{\hat{\sigma}^2} = \sigma ^2$ correspondant à la valeur vraie.
On peut remarquer que cet estimateur diffère de la définition statistique de la variance donnée par l'équation \eqref{eq:def-variance-stats} par un facteur $\frac{n}{n-1}$: cela semble assez évident puisque si le nombre de mesures vaut $n=1$, on ne peut pas estimer la variance de l'échantillon.
Il est important aussi de noter que cet estimateur de la variance ne correspond pas à l'erreur sur la moyenne que nous avons établie avec l'équation \eqref{eq:erreur-moyenne}: en effet, celui-ci ne diminue pas lorsque $n$ augmente, mais correspond véritablement à la variance de la variable aléatoire de mesure.

## Classification des erreurs

L'estimateur de la moyenne \eqref{eq:estimateur-moyenne} est un estimateur qui converge vers la valeur moyenne vraie de la variable aléatoire associée.
Si on répète les mesures, les échantillons obtenus vont vraisemblablement se répartir autour de cette valeur vraie: certaines valeurs seront au dessus et certains en dessous.

L'erreur que l'on fait alors sur la moyenne \eqref{eq:erreur-moyenne} est appelée \textbf{erreur statistique}, puisque due à la statistique de l'échantillon collecté.
Ce type d'erreur se distingue des erreurs dites \textbf{systématiques} qui se caractérisent par le fait que des mesures répétées vont donner \textbf{systématiquement} des valeurs supérieures à la valeur vraie ou bien des valeurs inférieures à la valeur vraie.
Si l'on faisait la moyenne de mesures entachées par des erreurs systématiques, celle-ci ne va pas tendre vers la valeur vraie de la moyenne, mais vers une valeur systématiquement plus grande ou plus faible que la valeur vraie correspondant à un biais.

Il est souvent difficile de détecter ce type d'erreur puisqu'on ne connait généralement pas la valeur vraie (c'est d'ailleurs pour la déterminer que l'on fait des mesures...).
Il est donc nécessaire de réfléchir aux phénomènes physiques qui peuvent causer ce type d'erreurs: il est en effet parfois possible de corriger ces biais.
Si cela n'est pas possible ou bien si l'on n'est pas très sur de la correction que l'on fait, on va alors associer à l'estimateur une valeur correspondant à une estimation de notre incertitude sur ce biais: on l'appellera \textbf{incertitude systématique}.
Cette valeur s'ajoutera alors à la valeur sur l'incertitude statistique, par exemple celle donnée par l'équation \eqref{eq:erreur-moyenne} dans le cas de l'estimateur de la moyenne.

Les erreurs systématiques peuvent donc provenir de plusieurs sources:
\begin{itemize}
    \item la résolution du détecteur due à la précision de lecture de l'évaluateur (lecture d'une distance grâce à une règle graduée plus ou moins finement, lecture d'une quantité sur un instrument dont le cadrant affiche des valeurs changeantes);
    \item des facteurs environnementaux causant des effets sur le dispositif de mesure (par exemple, les changements de température de la pièce entre le matin et l'après-midi peuvent causer des variabilités dans la mesure d'une même quantité par un instrument);
    \item la variabilité de la calibration de l'instrument de mesure (en recalibrant l'instrument et mesurant la même quantité, la valeur donnée par l'instrument pourrait changer);
    \item la dérive ou le vieillissement d'un instrument;
    \item les erreurs de l'expérimentateur lors du report des mesures (souvent les plus dures à déceler...).
\end{itemize}

## \label{sec:propagation-erreurs}Propagation des erreurs

Lorsque des mesures sont faites, les quantités d'intérêt doivent être calculées à l'aide de formules ou de fonctions impliquant ces données.
Cependant ces fonctions ont souvent des paramètres qui possèdent des incertitudes qu'il faut prendre en compte ou \textbf{propager} dans le calcul de l'incertitude sur la grandeur d'intérêt.
Si, par exemple, la quantité d'intérêt $z$ dépend d'une mesure $x$ par la fonction $f(x)$ avec $y$ est un paramètre de cette fonction, l'incertitude sur $z$ sera $\Delta z = \Delta f(x,\Delta x, y, \Delta y)$.

Une bonne approximation pour le calcul de l'incertitude $\Delta f$ sur la quantité $f$ dépendant de $n$ variables $x_i$ est donnée par 
\begin{equation}\label{sec:propagation-erreur-correlee}
  \Delta f^2 = \sum _{i=1}^n \left(\frac{\partial f}{\partial x_i}\right) ^2 \Delta x_i ^2 + 2 \sum _{i, j<i} cov(x_i, x_j) \left\vert \frac{\partial f}{\partial x_i} \frac{\partial f}{\partial x_j} \right\vert.
\end{equation}
Si les variables $x_i$ ne sont pas corrélées entre elles (i.e. $cov (x_i, x_j)=0$), alors l'expression se simplifie en 
\begin{equation}\label{sec:propagation-erreur-non-correlee}
  \Delta f^2 = \sum _{i=1}^n \left(\frac{\partial f}{\partial x_i}\right) ^2 \Delta x_i ^2.
\end{equation}


```{admonition} Exemple
Quelques exemples de formules classiques de propagation d'incertitudes où on néglige les corrélations entre les variables:
\begin{itemize}
  \item[-] pour $f(x,y) = x+y$, 
  \begin{equation}
    \Delta f^2 = \Delta x^2 + \Delta y^2;
  \end{equation}
  \item[-] pour $f(x,y) = x-y$, 
  \begin{equation}
   \Delta f^2 = \Delta x^2 + \Delta y^2;
  \end{equation}
  \item[-] pour $f(x,y) = x\times y$, 
  \begin{equation}
    \frac{\Delta f^2}{f^2} = \frac{\Delta x^2}{x^2} + \frac{\Delta y^2}{y^2};
  \end{equation}
  \item[-] pour $f(x,y) = \frac{x}{y}$, 
  \begin{equation}
    \frac{\Delta f^2}{f^2} = \frac{\Delta x^2}{x^2} + \frac{\Delta y^2}{y^2};
  \end{equation}
  \item[-] pour $f(x) = x^n$, 
  \begin{equation}
    \frac{\Delta f}{f} = n\frac{\Delta x}{x}.
  \end{equation}
\end{itemize}

```



Il y a d'autres méthodes pour propager les erreurs sur une quantité; notamment, QExPy propose une méthode par Monte Carlo qui permet d'évaluer cette quantité quelque soit la fonction $f$.



Il y a d'autres méthodes pour propager les erreurs sur une quantité; notamment, QExPy propose une méthode par Monte Carlo qui permet d'évaluer cette quantité quelque soit la fonction $f$.
