# Moyenne et variance d'un modèle linéaire sans dépendance

## Introduction

$\newcommand{\vect}[1]{{\mathbf{\boldsymbol{{#1}}}}}$

Soit $\vect{X} = (X_1,..., X_p)\in\mathbb{R}^p$ le vecteur aléatoire d’entrée. On note $f$ la densité de probabilité du vecteur $\vect{X}$. 

Soit $g$ une fonction de $\mathbb{R}^p$ vers $\mathbb{R}$. On considère la variable aléatoire :

$$
Y = g(\vect{X}).
$$

Nous allons estimer l'espérance de $Y$ :

$$
E(Y) = \int_{\mathbb{R}^p} g(\vect{x}) f(\vect{x}) d\vect{x}.
$$

De plus, nous allons estimer la variance de $Y$ :

$$
V(Y) = E\left[(Y-E(Y))^2\right].
$$

Soit $\mu\in\mathbb{R}^p$ la moyenne du vecteur aléatoire $\vect{X}$ :

$$
\mu = E(\vect{X}).
$$

Soit $\sigma_i^2\in\mathbb{R}$ la variance de la i-ème marginale de $\vect{X}$ :

$$
\sigma_i^2 = V(X_i)
$$

pour $i=1,...,p$.

Supposons que $g$ est linéaire :

\begin{align*}
Y 
&= \beta_0 + \beta_1 X_1 + ... + \beta_p X_p
\end{align*}

pour tout $\vect{X}\in\mathbb{R}^p$, où $\beta_i\in\mathbb{R}$, pour $i=0,...,p$. 

Alors la linéarité de l'espérance implique :

\begin{align*}
E(Y) 
&= \beta_0 + \beta_1 E(X_1) + ... + \beta_p E(X_p) \\
&= \beta_0 + \beta_1 \mu_1 + ... + \beta_p \mu_p.
\end{align*}

De plus, les propriétés de la variance et l'indépendance des marginales du vecteur aléatoire $X$ impliquent :

\begin{align*}
V(Y) 
&= \beta_1^2 V(X_1) + ... + \beta_p^2 V(X_p) \\
&= \beta_1^2 \sigma_1^2 + ... + \beta_p^2 \sigma_p^2.
\end{align*}

Le facteur d'importance la i-ème variable d'entrée par rapport à la sortie est :

$$
\eta_i = \frac{\beta_i^2 \sigma_i^2}{V(Y)}
$$

pour $i=1,...,p$.

La somme des facteurs d'importance est égale à 1 pour un modèle linéaire. 

L'indice SRC de la ième variable est :

$$
SRC_i = \frac{\beta_i \sigma_i}{\sqrt{V(Y)}}
$$

pour $i=1,...,p$.

Ce dernier coefficient a l'avantage d'indiquer le sens de variation : si l'indice est négatif, c'est que la sortie diminue lorsque l'entrée correspondante augmente. Cela ne peut pas être mesuré dans le coefficient $\eta_i$, qui est toujours positif. 

Note: dans OpenTURNS 1.17, la fonction `CorrelationAnalysis_SRC` retourne le facteur d'importance $\eta_i$ et la fonction `CorrelationAnalysis_SignedSRC` retourne $SRC_i$.

Reference : https://github.com/openturns/openturns/issues/1753

## Réduction de la variance lorsqu'une variable est fixée

On peut utiliser les facteurs d'importance pour quantifier la réduction de la variance de la sortie lorsqu'une entrée est fixée à sa valeur moyenne.

Conditionnons la sortie $Y$ par rapport à sa première marginale au point $\mu_1$. On a 

$$
(Y | X_1 = \mu_1) = \beta_0 + \beta_1 \mu_1 + \beta_2 X_2 + ... + \beta_p X_p
$$

pour tout $X_2,...,X_p\in\mathbb{R}$. 

Par conséquent, on a 

\begin{align*}
E(Y| X_1 = \mu_1) 
&= \beta_0 + \beta_1 \mu_1 + ... + \beta_p \mu_p.
\end{align*}

De plus, 

\begin{align*}
V(Y| X_1 = \mu_1) 
&=  \beta_2^2 V(X_2) + ... + \beta_p^2 V(X_p) \\
&=  \beta_2^2 \sigma_2^2 + ... + \beta_p^2 \sigma_p^2.
\end{align*}

Cela implique :

\begin{align*}
V(Y) 
&= \beta_1^2 \sigma_1^2 + V(Y| X_1 = \mu_1) \\
&= \eta_1 V(Y) + V(Y| X_1 = \mu_1) .
\end{align*}

Par conséquent :

\begin{align*}
V(Y| X_1 = \mu_1) = V(Y) - \eta_1 V(Y).
\end{align*}

En d'autres termes, le coefficient $\eta_1$ mesure la part de variance perdue lorsque $X_1$ est fixé à la constante $\mu_1$. 