# Analyse de sensibilité linéaire

## Analyse du modèle linéaire

Assume that the random variables $X_i$ are independent, with 
mean $E(X_i)$ and finite variances $V(X_i)$, for $i=1,2,\ldots,p$.
Let us suppose that $Y$ is an affine function of the
variables $X_i$:
$$
Y = g(X) = \beta_0 + \sum_{i=1,2,\ldots,p} \beta_i X_i,
$$
where $\beta_i$ are real parameters, for $i=1,2,\ldots,p$.

The expectation of the sum of variables is the sum of the expectations, 
so that 

\begin{eqnarray*}
E(Y) 
&=& E(\beta_0) + \sum_{i=1,2,\ldots,p} E(\beta_i X_i) \\
&=& \beta_0 + \sum_{i=1,2,\ldots,p} \beta_i E(X_i).
\end{eqnarray*}

Notice that the previous computation can be performed 
even when the variables are dependent. 
As we are going to see, we can derive a similar equality for the 
variance, although the independence of the variable is 
then a strict requirement. 

The standardized regression coefficient is 
$$
SRC_i = \frac{\beta_i^2 V(X_i)}{V(Y)},
$$
for $i=1,2,\ldots,p$.

Obviously, we have $SRC_i\geq 0$, for $i=1,...,p$. 
Moreover, the following proposition shows that the sum of 
standardized regression coefficients is equal to one.

For an affine model $g$, the sum of the standardized regression coefficients is one:
$$
SRC_1 + SRC_2 + \ldots + SRC_p = 1. \qquad \textrm{(1)}
$$

*Proof*

Since the variables $X_i$ are independent, the variance of the 
sum of variables is the sum of the variances. 
Hence, 
$$
V(Y) = V(\beta_0) + \sum_{i=1,2,\ldots,p} V(\beta_i X_i).
$$
But $V(\beta_0)=0$ and, for each $i=1,2,\ldots,p$, 
we have $V(\beta_i X_i)=\beta_i^2 V(X_i)$. 
This leads to the equality
$$
V(Y) = \sum_{i=1,2,\ldots,p} \beta_i^2 V(X_i).
$$
Hence, each term $\beta_i^2 V(X_i)$ is the part of the 
total variance $V(Y)$ which is caused by the variable $X_i$.
We divide the previous equality by $V(Y)$ and get the 
equation (1), which concludes the proof. $\blacksquare$

## Linear correlation coefficient and SRC indices

In this section, we present the link between the linear 
correlation coefficients of an affine model, and the 
standardized regression coefficients.

Assume that the random variables $X_i$ are independent, with 
mean $E(X_i)$ and finite variances $V(X_i)$, for $i=1,2,\ldots,p$.
Let us consider the random variable $Y$, which depends linearily on the 
variables $X_i$. 
We are interested in the correlation coefficient $Corr(Y,X_i)$.

Let us consider two jointly distributed random variables $X$ and $Y$. 
The covariance is 
$$
Cov(Y,X_i) = E[(Y-E(Y))(X_i-E(X_i))],
$$
for $i=1,2,\ldots,p$.
The linear correlation coefficient is 
$$
Corr(Y,X_i) = \frac{Cov(Y,X_i)}{\sqrt{V(Y)}\sqrt{V(X_i)}}
$$
for $i=1,2,\ldots,p$.

Assume that the output $Y$ is the affine model.
Assume that the input variables $X_i$ are independent. 
Therefore 
$$
SRC_i = Corr(Y,X_i)^2,
$$
for $i=1,2,\ldots,p$.

*Proof*

We have 

\begin{eqnarray*}
Cov(Y,X_i) 
&=& Cov(\beta_0,X_i) + \beta_1 Cov(X_1,X_i)+ \beta_2 Cov(X_2,X_i) + \ldots  \\
&& + \beta_i Cov(X_i,X_i) + \ldots + \beta_p Cov(X_p,X_i),
\end{eqnarray*}

because the covariance function is linear with respect to 
its arguments. 
Obviously, we have $Cov(\beta_0,X_i)=0$ since $\beta_0$ is a constant. 
Moreover, the random variables $X_i$ are independent, which implies that $Cov(X_j,X_i) = 0$, 
for any $j \neq i$. 
Therefore, 

\begin{eqnarray*}
Cov(Y,X_i) 
&=& \beta_i Cov(X_i,X_i) \\
&=& \beta_i V(X_i).
\end{eqnarray*}

Hence, the correlation coefficient can be simplified into

\begin{eqnarray*}
Corr(Y,X_i) 
&=& \frac{\beta_i V(X_i)}{\sqrt{V(Y)} \sqrt{V(X_i)}} \\
&=& \frac{\beta_i \sqrt{V(X_i)}}{\sqrt{V(Y)}}.
\end{eqnarray*}

We square the previous equality and get
$$
Corr(Y,X_i)^2= \frac{\beta_i^2 V(X_i)}{V(Y)}.
$$
In the previous equality, we recognize the SRC coefficient, 
which concludes the proof. $\blacksquare$

## Régression linéaire

En général, on ne sait pas si la fonction $g$ est linéaire. Dans les méthodes que nous décrivons, la fonction $g$ est une boîte noire dans laquelle la seule information observable est la sortie en fonction de l'entrée. Dans ce cas, on peut créer un modèle de regression linéaire comme une approximation de la fonction $g$. Cela permet ensuite d'utiliser les indices SRC, si le modèle linéaire est de qualité. Nous allons voir que cette qualité peut être quantifiée grâce au coefficient $R^2$. 

Le vecteur des prédictions du modèle linéaire est une combinaison linéaire des composantes du vecteur $X$ :
$$
y = \beta_0 + X^T \beta + \epsilon
$$
où $\epsilon$ est une variable aléatoire et $(\beta_0,\beta_1,...,\beta_p)^T\in\mathbb{R}^{p+1}$ est le vecteur des paramètres. 
Soit $n$ la taille de l'échantillon et soit $X^{(1)},...,X^{(n)}$ un échantillon i.i.d. du vecteur aléatoire $X$. La matrice de conception du modèle linéaire est :
$$
A = 
\begin{pmatrix}
1 & X_1^{(1)} & ... & X_p^{(1)} \\
1 & X_1^{(2)} & ... & X_p^{(2)} \\
\vdots & \vdots & & \vdots \\
1 & X_1^{(n)} & ... & X_p^{(n)}
\end{pmatrix}.
$$
Soit $y$ le vecteur des sorties de la fonction $g$ :
$$
y^{(j)} = g\left(X^{(j)}\right), \quad j=1,...,n.
$$
Le problème de regression linéaire consiste à résoudre le problème :
$$
\min_{\beta\in\mathbb{R}^p} \|y - A\beta\|_2.
$$
Si la matrice $A$ est de rang plein, la solution est unique. C'est celle donnée par les équations normales :
$$
\hat{\beta} = \left(A^T A\right)^{-1} A^T y.
$$
En pratique, bien que la méthode des équations normales soit appropriée dans certaines circonstances, on utilise le plus souvent une méthode fondée sur une décomposition orthogonale de la matrice $A$, comme par exemple la décomposition QR ou la décomposition SVD.

## Qualité de la regression linéaire

Une fois que les coefficients $\beta$ sont calculés, on doit déterminer si le modèle linéaire est une approximation appropriée de la fonction $g$. 
Soit 
$$
\bar{y} = \frac{1}{n} \sum_{j=1}^n y^{(j)}
$$
la moyenne empirique des sorties $y$. 
Soit $\hat{y}$ le vecteur des prédictions du modèle de regression linéaire :
$$
\hat{y} = A\hat{\beta}.
$$
Le coefficient $R^2\in[0,1]$ est :
$$
R^2 = 1- \frac{\sum_{j=1}^n \left(y^{(j)} - \hat{y}^{(j)}\right)^2}{\sum_{j=1}^n \left(y^{(j)} - \bar{y}\right)^2}
$$
Le coefficient $R^2$ mesure la part de variance expliquée par le modèle linéaire. 

On considère souvent qu'un coefficient de prédictivité $R^2>0.9$ est le signe d'une qualité suffisante. Un coefficient $R^2<0.5$ est inacceptable pour une utilisation pratique : c'est le signe que, vraisemblablement, le modèle n'est *pas* linéaire.