# Part 2 - Régularisation de problèmes mal posés

In [1]:
import numpy as np
import matplotlib.pyplot as plt

## Question 2.9

### Principe

#### Regression linéraire - idée principale

Soit deux ensembles $x$ et $y$ de taille $n$ pù $\{x_1, x_2, ..., x_n\}$ et $\{y_1, y_2, ... , y_n\}$.

on souhaite construire une droite qui séparerait au mieux les deux ensembles $x$ et $y$ tout en diminuant les écarts entre les différentes valeurs des deux ensembles.

La méthode des moindres carrées nous permet d'obtenir une droite d'équation du type $y = ax + b$. Le but est d'effectuer un ajustement linéaire afin de minimiser l'écart entre la droite trouver et les éléments des deux ensembles.

Dans un premier temps, nous allons tracer une droite approximative. Nous allons calculer la somme des erreurs (SCE) entre les éléments et la droite approximative défini auparavant. Une erreur notée $\epsilon$ (aussi appellée résidu) est l'écart entre la valeur réelle de l'élement et la valuer théorique de l'élément (la valeur de l'élément sur la droite).

$$
SCE = \sum_{i = 0}^{n}{(y_i - (ax_i + b))^2}
$$

Afin d'obtenir la droite pour séparer nos éléments, il faut trouver les valeurs de $a$ et de $b$ à l'aide de la formule de la SCE.

#### Démonstration

**Cherchons b**

On a $$SCE = \sum_{i = 0}^{n}{(y_i - (ax_i + b))^2} = \sum_{i = 0}^{n}{(-ax_i - b + y_i)^2}$$

Nous calculons la dérivée partielle en fonction de $b$. Nous considérons $a$ comme une constante

$$
\frac{\partial{SCE}}{\partial{b}} = 0 \iff -2 \sum_{i = 0}^{n}{(-ax_i - b + y_i)} = 0
$$

Nous séparons les deux termes de la somme

$$
\iff \sum_{i = 0}^{n}{(-ax_i - b)} + \sum_{i = 0}^{n}{y_i} = 0\\
\iff \sum_{i = 0}^{n}{(-ax_i)} - \sum_{i = 0}^{n}{b} + \sum_{i = 0}^{n}{y_i} = 0\\
\iff \sum_{i = 0}^{n}{(-ax_i)} - nb + \sum_{i = 0}^{n}{y_i} = 0\\
\iff -nb = a\sum_{i=0}^{n}{x_i} - \sum_{i = 0}^{n}{y_i}\\
\iff b = -a\frac{\sum{x_i}}{n} + \frac{\sum{y_i}}{n}
$$

On sait que $\frac{\sum{x_i}}{n}$ équivaut à la moyenne de x donc $\frac{\sum{x_i}}{n} = \overline{x}$. De même pour $\frac{\sum{y_i}}{n} = \overline{y}$. Donc

$$
b = -a\overline{x} + \overline{y}
$$

**Cherchons a**

Avant de calculer la dérivée partielle de $SCE$ en fonction de $a$, nous allons remplacer $b$ dans l'expression de $SCE$

$$
SCE = \sum_{i = 0}^{n}{(-ax_i + a\overline{x} - \overline{y} + y_i)^2}\\
SCE = \sum_{i = 0}^{n}{(-a(x_i - \overline{x}) + (y_i - \overline{y}))^2}
$$

On reconnait une identité remarquable du type $(a-b)^2 = a^2 - 2ab + b^2$

$$
SCE = \sum_{i=0}^{n}({a^2(x_i - \overline{x})^2}) + 2\sum_{i=0}^{n}({-a(x_i - \overline{x})(y_i - \overline{y})}) + \sum_{i=0}^{n}(y_i - \overline{y})^2
$$

On résoud la dérivée partielle de la $SCE$ en fonction de $a$ telle que $\frac{\partial{SCE}}{\partial{a}} = 0$

$$
\iff \sum_{i=0}^{n}({2a(x_i - \overline{x})^2}) - 2 \sum_{i=0}^{n}({(x_i - \overline{x})(y_i - \overline{y})})\\
\iff a = \frac{2\sum_{i=0}^{n}({(x_i - \overline{x})(y_i - \overline{y})}}{2\sum_{i=0}^{n}({(x_i - \overline{x})^2})}\\
$$

Or $\sum_{i=0}^{n}({(x_i - \overline{x})(y_i - \overline{y})} = \sigma_{xy}$ et $\sum_{i=0}^{n}({(x_i - \overline{x})} = \sigma_x$ donc

$$
a = \frac{\sigma_{xy}}{\sigma_{x}^2}
$$



### 