$$\newcommand{\nr}[1]{\|#1\|}
\newcommand{\RR}{\mathbb{R}}
\newcommand{\N}{\mathbb{N}}
\newcommand{\C}{\mathbb{C}}
$$
$$\newcommand{\nr}[1]{\|#1\|}
\newcommand{\RR}{\mathbb{R}}
\newcommand{\N}{\mathbb{N}}
$$
### MEU352 2023/2024 - Analyse numérique matricielle et optimisation

# TP2 - Conditionnement. Décomposition QR et méthode des moindres carrés.

## Exercice 1. La matrice de Hilbert.

### Partie 1. Conditionnement de la matrice de Hilbert. 

La matrice de Hilbert de taille $n\in\N$ est la matrice $H_n$ définie par 
$$
{(H_n)}_{ij}=\frac{1}{i+j-1}.
$$

**Q1.**
Définir la fonction ```hilbert``` prenant en argument ```n``` et renvoyant la matrice de Hilbert $H_n$ de taille $n$. 

**Q2.**
Résoudre (avec ```numpy.linalg.solve```) le système linéaire $H_nx=b$ où $b=H_n x_{ex}$ et $x_{ex}$ est le vecteur dont toutes les composantes sont égales à 1 (et donc la solution exacte du système $H_nx=b$), pour les valeurs de $n$ allant de 3 à 15. Afficher pour chaque valeur de $n$ l'erreur relative $\frac{\|x-x_{ex}\|}{\|x_{ex}\|}$ (utiliser ```numpy.linalg.norm``` pour calculer la norme d'un vecteur).

**Q3.**
Afficher, à l'aide de la commande ``print``, le conditionnement (relatif à la norme 2, mais vous pouvez aussi afficher le conditionnement relatif à une autre norme) de la matrice de Hilbert pour chaque valeur de $n$ (vous pouvez utiliser la fonction ``cond`` du module ``np.linalg``). A l'aide de la commande ```eig``` du module ```linalg``` de ```numpy```, afficher la plus grande et la plus petite valeur propre de la matrice $H_n$, pour chaque valeur de $n$. 

*La commande* `val,vec=np.linalg.eig(A)` *retourne un vecteur* `val` *contenant les valeurs propres de $A$ (non necéssairement ordonnées) et un tableau* `vec` *contenant les vecteurs propres de A.*

**Q4.** Calculer les valeurs propres et les vecteurs propres de la matrice $H_{15}$. Pour chaque valeur propre 
$\lambda$ et vecteur propre associé $u$, calculer l'erreur $\|H_{15} u-\lambda u\|$. Que pouvez-vous constater ? Savez-vous expliquer ce comportement ?

*Une des questions du partiel consistait à montrer que pour une matrice diagonalisable $A$, de valeurs propres $\lambda_1,\dots,\lambda_n$, telle que $A=PDP^{-1}$, avec $D$ diagonale et $P$ inversible, et pour une perturbation $\Delta A$, le spectre de $A+\Delta A$ est contenu dans un des disques* 
$$
D_i=\{z\in\C\,\,:\,\,|z-\lambda_i|\leq cond(P)||| \Delta A |||\}.
$$

In [1]:
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

# Format possible pour afficher les normes :
# print(f'n={n} : ||x-x_ex||={np.linalg.norm(x-xex)}\n')

In [36]:
## Valeurs propres

In [34]:
def hilbert(n):
    i, j = np.indices((n, n))
    H = 1 / (i + j + 1)
    return H
    
def resol(n): 
    H = hilbert(n)
    x_ex = np.ones(n)
    b = np.dot(H,x_ex)
    return np.linalg.solve(H,b)

for i in range(3,16):
    xex = np.ones(i)
    x = resol(i)
    print(f'n={i} : ||x-x_ex|| / || x_ex || = {np.linalg.norm(x-xex)/np.linalg.norm(xex)}\n')

n=3 : ||x-x_ex|| / || x_ex || = 8.022593772267726e-15

n=4 : ||x-x_ex|| / || x_ex || = 4.137409622430382e-14

n=5 : ||x-x_ex|| / || x_ex || = 1.6828426299227195e-12

n=6 : ||x-x_ex|| / || x_ex || = 1.4242437208427487e-10

n=7 : ||x-x_ex|| / || x_ex || = 7.637452450980383e-09

n=8 : ||x-x_ex|| / || x_ex || = 6.124089555723088e-08

n=9 : ||x-x_ex|| / || x_ex || = 3.8751634185032475e-06

n=10 : ||x-x_ex|| / || x_ex || = 8.67039023709691e-05

n=11 : ||x-x_ex|| / || x_ex || = 0.0008383287776275721

n=12 : ||x-x_ex|| / || x_ex || = 0.3249129296869168

n=13 : ||x-x_ex|| / || x_ex || = 3.648729201208787

n=14 : ||x-x_ex|| / || x_ex || = 3.673009823340255

n=15 : ||x-x_ex|| / || x_ex || = 4.930030954879194



In [58]:
for i in range(3,16):
    print(f"- Pour H_{i} :")
    print(f"Conditionnement : {np.linalg.cond(hilbert(i)) : .0f}")
    print(f"Valeur propre max : {np.max(np.linalg.eig(hilbert(i))[0]):.3f}")
    print(f"Valeur propre min : {np.min(np.linalg.eig(hilbert(i))[0]):.3f}")
    print()

erreur = np.dot(hilbert(15),np.linalg.eig(hilbert(15))[1]) - np.linalg.eig(hilbert(15))[0]*np.linalg.eig(hilbert(15))[1]
print("Norme des erreurs pour H_15 :")
for g in erreur :
    print(np.linalg.norm(g))
    print()


- Pour H_3 :
Conditionnement :  524
Valeur propre max : 1.408
Valeur propre min : 0.003

- Pour H_4 :
Conditionnement :  15514
Valeur propre max : 1.500
Valeur propre min : 0.000

- Pour H_5 :
Conditionnement :  476607
Valeur propre max : 1.567
Valeur propre min : 0.000

- Pour H_6 :
Conditionnement :  14951059
Valeur propre max : 1.619
Valeur propre min : 0.000

- Pour H_7 :
Conditionnement :  475367357
Valeur propre max : 1.661
Valeur propre min : 0.000

- Pour H_8 :
Conditionnement :  15257575538
Valeur propre max : 1.696
Valeur propre min : 0.000

- Pour H_9 :
Conditionnement :  493153755941
Valeur propre max : 1.726
Valeur propre min : 0.000

- Pour H_10 :
Conditionnement :  16024416987428
Valeur propre max : 1.752
Valeur propre min : 0.000

- Pour H_11 :
Conditionnement :  522270131654983
Valeur propre max : 1.775
Valeur propre min : 0.000

- Pour H_12 :
Conditionnement :  17515952300879806
Valeur propre max : 1.795
Valeur propre min : 0.000

- Pour H_13 :
Conditionnement :  3188

## Exercice 2 - Factorisation QR par la méthode de Householder.

La factorisation QR d'une matrice est sa décomposition en un produit d'une matrice orthogonale $Q$ ($Q^TQ=QQ^T=I$) par une matrice triangulaire supérieure $R$.

On a le résultat suivant, qu'on verra en cours :

*Soit $A\in\mathcal{M}_n(\mathbb{R})$ une matrice inversible. Alors il existe un unique couple $(Q,R)$, où $Q$ est une matrice orthogonale et $R$ une matrice triangulaire supérieure à diagonale positive, tel que $A=QR$.*

Cette factorisation peut être obtenue en appliquant la méthode de Gram-Schmidt pour obtenir une base orthonormée de $\mathbb{R}^n$ à partir de la famille formée par les colonnes de $A.$ On peut généraliser cette factorisation à des matrices carrées non inversibles et à des matrices rectangulaires.

On pourrait ensuite utiliser la décomposition $QR$ de la matrice $A$ pour résoudre un système linéaire $Ax=b$, avec $b\in\mathbb{R}^n$. La matrice $Q$ étant *facile à inverser*, son inverse étant sa transposée, 
on a 
$$
Ax=b\ \Longleftrightarrow\ QRx=b\ \Longleftrightarrow\ Rx=Q^tb,
$$
ce dernier système étant un système à matrice triangulaire. En pratique on n'utilise pas cette méthode pour la résolution de systèmes linéaires car elle est plus coûteuse que d'autres méthodes basées dans la décomposition de Gauss.

Cette décomposition $QR$ peut toutefois être utilisée dans la résolution d'autre type de problèmes (problèmes aux moindres carrées, calcul de valeurs propres, par exemple).   

D'autre part, dans les calculs sur ordinateur la méthode de Gram-Schmidt se révèle en général instable. 
En pratique, on utilise alors *l'algorithme de Householder* pour calculer la décomposition QR d'une matrice.

### La décomposition QR par la méthode de Householder.

Soit $u\in\mathbb{R}^n,\ u\neq0$. On appelle matrice de Householder associée à $u$ la matrice carrée de taille $n$
$$
H(u)=I-2\frac{uu^T}{\|u\|^2},
$$
où $\|\cdot\|$ désigne la norme euclidienne dans $\mathbb{R}^n$ (et où l'on identifie dans la formule ci-dessus $u$ à une matrice colonne de taille $n\times1$).
Si $u=0$, on pose $H(u)=I_n$.

L'intérêt de ces matrices réside dans les faits suivants :

*Pour tout vecteur $u$, $H(u)$ est une matrice symétrique et orthogonale ($H(u)H(u)^T=H(u)^TH(u)=I_n$) ;*

*Pour tout vecteur $u$, $H(u\pm\|u\|e_1)u=\mp\|u\|e_1$, où $e_1$ est le premier vecteur de la base canonique de $\mathbb{R}^n$.*

**Q1)** Définir la fonction ```House(u)``` qui retourne la matrice de Householder associée au vecteur ```u```.

**Q2)** Vérifier sur le vecteur $u=(1,2,3,\dots,n)$, pour $n=5$, les deux propriétés ci-dessus : vérifier que $H(u)$ est une matrice symétrique et orthogonale, calculer le vecteur $H(u\pm\|u\|e_1)u$ et vérifier que $H(u\pm\|u\|e_1)u= \mp\|u\|e_1$.

**Commandes python utiles :** *``np.transpose(M)`` ou ``M.T`` pour la transposée d'une matrice `M`, ``np.dot(A,B)`` pour le produit de deux matrices `A` et `B`, `np.allclose(u,v)` pour savoir si `u`=`v`, `np.linalg.norm(u)` pour la norme d'un vecteur `u`; faire attention à définir des vecteurs comme des matrices ligne ou colonne avec les bonnes dimensions : si `u` est un tableau de dimension 1, `u.T` ou `u.transpose()` ne retourne pas le transposé de `u`, il faut définir `u` comme un tableau de dimension 2.* 

In [99]:
np.identity(5).shape == (5,5)


True

In [103]:
## Q1 et Q2
def house(u):
    if np.array_equal(u, np.zeros_like(u)):
        raise ValueError("u ne peut pas être un tableau de zéros.")
    elif not u.shape == (len(u),1):
        u = u.reshape(len(u),1)
    else:
        return (np.identity(len(u)) - (2 * np.dot(u, u.T) / np.linalg.norm(u, ord=2)**2))
        

u = np.arange(1,6)
print(u)
print(f"est ce que H(u) est symétrique ? {np.allclose(house(u),np.transpose(house(u)))}")
print()
print(f"est ce que H(u) est orthogonale ? {np.allclose(np.dot(house(u),np.transpose(house(u))), np.identity(len(house(house(u)))))}")


[1 2 3 4 5]


TypeError: ufunc 'isfinite' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe''

In [77]:
H_u = house(u)
# Vérification de la symétrie
is_symmetric = np.allclose(H_u, H_u.T)
print(f"Est-ce que H(u) est symétrique ? {is_symmetric}")

# Vérification de l'orthogonalité
is_orthogonal = np.allclose(np.dot(H_u.T, H_u), np.identity(len(u)))
print(f"Est-ce que H(u) est orthogonale ? {is_orthogonal}")

Est-ce que H(u) est symétrique ? True
Est-ce que H(u) est orthogonale ? False


La méthode de Householder pour obtenir la décomposition QR d'une matrice $A$ consiste à multiplier successivement $A$ à gauche par des matrices de Householder qui annulent les colonnes de $A$ sous la diagonale.

On procède en $n-1$ étapes. On construit une suite de matrices orthogonales $(H_k)_{k=1,\dots,n-1}\ $ tel que $(H_{n-1}\dots H_2H_{1})A\ $ soit triangulaire supérieure. 

* **Étape 1.**

Soit $A_0=A$ et $a\in\mathbb{R}^n$ la première colonne de la matrice $A$. On pose $H^1=H(a+\|a\|e_1)$. On définit alors $A_1=H_1A_0$. La matrice $A_1$ est de la forme
$$
A_1=\left[
\begin{array}{cccc}
-\|a\|&(A_1)_{12}&\cdots&(A_1)_{1n}\\
0&(A_1)_{22}&\cdots&(A_1)_{2n}\\
\vdots&\vdots&&\vdots\\
0&(A_1)_{n2}&\cdots&(A_1)_{nn}
\end{array}
\right],
$$
c'est-à-dire telle que sa première colonne est nulle sous la diagonale .

* **Étape k $\mathbf{\in\{2,\dots,n-1\}}$.**

Supposons qu'à la suite de l'étape $k-1$ on ait obtenu une matrice $A_{k-1}$ dont les $k-1$ premières colonnes sont nulles sous la diagonale : 

$$
A_{k-1}=\left[
\begin{array}{cccc}
a_{11} & a_{12} & \cdots       & a_{1\,k-1}   & a_{1k}     & \cdots & a_{1n}\\
0      & a_{22} &              & a_{2\,k-1}   & a_{2k}     &        & a_{2n}\\ 
\vdots & \ddots & \ddots       & \vdots       & \vdots     &        & \vdots\\
\vdots &        & \ddots       & a_{k-1\,k-1} & a_{k-1\,k} & \cdots & a_{k-1\,n}\\
0      & \cdots & \cdots       & 0            & a_{kk}     & \cdots & a_{kn}\\
\vdots &        &              & \vdots       & \vdots     &        & \vdots\\
0      & \cdots & \cdots       & 0            & a_{nk}     & \cdots & a_{nn}
\end{array}
\right],
$$

Soit $a\in\mathbf{\mathbb{\mathbf{R}}^{n-k+1}}$ le vecteur correspondant à la k-ème colonne de $A_{k-1}$ sous la diagonale :

$$
a=\left[
\begin{array}{c}
a_{kk}\\
\vdots\\
a_{nk}
\end{array}
\right]
$$

On pose 

$$
H_k=
\left[
\begin{array}{c|cc}
I_{k-1}&  0 & \\
\hline \\
0 &  H(a+\|a\|e_1) & 
\end{array}
\right],
$$

où $e_1$ est le premier vecteur de la base canonique de $\mathbb{R}^{n-k+1}$.
On définit alors $A_{k}=H_kA_k.$ La matrice $A_{k}$ est nulle sous la diagonale dans ses $k$ premières colonnes.

À la fin de $n-1$ étapes on obtient une matrice $R=A_{n-1}$ triangulaire supérieure telle que $R=(H_{n-1}\dots H_2H_{1})A\ $. On a alors $A=QR$ avec $Q={H_1}^T\dots {H_{n-1}}^T$.

La méthode de Householder est assez stable numériquement, chaque étape correspondant à une transformation orthogonale (préservant la norme et le conditionnement) sur la matrice de l'étape précédente.

**Q3)** Programmer la décomposition QR d'une matrice $A$ par la méthode de Householder dans une fonction ```ma_QR_house(A)```, qui doit retourner les matrices $Q$ et $R$.

**Q4)** Testez votre décomposition avec une matrice $A$ à coéfficients aléatoires (vous pourrez utiliser la fonction `np.random.rand(n,n)` pour obtenir une matrice de taille $n$ à coefficients aléatoires dans $[0,1]$). Vérifiez que vous obtenez bien $A=QR$, que $R$ est triangulaire supérieure et $Q$ orthogonale.

**Q5)** Créer une fonction ```solve_qr(Q, R,b)``` pour la résolution d'un système linéaire $Ax=b$ dont la décomposition QR de la matrice $A$ a déjà été effectuée. Vous pourrez utiliser l'algorithme de résolution d'un système linéaire triangulaire programmé au TP précédent pour résoudre le système triangulaire $Rx=Q^Tb$. Testez votre fonction avec une matrice $A$ et un vecteur $b$ à coefficients aléatoires. Vérifier bien que vous obtenez la bonne solution du système linéaire. 

*La fonction `remonte_descente` de résolution d'un système linéaire triangulaire vous est donnée.*  

**Commandes python utiles** : 

*Si `m` est un tableau à une dimension de taille `n` (donc `m=[m[0],...m[n-1]]`), `m[i:]` est le tableau `[m[i],...m[n-1]]` (le tableau ayant les éléments de `m` allant du ième jusqu'au dernier), `m[:i]` est le tableau `[m[0],...m[i-1]]` (le tableau ayant les i premiers éléments de `m`) et `m[i:j]` est le tableau `[m[i],...m[j-1]]` (le tableau ayant du ième au (j-1)ème éléments de `m`) ;*

*Si `M` est un tableau à deux dimensions, `M[i:,j]` est le tableau unidimensionnel `[M[i,j],...M[n-1,j]]`, `M[:i,j]` le tableau `[M[0,j],...M[i-1,j]]`, ` M[i:,j:]` est le tableau bidimensionnel des éléments `M[k,p]`, avec `k, p `$\geq$`i`, etc.*


In [5]:
def remonte_descente(A,b):
    '''
    résout Ax=b si 
    A triangulaire inférieure ou A triangulaire supérieure
    '''
    n=np.size(b)
    x=np.zeros(np.shape(b))
    if np.max(abs(np.triu(A,1))) < 1e-14: ## <=> si partie triang. sup == 0, i.e. si matrice triang. inférieure
                                          ## algo. de descente
        for i in range(n):
            x[i]=(b[i]-np.vdot(A[i,:i],x[:i]))/A[i,i]
            
    #if np.max(abs(np.tril(A,-1))) < 1e-14:
    else:
        x[n-1]=b[n-1]/A[n-1,n-1]
        for i in range(n-1):
            x[n-2-i]=(b[n-2-i]-np.vdot(A[n-2-i,n-1-i:],x[n-1-i:]))/A[n-2-i,n-2-i]
    return x

A=np.array([[-1,0,-3,0],[2,5,-7,0],[0,1,3,-4],[1,1,-5,8]])

### TEST 
L=np.tril(A)
U=np.triu(A)
xex=np.ones(4)

bL=np.dot(L,xex)
bU=np.dot(U,xex)

xL=remonte_descente(L,bL)
xU=remonte_descente(U,bU)

print(xL)
print(xU)

[1. 1. 1. 1.]
[1. 1. 1. 1.]


In [6]:
## QR pour une matrice carrée

def ma_QR_house(A):
    '''
    construit Q orthogonale et R triangulaire supérieure tel que A=QR par l'algorithme de Householder
    '''


## Exercice 3 - Problème de moindres carrés. 

Soient $A\in\mathcal{M}_{n,p}(\mathbb{R})$ une matrice rectangulaire et $b\in\mathbb{R}^n$. Le problème aux moindres carrées est la recherche d'un vecteur $x\in\mathbb{R}^p$ tel que $Ax$ soit le plus proche possible de $b$ au sens où
$$
\|Ax-b\|=\min_{y\in\mathbb{R}^p}\|Ay-b\|\ \ \ \ \ \ (P_{mc}),
$$
où $\|\cdot\|=\|\cdot\|_2$ est la norme euclidienne. Le choix de la norme euclidienne correspond à l'appelation "moindres carrés", mais on pourrait s'intérésser à d'autres normes.

Si $n=p$ et la matrice $A$ est inversible, ce problème admet une unique solution, $x=A^{-1}b$. Si $A$ n'est pas inversible ou si $p\neq n$, et $b\notin Im A$, le problème aux moindres carrés généralise la résolution de systèmes linéaires au cas de matrices non inversibles ou au cas non carré.

### Résolution du problème de moindres carrées en utilisant la décomposition QR.


Supposons que $n>p$ (c'est le cas le plus usuel, lorsqu'il y a plus d'équations que d'inconnues). Nous allons utiliser la décomposition QR de la matrice $A$, l'idée étant de se ramener à un problème aux moindres carrées dont la matrice est triangulaire.

Supposons qu'il existe $R\in\mathcal{M}_{n,p}(\mathbb{R})$ une matrice triangulaire supérieure et $Q\in\mathcal{M}_{n}(\mathbb{R})$ une matrice orthogonale tel que $A=QR$.

**Q1)** Montrer que $x\in\mathbb{R}^p$ est solution de $(P_{mc})$ si et seulement si $x$ est solution du problème 
$$
\|Rx-Q^Tb\|=\min_{y\in\mathbb{R}^p}\|Ry-Q^Tb\|.
$$
*Rappel : si $Q$ est une matrice orthogonale, $\|Qx\|=\|x\|$, pour tout $x$.*

En adaptant la méthode de Gram-Schmidt, on peut montrer qu'une matrice $A$ non carrée admet aussi une factorisation $QR$.

On suppose désormais que $n>p$ et que $Ker(A)=\{0\}$. Le problème de moindres carrées a dans ce cas une unique solution. La décomposition QR de la matrice $A$ est telle que $R\in\mathcal{M}_{n,p}$ est de la forme
$$
\left[
\begin{array}{c}
R_p\\
\hline
0_{{(n-p)}\times p}
\end{array}
\right],
$$
avec $R_p\in\mathcal{M}_{p}(\mathbb{R})$ triangulaire supérieure.

*On peut montrer que
$$
\min_{y\in\mathbb{R}^p}\|Ry-Q^Tb\|=\|(Q^Tb)_{n-p}\|,
$$
où $(Q^Tb)_{n-p}$ est le vecteur de $\mathbb{R}^{n-p}$ correspondant aux $n-p$ dernières composantes du vecteur de $\mathbb{R}^{n}$ $\ Q^Tb$, et que ce minimum est atteint en* 

$$
y=(R_p)^{-1}(Q^Tb)_{p},
$$

*où $(Q^Tb)_{p}$ est le vecteur de $\mathbb{R}^{p}$ correspondant aux $p$ premières composantes du vecteur $\ Q^Tb$.* 

*Remarque : en pratique, on ne calculera pas l'inverse la de la matrice triangulaire $R_p$ mais on résoudra le système triangulaire supérieur $R_py=(Q^Tb)_{p}$.*

**Q2)** Adapter votre fonction ```ma_QR_house``` pour qu'elle calcule la décomposition QR d'une matrice rectangulaire avec plus de lignes que de colonnes. Testez votre fonction avec une matrice $A$ de ce type. Vérifiez bien que la matrice $R$ obtenue est triangulaire supérieure et nulle sur les lignes $p+1,\dots,n$. 

In [7]:
## Décomposition QR d'une matrice rectangulaire n x p avec n > p (plus de lignes que de colonnes).
## Il faut donc faire l'algorithme jusqu'à la dernière colonne, c'est-à-dire, réduire à 0 toutes les 
## colonnes sous la diagonale
## L'algorithme est le même que dans la cas carré ! Juste on l'applique le nombre de fois nécéssaire pour annuler 
## toutes les colonnes sous la diagonale 

def ma_QR_house(A):
    '''
    construit Q orthogonale et R triangulaire supérieure tel que A=QR par l'algorithme de Householder
    '''


**Exemples d'application (d'après *Linear Algebra*, D. C. Lay).**

On peut utiliser la méthode des moindres carrés pour analyser des données pour lesquelles on dispose de certaines mesures. Supposons que l'on fait une expérience qui nous donne $n$ mesures $Y_i$ d'une certaine grandeur, en fonction de $n$ valeurs $X_i$ d'un paramètre. On cherche alors à déduire la loi décrivant au mieux le comportement de $Y$ en fonction de $X$, en imposant le modèle de cette loi (par exemple linéaire, parabolique, cubique,...). Le modèle de loi est imposé, mais cette loi dépend elle aussi de certains coefficients (par exemple les coefficients du polynôme), qui eux sont inconnus et qu'on cherche à estimer. 

**Q3) Exemple 1.**

On dispose des distances horizontales $d_i,\ i=0,\dots,12,$ parcorues par un avion au décolage à toutes les secondes $t_i$ entre les instants $t=0$ et $t=12$ : 

$$
0,\ 8.8,\ 29.9,\ 62,\ 104.7,\ 159.1,\ 222,\ 294.5,\ 380.4,\ 471.1,\ 571.7,\ 686.8, 809.2.
$$

Supposons dans un premier temps que l'on admet que la distance parcorue en fonction du temps est linéaire, c'est-à-dire qu'elle se comporte comme une fonction $d(t)=\alpha_0+\alpha_1 t$, pour certains valeurs de $\alpha_0$ et $\alpha_1$. Déterminer $\alpha_0$ et $\alpha_1$ qui minimisent l'erreur entre $d(t_i)$ et $d_i$ au sens des moindres carrées. Autrement dit on veut minimiser la norme du vecteur $(\alpha_0+\alpha_1 t_i-d_i)_i$, au sens des moindres carrées. 

On veut donc résoudre le système suivant (dont l'inconnue est $(\alpha_0,\alpha_1)$) au sens des moindres carrés
$$
\begin{cases}
\alpha_0+0\times\alpha_1 =0,\\
\alpha_0+\alpha_1  =8.8,\\
\alpha_0+2\alpha_1  =29.9,\\
\vdots\\
\alpha_0+11\alpha_1  =686.8,\\
\alpha_0+12\alpha_1  =809.2,
\end{cases}
$$

autrement dit le système $A \alpha= B$, avec 

$$
A=
\begin{bmatrix}
1&0\\
1&1\\
1&2\\
\vdots&\vdots\\
1&11\\
1&12
\end{bmatrix},\ \ \ \ 
\alpha=
\begin{bmatrix}
\alpha_1\\
\alpha_2
\end{bmatrix},\ \ \ \ 
b=
\begin{bmatrix}
0\\
8.8\\
29.9\\
\vdots\\
686.8\\
809.2
\end{bmatrix},
$$

au sens des moindres carrés. Cela signifie que l'on veut calculer $\alpha\in\RR^2$ tel que $\|A\alpha-b\|=\min_{y\in\RR^2}\|Ay-b\|$.

**Q3.1** Résoudre ce problème de moindres carrés par la méthode QR.

**Q3.2** Représenter graphiquement

* le nuage de points $(t_i,d_i)_{i=0,\dots,12}$ ;

* le graphique de la fonction linéaire $d(t)$ en fonction de $t\in[0,12]$, avec les paramètres $\alpha_0$ et $\alpha_1$ obtenus. 

Ce modèle vous semble-t-il bien choisi ?

**Q3.3** Supposons maintenant que la distance parcorue en fonction du temps suit un modèle cubique du type 
$$
d(t)=\beta_0+\beta_1t+\beta_2t^2+\beta_3t^3.
$$

Déterminer les coefficients $\beta_0,\ \beta_1,\ \beta_2$ et $\beta_3$ qui minimisent l'erreur $d(t_i)-d_i$ au sens des moindres carrés et représenter à nouveau les points $(t_i,d_i)_{i=0,\dots,12}$ et le graphique de $d$ en fonction de $t$. Quel valeur peut on estimer pour la distance parcorue après 13s ?

**Q4) Exemple 2.**

La pression artérielle $p$, mésurée en milimètres de mercure, d'un enfant en fonction de son poids $w$, en livres (1 livre vaut environ 0,45kg), est approximativement donnée par une relation de la forme
$$
p(w)=\beta_0+\beta_1\ln(w).
$$

On dispose des valeurs expériementales suivantes, correspondant à un échantillon de mesures d'enfants de différents poids :

$$
w_1=44,\ w_2=61,\ w_3=81,\ w_4=113,\ w_5=131
$$

$$
p_1=91,\ p_2=98,\ p_3=103,\ p_4=110,\ p_5=112.
$$

Estimer les paramètres $\beta_0$ et $\beta_1$ qui s'ajustent au mieux aux mesures données, au sens des moindres carrés. Représenter les points $(w_i,p_i)$, ainsi que le graphique de la fonction $p$ obtenue en fonction de $w$. 

In [8]:
## EXEMPLE AVION

## Q3.1 Résolution de Ax=b au sens des moindres carrés

t=np.arange(0,13) # vecteur des instants temporels t_i
d=np.array([0,8.8,29.9,62.0,104.7,159.1,222,294.5,380.4,471.1,571.7,686.8,809.2]) # vecteur des distances d_i

n=13
p=2 

# Matrice A

# vecteur b

# Calcul de la décomposition QR de la matrice A

# La solution du problème de moindres carrés est y tel que R_p y = (Q^T b), avec R_p les p premières lignes de R, 
# (Q^T b)_p les p premières coordonnées du vecteur Q^T b

## Approximation par un polynôme de degré 3 au sens des moindres carrés.

n=13
p=4

Voici la figure que vous devez obtenir avec les deux modèles. On voit que le modèle linéaire n'est pas un bon modèle, le nuage de points n'est pas bien approché par un polynôme de degré 1. Par contre un modèle cubique semble un bon modèle pour décrire la distance $d(t)$. 

![](MC.png)

In [10]:

## EXEMPLE PRESSION

W=np.array([44,61,81,113,131])
P=np.array([91,98,103,110,112])

n=5
p=2

