# Metoda najmanjih kvadrata

---

Neka je zadan sustav s više jednadžbi od nepoznanica:

$$Ax=b, \quad m>n.
$$

Ako sustav ima rješenje, tada je je $Ax-b=0$, odnosno $\| Ax-b\|=0$ za neku od matričnih normi.

Ako sustav nema rješenje, tada je prirodno tražiti rješenje za koje je 

$$
\|Ax-b \|_{1,2,\infty}\to \min
$$

za odabranu vektorsku normu.

Ako je $\mathop{\mathrm{rang}} A=n$, tada se __jedinstveno__ rješenje $x$ za koje 

$$
\|Ax-b \|_{2}\to \min
$$

dobije rješavanjem sustava __normalnih jednadžbi__:

$$
A^T A x=A^T b. \tag{*}
$$

__Dokaz__: Definirajmo

$$
Q(x)=\|Ax-b\|_2^2=(x^TA^T-b^T)(Ax-b)=x^TA^T A x -2x^T A^T b+b^Tb.
$$

Vrijedi

\begin{align}
Q(x+h)&=(x^T+h^T)A^TA(x+h)-2(x^T+h^T)A^Tb+b^Tb \\
&=Q(x) +2h^T(A^TAx-A^Tb)+h^TA^TAh\\ &= Q(x)+\|Ah\|_2^2 \\
&\geq Q(x),
\end{align}

pa se minimum zaista postiže u $x$.

Rješenje je jedinstveno jer $Q(x)=Q(y)$ povlači $\|Ax\|_2=0$ pa je ili $h=0$ ili $\mathop{\mathrm{rang}} A<n$ što je kontradikcija. _QED_

__Geometrijsko značenje__: Vektori $Ax$ i $Ax -b$ su međusobno okomiti, 

$$
(Ax)^T\cdot (Ax - b)=x^T (A^TAx - A^Tb)=0. 
$$ 

Dakle, $Ax$ je ortogonalna projekcija vektora $b$ na skup $\{Ay:\ y \textrm{ proizvoljan}\}$.

__Kvaliteta prilagodbe__: Rješenje $x$ zove se __kvadratična prilagodba__ 
sustavu $A x=b$ u smislu najmanjih kvadrata. Kvalitetu prilagodbe mjerimo s

$$
q=\sqrt{\frac{Q(x)}{Q(0)}}=\frac{\|A x - b\|_2}{\|b\|_2 }.
$$

## Primjer

Riješimo sustav 
\begin{align}
x+y&=0\\
y+z&=1\\
x+z&=0\\
-x+y+z&=1\\
-x-z&=0
\end{align}
u smislu najmanjih kvadrata.

In [1]:
A=[1//1 1 0;0 1 1;1 0 1;-1 1 1;-1 0 -1]

5×3 Array{Rational{Int64},2}:
  1//1  1//1   0//1
  0//1  1//1   1//1
  1//1  0//1   1//1
 -1//1  1//1   1//1
 -1//1  0//1  -1//1

In [2]:
b=collect([0//1,1,0,1,0])

5-element Array{Rational{Int64},1}:
 0//1
 1//1
 0//1
 1//1
 0//1

In [3]:
x=(A'*A)\(A'*b)

3-element Array{Rational{Int64},1}:
 -10//29
  12//29
  11//29

In [4]:
# Kvaliteta prilagodbe
q=sqrt(norm(A*x-b)/norm(b))

0.430923819458906

Ako je sustav predefiniran, standardna naredba odmah računa kvadratičnu prilagodbu, pri čemu se koristi QR rastav:

In [5]:
x1=float(A)\float(b)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

In [6]:
float(x)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

## Primjer

In [7]:
A=rand(20,10)
b=rand(20)

20-element Array{Float64,1}:
 0.126454 
 0.0091437
 0.0504034
 0.120058 
 0.264575 
 0.220947 
 0.180872 
 0.802526 
 0.756937 
 0.22867  
 0.843123 
 0.644781 
 0.154291 
 0.225593 
 0.384215 
 0.83193  
 0.0710257
 0.236733 
 0.876876 
 0.874998 

In [8]:
x=A\b

10-element Array{Float64,1}:
 -0.296383  
  0.568245  
 -0.411889  
  0.273552  
  0.294874  
  0.282537  
  0.260571  
  0.182067  
  0.00464855
 -0.299724  

In [9]:
q=sqrt(norm(A*x-b)/norm(b))

0.619125973603953

## Točnost

__Osjetljivost problema najmanjih kvadarata__ dana je sljedećim ocjenama (vidi [Matrix Computations, poglavlje 5][GVL13]):

Za matricu $A$ __kondiciju__ definiramo na sljedeći način:

$$
\kappa_2(A)=\sqrt{\kappa(A^TA)}=\|A\|_2 \|(A^TA)^{-1} A^T\|_2.
$$

Neka su $x$ i $\hat x$, kvadratične prilagodbe sustava $Ax=b$ i 
$(A+\delta A)\hat x=b+\delta b$. __Reziduali__ su definirani s

$$
r=Ax-b\\
\hat r=(A+\delta A)\hat x-(b+\delta b).
$$

Neka je 

$$
\epsilon=\max \bigg\{ \frac{\|\delta A\|_2}{\|A\|_2},\frac{\|\delta b\|_2}{\|b\|_2}\bigg\}
$$

i neka je 

$$
q=\frac {\|r\|_2}{\|b\|_2}\equiv\sin\theta <1.
$$

Vrijedi:

$$
\frac{\|\hat x-x\|_2}{\|x\|_2}\leq \epsilon \bigg[\frac{2\kappa_2(A)}{\cos \theta} +\tan\theta \kappa_2^2(A)\bigg]+O(\epsilon^2),\\
\frac{\|\hat r-r\|_2}{\|b\|_2}\leq \epsilon [1+ 2\kappa_2(A)](m-n)+O(\epsilon^2).
$$

Vidimo da je rezidual manje osjetljiv od samog mjesta na kojem se postiže.

[GVL13]: https://books.google.hr/books?id=X5YfsuCWpxMC&printsec=frontcover&hl=hr#v=onepage&q&f=false "G. Golub and C. F Van Loan, 'Matrix Computations', 4th Edition, John Hopkins, Baltimore, 2013"

In [10]:
cond(A)

13.354653465513085

In [11]:
δA=1e-4*(rand(20,10)-0.5)

20×10 Array{Float64,2}:
  2.64976e-6  -3.18722e-6  -3.05069e-5  …  -8.02974e-6  -9.861e-6  
  5.94013e-6   4.56337e-5  -4.46493e-5      8.80948e-6   1.05885e-5
 -7.59765e-7   3.73146e-5   1.50913e-5     -6.37473e-6  -4.65528e-5
  2.90121e-5  -6.82118e-6  -3.86753e-5     -2.61591e-5  -2.46768e-5
 -4.3241e-5   -2.33102e-5  -4.29784e-5      6.45571e-6  -3.54195e-5
 -2.13582e-5   3.80604e-5  -4.21591e-6  …   1.13708e-5   3.5129e-5 
 -2.34771e-5   4.0199e-6    2.54097e-5     -4.20101e-6   2.93376e-5
 -1.95941e-5   1.27692e-5  -2.99812e-5     -3.08571e-5   1.96176e-5
  6.98597e-6   4.3164e-5    3.66165e-5     -9.99187e-6   7.2244e-6 
 -3.22212e-5  -2.54371e-7  -2.67414e-5      1.90792e-5  -2.87299e-5
 -4.93149e-5   3.48109e-5  -2.21924e-6  …  -1.28383e-5   5.28178e-6
  7.52904e-6  -1.46837e-5  -1.11389e-5     -1.8373e-5    1.96499e-5
 -3.53133e-5  -3.95453e-5   5.66921e-6      2.70039e-5  -3.6601e-5 
 -2.37416e-5   3.72501e-5  -4.37778e-5     -2.67167e-6   3.45066e-5
 -2.39229e-5   4.18613e-

In [12]:
x1=(A+δA)\b

10-element Array{Float64,1}:
 -0.296441  
  0.568257  
 -0.411885  
  0.273585  
  0.294943  
  0.282485  
  0.260574  
  0.182091  
  0.00465983
 -0.299765  

In [13]:
r=A*x-b
r1=(A+δA)*x-b

20-element Array{Float64,1}:
  0.0864707  
 -0.0693818  
  0.307749   
  0.2034     
  0.0616842  
 -0.0179761  
  0.000879218
 -0.139194   
  0.0737263  
 -0.293665   
 -0.175595   
 -0.0545503  
 -0.0337719  
  0.191491   
 -0.04868    
 -0.319499   
  0.50012    
 -0.0363553  
 -0.207892   
 -0.117094   

In [14]:
norm(x1-x)/norm(x), norm(r1-r)/norm(b)

(0.00012010291583629082,6.171026914370831e-5)

__Napomena__: Ako je $\mathop{\mathrm{rang}}A =n$, matrica $A^TA$ je simetrična i pozitivno definitna pa se sustav (*) može riješiti metodom Choleskog.

Za izračunato rješenje $\hat x$ vrijedi

$$
(A^TA +E)\hat x=A^Tb,
$$

gdje je 

$$ 
\|A\|_2\approx \varepsilon \| A^TA\|_2,
$$

pa za relativnu pogrešku vrijedi ocjena

$$
\frac{\|\hat x -x\|_2}{\|x\|_2}\approx \varepsilon \kappa_2(A^TA) =\varepsilon \kappa^2_2(A).
$$


> Dakle, relativna pogreška rješenja dobivenog pomoću metode normalnih jednadžbi ovisi o __kvadratu kondicije__ pa je bolje koristiti QR rastav.