# Metoda najmanjih kvadrata

---

Neka je zadan sustav s više jednadžbi od nepoznanica:

$$Ax=b, \quad m>n.
$$

Ako sustav ima rješenje, tada je je $Ax-b=0$, odnosno $\| Ax-b\|=0$ za neku od matričnih normi.

Ako sustav nema rješenje, tada je prirodno tražiti rješenje za koje je 

$$
\|Ax-b \|_{1,2,\infty}\to \min
$$

za odabranu vektorsku normu.

Ako je $\mathop{\mathrm{rang}} A=n$, tada se __jedinstveno__ rješenje $x$ za koje 

$$
\|Ax-b \|_{2}\to \min
$$

dobije rješavanjem sustava __normalnih jednadžbi__:

$$
A^T A x=A^T b. \tag{*}
$$

__Dokaz__: Definirajmo

$$
Q(x)=\|Ax-b\|_2^2=(x^TA^T-b^T)(Ax-b)=x^TA^T A x -2x^T A^T b+b^Tb.
$$

Vrijedi

\begin{align}
Q(x+h)&=(x^T+h^T)A^TA(x+h)-2(x^T+h^T)A^Tb+b^Tb \\
&=Q(x) +2h^T(A^TAx-A^Tb)+h^TA^TAh\\ &= Q(x)+\|Ah\|_2^2 \\
&\geq Q(x),
\end{align}

pa se minimum zaista postiže u $x$.

Rješenje je jedinstveno jer $Q(x)=Q(y)$ povlači $\|Ax\|_2=0$ pa je ili $h=0$ ili $\mathop{\mathrm{rang}} A<n$ što je kontradikcija. _QED_

__Geometrijsko značenje__: Vektori $Ax$ i $Ax -b$ su međusobno okomiti, 

$$
(Ax)^T\cdot (Ax - b)=x^T (A^TAx - A^Tb)=0. 
$$ 

Dakle, $Ax$ je ortogonalna projekcija vektora $b$ na skup $\{Ay:\ y \textrm{ proizvoljan}\}$.

__Kvaliteta prilagodbe__: Rješenje $x$ zove se __kvadratična prilagodba__ 
sustavu $A x=b$ u smislu najmanjih kvadrata. Kvalitetu prilagodbe mjerimo s

$$
q=\sqrt{\frac{Q(x)}{Q(0)}}=\frac{\|A x - b\|_2}{\|b\|_2 }.
$$

## Primjer

Riješimo sustav 
\begin{align}
x+y&=0\\
y+z&=1\\
x+z&=0\\
-x+y+z&=1\\
-x-z&=0
\end{align}
u smislu najmanjih kvadrata.

In [1]:
A=[1//1 1 0;0 1 1;1 0 1;-1 1 1;-1 0 -1]

5x3 Array{Rational{Int64},2}:
  1//1  1//1   0//1
  0//1  1//1   1//1
  1//1  0//1   1//1
 -1//1  1//1   1//1
 -1//1  0//1  -1//1

In [2]:
b=collect([0//1,1,0,1,0])

5-element Array{Rational{Int64},1}:
 0//1
 1//1
 0//1
 1//1
 0//1

In [3]:
x=(A'*A)\(A'*b)

3-element Array{Rational{Int64},1}:
 -10//29
  12//29
  11//29

In [4]:
# Kvaliteta prilagodbe
q=sqrt(norm(A*x-b)/norm(b))

0.430923819458906

Ako je sustav predefiniran, standardna naredba odmah računa kvadratičnu prilagodbu, pri čemu se koristi QR rastav:

In [5]:
x1=float(A)\float(b)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

In [6]:
float(x)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

## Primjer

In [7]:
A=rand(20,10)
b=rand(20)

20-element Array{Float64,1}:
 0.166099 
 0.989204 
 0.772658 
 0.257965 
 0.530256 
 0.01435  
 0.432266 
 0.480245 
 0.0750227
 0.05277  
 0.0382423
 0.484689 
 0.50907  
 0.933    
 0.479462 
 0.192384 
 0.0113416
 0.728678 
 0.203411 
 0.410308 

In [8]:
x=A\b

10-element Array{Float64,1}:
  0.24593   
 -0.339952  
  0.00144587
  0.0650736 
  0.142436  
 -0.248104  
  0.343963  
  0.321635  
  0.0271387 
  0.155659  

In [9]:
q=sqrt(norm(A*x-b)/norm(b))

0.708789452606682

## Točnost

__Osjetljivost problema najmanjih kvadarata__ dana je sljedećim ocjenama (vidi [Matrix Computations, poglavlje 5][GVL13]):

Za matricu $A$ __kondiciju__ definiramo na sljedeći način:

$$
\kappa_2(A)=\sqrt{\kappa(A^TA)}=\|A\|_2 \|(A^TA)^{-1} A^T\|_2.
$$

Neka su $x$ i $\hat x$, kvadratične prilagodbe sustava $Ax=b$ i 
$(A+\delta A)\hat x=b+\delta b$. __Reziduali__ su definirani s

$$
r=Ax-b\\
\hat r=(A+\delta A)\hat x-(b+\delta b).
$$

Neka je 

$$
\epsilon=\max \bigg\{ \frac{\|\delta A\|_2}{\|A\|_2},\frac{\|\delta b\|_2}{\|b\|_2}\bigg\}
$$

i neka je 

$$
q=\frac {\|r\|_2}{\|b\|_2}\equiv\sin\theta <1.
$$

Vrijedi:

$$
\frac{\|\hat x-x\|_2}{\|x\|_2}\leq \epsilon \bigg[\frac{2\kappa_2(A)}{\cos \theta} +\tan\theta \kappa_2^2(A)\bigg]+O(\epsilon^2),\\
\frac{\|\hat r-r\|_2}{\|b\|_2}\leq \epsilon [1+ 2\kappa_2(A)](m-n)+O(\epsilon^2).
$$

Vidimo da je rezidual manje osjetljiv od samog mjesta na kojem se postiže.

[GVL13]: https://books.google.hr/books?id=X5YfsuCWpxMC&printsec=frontcover&hl=hr#v=onepage&q&f=false "G. Golub and C. F Van Loan, 'Matrix Computations', 4th Edition, John Hopkins, Baltimore, 2013"

In [10]:
cond(A)

20.588460242751626

In [11]:
δA=1e-4*(rand(20,10)-0.5)

20x10 Array{Float64,2}:
 -1.9214e-5   -1.11937e-5  -4.53915e-5  …  -5.27373e-6  -8.53116e-6
 -2.58294e-5   2.71503e-5  -2.6394e-5       1.62489e-5   1.38992e-6
 -3.77477e-6   1.15398e-5   3.94376e-7     -3.22636e-6   3.05955e-6
  1.6206e-5   -1.36506e-5   4.48609e-5     -1.38901e-5   2.13736e-5
 -3.62115e-5  -1.27123e-5  -2.27213e-5      5.84242e-6   2.29748e-5
 -3.32238e-5  -3.11676e-5   3.99667e-5  …  -1.54142e-5   2.85374e-5
 -4.84128e-5   1.8978e-5   -2.09586e-5      2.35373e-5  -4.02488e-5
  1.2838e-5   -3.87604e-5   2.86235e-5     -2.02326e-5  -2.61881e-6
  7.53995e-6  -4.1393e-5    1.9649e-5      -3.40317e-5  -2.71387e-5
  2.28628e-5  -1.35953e-5  -1.89866e-5     -4.66765e-5   1.7548e-5 
 -3.03537e-5  -4.46729e-5  -2.12625e-6  …   4.46005e-5  -1.1126e-5 
  3.28806e-5   1.70716e-5   3.17601e-5     -3.80589e-5  -4.75167e-6
  2.50765e-5   3.63437e-5   2.94684e-6     -2.66497e-5   1.32845e-5
  3.20586e-5  -1.5613e-5    3.05049e-5     -1.37526e-6   2.79822e-5
  1.37132e-5  -2.83235e-

In [12]:
x1=(A+δA)\b

10-element Array{Float64,1}:
  0.245941  
 -0.339802  
  0.00152111
  0.065012  
  0.142383  
 -0.248017  
  0.343945  
  0.321716  
  0.0269939 
  0.155573  

In [13]:
r=A*x-b
r1=(A+δA)*x-b

20-element Array{Float64,1}:
  0.10834  
 -0.31516  
 -0.194999 
  0.164261 
 -0.119223 
  0.119973 
  0.121076 
 -0.220798 
  0.379826 
  0.20172  
  0.478388 
 -0.142194 
 -0.316618 
 -0.305485 
 -0.248539 
  0.0498334
  0.430245 
 -0.191728 
 -0.090967 
  0.0946719

In [14]:
norm(x1-x)/norm(x), norm(r1-r)/norm(b)

(0.0003909913129679,3.4653198559193164e-5)

__Napomena__: Ako je $\mathop{\mathrm{rang}}A =n$, matrica $A^TA$ je simetrična i pozitivno definitna pa se sustav (*) može riješiti metodom Choleskog.

Za izračunato rješenje $\hat x$ vrijedi

$$
(A^TA +E)\hat x=A^Tb,
$$

gdje je 

$$ 
\|A\|_2\approx \varepsilon \| A^TA\|_2,
$$

pa za relativnu pogrešku vrijedi ocjena

$$
\frac{\|\hat x -x\|_2}{\|x\|_2}\approx \varepsilon \kappa_2(A^TA) =\varepsilon \kappa^2_2(A).
$$


> Dakle, relativna pogreška rješenja dobivenog pomoću metode normalnih jednadžbi ovisi o __kvadratu kondicije__ pa je bolje koristiti QR rastav.