# Metoda najmanjih kvadrata

---

Neka je zadan sustav s više jednadžbi od nepoznanica:

$$Ax=b, \quad m>n.
$$

Ako sustav ima rješenje, tada je je $Ax-b=0$, odnosno $\| Ax-b\|=0$ za neku od matričnih normi.

Ako sustav nema rješenje, tada je prirodno tražiti rješenje za koje je 

$$
\|Ax-b \|_{1,2,\infty}\to \min
$$

za odabranu vektorsku normu.

Ako je $\mathop{\mathrm{rang}} A=n$, tada se __jedinstveno__ rješenje $x$ za koje 

$$
\|Ax-b \|_{2}\to \min
$$

dobije rješavanjem sustava __normalnih jednadžbi__:

$$
A^T A x=A^T b. \tag{*}
$$

__Dokaz__: Definirajmo

$$
Q(x)=\|Ax-b\|_2^2=(x^TA^T-b^T)(Ax-b)=x^TA^T A x -2x^T A^T b+b^Tb.
$$

Vrijedi

\begin{align}
Q(x+h)&=(x^T+h^T)A^TA(x+h)-2(x^T+h^T)A^Tb+b^Tb \\
&=Q(x) +2h^T(A^TAx-A^Tb)+h^TA^TAh\\ &= Q(x)+\|Ah\|_2^2 \\
&\geq Q(x),
\end{align}

pa se minimum zaista postiže u $x$.

Rješenje je jedinstveno jer $Q(x)=Q(y)$ povlači $\|Ax\|_2=0$ pa je ili $h=0$ ili $\mathop{\mathrm{rang}} A<n$ što je kontradikcija. _QED_

__Geometrijsko značenje__: Vektori $Ax$ i $Ax -b$ su međusobno okomiti, 

$$
(Ax)^T\cdot (Ax - b)=x^T (A^TAx - A^Tb)=0. 
$$ 

Dakle, $Ax$ je ortogonalna projekcija vektora $b$ na skup $\{Ay:\ y \textrm{ proizvoljan}\}$.

__Kvaliteta prilagodbe__: Rješenje $x$ zove se __kvadratična prilagodba__ 
sustavu $A x=b$ u smislu najmanjih kvadrata. Kvalitetu prilagodbe mjerimo s

$$
q=\sqrt{\frac{Q(x)}{Q(0)}}=\frac{\|A x - b\|_2}{\|b\|_2 }.
$$

## Primjer

Riješimo sustav 
\begin{align}
x+y&=0\\
y+z&=1\\
x+z&=0\\
-x+y+z&=1\\
-x-z&=0
\end{align}
u smislu najmanjih kvadrata.

In [1]:
A=[1//1 1 0;0 1 1;1 0 1;-1 1 1;-1 0 -1]

5×3 Array{Rational{Int64},2}:
  1//1  1//1   0//1
  0//1  1//1   1//1
  1//1  0//1   1//1
 -1//1  1//1   1//1
 -1//1  0//1  -1//1

In [2]:
b=collect([0//1,1,0,1,0])

5-element Array{Rational{Int64},1}:
 0//1
 1//1
 0//1
 1//1
 0//1

In [3]:
x=(A'*A)\(A'*b)

3-element Array{Rational{Int64},1}:
 -10//29
  12//29
  11//29

In [4]:
# Kvaliteta prilagodbe
q=sqrt(norm(A*x-b)/norm(b))

0.430923819458906

Ako je sustav predefiniran, standardna naredba odmah računa kvadratičnu prilagodbu, pri čemu se koristi QR rastav:

In [5]:
x1=float(A)\float(b)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

In [6]:
float(x)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

## Primjer

In [7]:
A=rand(20,10)
b=rand(20)

20-element Array{Float64,1}:
 0.0217399
 0.723394 
 0.730561 
 0.879914 
 0.438731 
 0.449617 
 0.731739 
 0.856663 
 0.814439 
 0.728899 
 0.3926   
 0.21855  
 0.546027 
 0.277587 
 0.504028 
 0.451721 
 0.174089 
 0.477106 
 0.0950949
 0.199636 

In [8]:
x=A\b

10-element Array{Float64,1}:
 -0.536485 
 -0.24868  
  0.097567 
  0.644498 
  0.10547  
  0.139978 
 -0.0538669
  0.132034 
  0.0863321
  0.692172 

In [9]:
q=sqrt(norm(A*x-b)/norm(b))

0.6185977979417839

## Točnost

__Osjetljivost problema najmanjih kvadarata__ dana je sljedećim ocjenama (vidi [Matrix Computations, poglavlje 5][GVL13]):

Za matricu $A$ __kondiciju__ definiramo na sljedeći način:

$$
\kappa_2(A)=\sqrt{\kappa(A^TA)}=\|A\|_2 \|(A^TA)^{-1} A^T\|_2.
$$

Neka su $x$ i $\hat x$, kvadratične prilagodbe sustava $Ax=b$ i 
$(A+\delta A)\hat x=b+\delta b$. __Reziduali__ su definirani s

$$
r=Ax-b\\
\hat r=(A+\delta A)\hat x-(b+\delta b).
$$

Neka je 

$$
\epsilon=\max \bigg\{ \frac{\|\delta A\|_2}{\|A\|_2},\frac{\|\delta b\|_2}{\|b\|_2}\bigg\}
$$

i neka je 

$$
q=\frac {\|r\|_2}{\|b\|_2}\equiv\sin\theta <1.
$$

Vrijedi:

$$
\frac{\|\hat x-x\|_2}{\|x\|_2}\leq \epsilon \bigg[\frac{2\kappa_2(A)}{\cos \theta} +\tan\theta \kappa_2^2(A)\bigg]+O(\epsilon^2),\\
\frac{\|\hat r-r\|_2}{\|b\|_2}\leq \epsilon [1+ 2\kappa_2(A)](m-n)+O(\epsilon^2).
$$

Vidimo da je rezidual manje osjetljiv od samog mjesta na kojem se postiže.

[GVL13]: https://books.google.hr/books?id=X5YfsuCWpxMC&printsec=frontcover&hl=hr#v=onepage&q&f=false "G. Golub and C. F Van Loan, 'Matrix Computations', 4th Edition, John Hopkins, Baltimore, 2013"

In [10]:
cond(A)

14.992397653556477

In [11]:
δA=1e-4*(rand(20,10)-0.5)

20×10 Array{Float64,2}:
  8.82305e-6  -4.90701e-5  -2.61028e-5  …   4.86251e-5   2.73651e-5
  4.1584e-5   -6.34751e-6  -8.30642e-6     -2.99114e-5   1.2169e-5 
 -3.19676e-5   2.37625e-5  -1.31954e-5      3.88738e-5   2.14333e-5
 -2.09657e-5  -4.15829e-5   2.39375e-5     -3.67128e-5  -4.05824e-5
  3.3162e-5   -4.32269e-5  -2.8021e-5       1.77653e-5  -4.57864e-6
  2.58677e-5  -9.91587e-6  -3.98954e-5  …  -2.47609e-7   1.01248e-5
 -3.72316e-6  -3.43507e-5   6.76026e-6      4.98685e-5  -2.27215e-5
 -3.31496e-6   3.33782e-5   3.79953e-5     -4.47283e-5  -2.72294e-5
  2.45086e-5   4.69508e-7  -2.43176e-5     -3.72879e-5   1.89722e-5
  2.6658e-5   -3.05556e-5   2.72716e-5     -4.47845e-5   1.36299e-5
  2.17869e-5   3.56281e-5   4.96744e-5  …   5.9176e-6   -4.41929e-5
 -3.88406e-5  -1.71666e-5  -1.97768e-5      1.40393e-5   3.54446e-5
 -4.88868e-5  -2.94216e-5   3.77483e-5      3.65597e-5   3.81177e-5
 -3.68957e-5   6.94697e-6  -3.56536e-5     -1.65687e-5   2.37936e-5
 -1.20158e-5   2.15483e-

In [12]:
x1=(A+δA)\b

10-element Array{Float64,1}:
 -0.53627  
 -0.248696 
  0.0976994
  0.644351 
  0.105533 
  0.139966 
 -0.0538724
  0.132019 
  0.0861751
  0.692032 

In [13]:
r=A*x-b
r1=(A+δA)*x-b

20-element Array{Float64,1}:
  0.381576 
 -0.192526 
  0.107966 
 -0.0837829
 -0.0396013
  0.0271564
  0.0173494
 -0.358967 
 -0.448992 
 -0.236294 
 -0.057133 
  0.207962 
  0.0739562
  0.278868 
 -0.156618 
  0.144746 
  0.190938 
 -0.169459 
  0.208805 
 -0.0956617

In [14]:
norm(x1-x)/norm(x), norm(r1-r)/norm(b)

(0.00032046951955395746,5.582222043248627e-5)

__Napomena__: Ako je $\mathop{\mathrm{rang}}A =n$, matrica $A^TA$ je simetrična i pozitivno definitna pa se sustav (*) može riješiti metodom Choleskog.

Za izračunato rješenje $\hat x$ vrijedi

$$
(A^TA +E)\hat x=A^Tb,
$$

gdje je 

$$ 
\|A\|_2\approx \varepsilon \| A^TA\|_2,
$$

pa za relativnu pogrešku vrijedi ocjena

$$
\frac{\|\hat x -x\|_2}{\|x\|_2}\approx \varepsilon \kappa_2(A^TA) =\varepsilon \kappa^2_2(A).
$$


> Dakle, relativna pogreška rješenja dobivenog pomoću metode normalnih jednadžbi ovisi o __kvadratu kondicije__ pa je bolje koristiti QR rastav.