# Metoda najmanjih kvadrata

---

Neka je zadan sustav s više jednadžbi od nepoznanica:

$$Ax=b, \quad m>n.
$$

Ako sustav ima rješenje, tada je je $Ax-b=0$, odnosno $\| Ax-b\|=0$ za neku od matričnih normi.

Ako sustav nema rješenje, tada je prirodno tražiti rješenje za koje je 

$$
\|Ax-b \|_{1,2,\infty}\to \min
$$

za odabranu vektorsku normu.

Ako je $\mathop{\mathrm{rang}} A=n$, tada se __jedinstveno__ rješenje $x$ za koje 

$$
\|Ax-b \|_{2}\to \min
$$

dobije rješavanjem sustava __normalnih jednadžbi__:

$$
A^T A x=A^T b. \tag{*}
$$

__Dokaz__: Definirajmo

$$
Q(x)=\|Ax-b\|_2^2=(x^TA^T-b^T)(Ax-b)=x^TA^T A x -2x^T A^T b+b^Tb.
$$

Vrijedi

\begin{align}
Q(x+h)&=(x^T+h^T)A^TA(x+h)-2(x^T+h^T)A^Tb+b^Tb \\
&=Q(x) +2h^T(A^TAx-A^Tb)+h^TA^TAh\\ &= Q(x)+\|Ah\|_2^2 \\
&\geq Q(x),
\end{align}

pa se minimum zaista postiže u $x$.

Rješenje je jedinstveno jer $Q(x)=Q(y)$ povlači $\|Ax\|_2=0$ pa je ili $h=0$ ili $\mathop{\mathrm{rang}} A<n$ što je kontradikcija. _QED_

__Geometrijsko značenje__: Vektori $Ax$ i $Ax -b$ su međusobno okomiti, 

$$
(Ax)^T\cdot (Ax - b)=x^T (A^TAx - A^Tb)=0. 
$$ 

Dakle, $Ax$ je ortogonalna projekcija vektora $b$ na skup $\{Ay:\ y \textrm{ proizvoljan}\}$.

__Kvaliteta prilagodbe__: Rješenje $x$ zove se _kvadratična prilagodba_ 
sustavu $A x=b$ u smislu najmanjih kvadrata. Kvalitetu prilagodbe mjerimo s

$$
q=\sqrt{\frac{Q(x)}{Q(0)}}=\frac{\|A x - b\|_2}{\|b\|_2 }.
$$

## Primjer

Riješimo sustav 
\begin{align}
x+y&=0\\
y+z&=1\\
x+z&=0\\
-x+y+z&=1\\
-x-z&=0
\end{align}
u smislu najmanjih kvadrata.

In [1]:
A=[1//1 1 0;0 1 1;1 0 1;-1 1 1;-1 0 -1]

5x3 Array{Rational{Int64},2}:
  1//1  1//1   0//1
  0//1  1//1   1//1
  1//1  0//1   1//1
 -1//1  1//1   1//1
 -1//1  0//1  -1//1

In [2]:
b=collect([0//1,1,0,1,0])

5-element Array{Rational{Int64},1}:
 0//1
 1//1
 0//1
 1//1
 0//1

In [3]:
x=(A'*A)\(A'*b)

3-element Array{Rational{Int64},1}:
 -10//29
  12//29
  11//29

In [4]:
# Kvaliteta prilagodbe
q=sqrt(norm(A*x-b)/norm(b))

0.430923819458906

Ako je sustav predefiniran, standardna naredba odmah računa kvadratičnu prilagodbu, pri čemu se koristi QR rastav:

In [5]:
x1=float(A)\float(b)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

In [6]:
float(x)

3-element Array{Float64,1}:
 -0.344828
  0.413793
  0.37931 

## Primjer

In [7]:
A=rand(20,10)
b=rand(20)

20-element Array{Float64,1}:
 0.683395 
 0.328956 
 0.792499 
 0.329917 
 0.259025 
 0.302943 
 0.0778392
 0.469752 
 0.179436 
 0.312817 
 0.388671 
 0.620763 
 0.847881 
 0.390102 
 0.661421 
 0.61588  
 0.412822 
 0.23792  
 0.912836 
 0.857287 

In [8]:
x=A\b

10-element Array{Float64,1}:
  0.428966  
  0.475338  
  0.530557  
 -0.615746  
  0.0294337 
 -0.237033  
  0.0804264 
  0.00325244
 -0.0682694 
  0.447424  

In [9]:
q=sqrt(norm(A*x-b)/norm(b))

0.5087149270022184

## Točnost

__Osjetljivost problema najmanjih kvadarata__ dana je sljedećim ocjenama (vidi [G. Golub and C. F. Van Loan, Matrix Computations, poglavlje 5][GVL13]):

Za matricu $A$ _kondiciju_ definiramo na sljedeći način:

$$
\kappa_2(A)=\sqrt{\kappa(A^TA)}=\|A\|_2 \|(A^TA)^{-1} A^T\|_2.
$$

Neka su $x$ i $\hat x$, kvadratične prilagodbe sustava $Ax=b$ i 
$(A+\delta A)\hat x=b+\delta b$. __Reziduali__ su definirani s

$$
r=Ax-b\\
\hat r=(A+\delta A)\hat x-(b+\delta b).
$$

Neka je 

$$
\epsilon=\max \bigg\{ \frac{\|\delta A\|_2}{\|A\|_2},\frac{\|\delta b\|_2}{\|b\|_2}\bigg\}
$$

i neka je 

$$
q=\frac {\|r\|_2}{\|b\|_2}\equiv\sin\theta <1.
$$

Vrijedi:

$$
\frac{\|\hat x-x\|_2}{\|x\|_2}\leq \epsilon \bigg[\frac{2\kappa_2(A)}{\cos \theta} +\tan\theta \kappa_2^2(A)\bigg]+O(\epsilon^2),\\
\frac{\|\hat r-r\|_2}{\|b\|_2}\leq \epsilon [1+ 2\kappa_2(A)](m-n)+O(\epsilon^2).
$$

Vidimo da je rezidual manje osjetljiv od samog mjesta na kojem se postiže.

[GVL13]: https://books.google.hr/books?id=X5YfsuCWpxMC&printsec=frontcover&hl=hr#v=onepage&q&f=false "G. Golub and C. F Van Loan, 'Matrix Computations', 4th Edition, John Hopkins, Baltimore, 2013"

In [10]:
cond(A)

13.861183372509538

In [11]:
δA=1e-4*(rand(20,10)-0.5)

20x10 Array{Float64,2}:
 -3.80587e-5   4.70737e-5   4.7769e-5   …  -3.25506e-5   1.89111e-5
  4.58416e-5  -3.46741e-5  -4.5235e-5      -3.23666e-5  -3.95984e-5
  3.69252e-5  -3.60657e-5  -3.79493e-5      3.83415e-5  -3.2918e-5 
  1.00513e-5   2.16715e-5  -3.24581e-5      4.62476e-5   4.73522e-5
  3.75893e-5   3.60338e-5  -3.53398e-5     -2.52346e-5   3.8128e-6 
 -2.97186e-5   3.69137e-5  -3.59173e-5  …   2.4186e-6    3.63913e-5
  4.61307e-5  -1.62231e-5  -2.17826e-5     -4.89096e-5  -4.23806e-5
 -3.89317e-5  -1.27753e-5   3.97413e-5     -2.28862e-5  -4.32417e-6
  2.89518e-5   2.36511e-5  -2.52429e-5     -3.61812e-5  -2.7323e-5 
  1.00397e-5   2.90135e-5   1.92421e-5      4.01043e-6  -4.34003e-5
  3.78303e-5  -4.61766e-5  -2.89051e-5  …   3.71185e-5  -4.79081e-5
  7.08318e-6  -1.2403e-5   -1.45206e-5     -2.42437e-5  -2.10024e-5
  5.42298e-6  -3.5248e-8   -2.95935e-5     -3.41368e-5  -4.73181e-5
 -2.67364e-5   2.79263e-5   1.18574e-5      3.48495e-5  -1.78659e-6
  1.81983e-5   3.00798e-

In [12]:
x1=(A+δA)\b

10-element Array{Float64,1}:
  0.428953  
  0.47535   
  0.530542  
 -0.615702  
  0.0294057 
 -0.236982  
  0.0804082 
  0.00326613
 -0.0682443 
  0.447378  

In [13]:
r=A*x-b
r1=(A+δA)*x-b

20-element Array{Float64,1}:
 -0.0311367
  0.0303374
 -0.0563575
  0.0982178
  0.0810181
 -0.0204874
 -0.073853 
 -0.123733 
  0.247049 
 -0.0678008
  0.0269965
  0.0445807
 -0.234461 
  0.206257 
  0.0713389
 -0.0363546
  0.180788 
  0.137851 
 -0.118917 
 -0.333323 

In [14]:
norm(x1-x)/norm(x), norm(r1-r)/norm(b)

(8.274093644912259e-5,6.215435616083538e-5)

__Napomena__: Ako je $\mathop{\mathrm{rang}}A =n$, matrica $A^TA$ je simetrična i pozitivno definitna pa se sustav (*) može riješiti metodom Choleskog.

Za izračunato rješenje $\hat x$ vrijedi

$$
(A^TA +E)\hat x=A^Tb,
$$

gdje je 

$$ 
\|A\|_2\approx \varepsilon \| A^TA\|_2,
$$

pa za relativnu pogrešku vrijedi ocjena

$$
\frac{\|\hat x -x\|_2}{\|x\|_2}\approx \varepsilon \kappa_2(A^TA) =\varepsilon \kappa^2_2(A).
$$


> Dakle, relativna pogreška rješenja dobivenog pomoću metode normalnih jednadžbi ovisi o _kvadratu kondicije_ pa je bolje koristiti QR rastav.