# Laborator 2 - Factorizari LU

## De ce?

Sistemele de ecuatii modeleaza foarte multe procese si transformari din lumea reala, iar rezolvarea lor este necesara in multe domenii precum:

- economie
- procese tehnologice: se cunosc iesirile si matricea de transfer si se cauta intrarile
- transporturi: Cand ajung trenurile/avioanele intr-o/un anumit/a gara/aeroport?
- ELTH...

## Forma generala

$$Ax = b$$

Adica:

$$\begin{bmatrix}
    a_{11} & a_{12} & \dots & a_{1n} \\
    a_{21} & a_{22} & \dots & a_{2n} \\
    . \\
    . \\
    . \\
    a_{n1} & a_{n2} & \dots & a_{nn}
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    . \\
    . \\
    . \\
    x_n
  \end{bmatrix}
  =
  \begin{bmatrix}
    b_1 \\
    b_2 \\
    . \\
    . \\
    . \\
    b_n
  \end{bmatrix}
  $$

### Exemplu

Fie sistemul:

$$\begin{bmatrix}
    1 & 1 & 1 \\
    -2 & 2 & -4 \\
    2 & -3 & -1
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3
  \end{bmatrix}
  =
  \begin{bmatrix}
    0 \\
    12 \\
    7
  \end{bmatrix}
  $$
  
Exista o rezolvare directa in _Matlab/Octave_ a sistemelor de ecuatii liniare:

In [None]:
A = [1 1 1; -2 -2 -4; 2 -3 -1]
b = [0; 12; 7]

In [None]:
% In Matlab/Octave un sistem de ecuatii LINIARE se poate rezolva astfel:
x = A \ b

Aceasta metoda este insa specifica _Octave/Matlab_. Desi exista si alte limbaje (precum _R_ sau _numpy_ din  *Python*) care dispun de functionalitati similare, in alte limbaje (mult mai folosite pentru uz general si nu optimizate pentru calcul matriceal) asa ceva nu exista.

Din ratiuni practice, care vizeaza reducerea numarului de operatii, s-au inventat metode de rezolvare a sistemelor liniare care exploateaza diverse particularitati ale matricelor.

## Observatie
Daca $A$ este **matrice triunghiulara**, sunt doua situatii:

### A este o matrice superior triunghiulara U
$$\begin{bmatrix}
    u_{11} & u_{12} & u_{13} & \dots & u_{1n} \\
    0 & u_{22} & u_{23} & \dots & u_{2n} \\
    0 & 0 & u_{33} & \dots & u_{3n} \\
    . \\
    . \\
    . \\
    0 & 0 & 0 & \dots & u_{nn}
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3 \\
    . \\
    . \\
    . \\
    x_n
  \end{bmatrix}
  =
  \begin{bmatrix}
    b_1 \\
    b_2 \\
    b_3 \\
    . \\
    . \\
    . \\
    b_n
  \end{bmatrix}
  $$
  
Sistemul se va rezolva *de jos in sus*, pornind de la $u_{nn}$ astfel:

$u_{nn}x_n = b_n \Rightarrow x_n = \displaystyle\frac{b_n}{u_{nn}}$

$u_{n-1 n-1}x_{n-1} + u_{n-1 n}x_n = b_n \Rightarrow x_{n-1} = \displaystyle\frac{b_n - u_{n-1 n}x_n}{u_{n-1 n-1}}$

S.a.m.d. Deci pe cazul general:

$$x_i = \displaystyle\frac{b_i - \sum_{j=i+1}^{n} u_{ij}x_j}{u_{ii}} \ \ \forall i \in [1, n]$$

### A este o matrice inferior triunghiulara L
$$\begin{bmatrix}
    l_{11} & 0 & 0 & \dots & 0 \\
    l_{21} & l_{22} & 0 & \dots & 0 \\
    l_{31} & l_{32} & l_{33} & \dots & 0 \\
    . \\
    . \\
    . \\
    l_{n1} & l_{n2} & l_{n3} & \dots & l_{nn} \\
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3 \\
    . \\
    . \\
    . \\
    x_n
  \end{bmatrix}
  =
  \begin{bmatrix}
    b_1 \\
    b_2 \\
    b_3 \\
    . \\
    . \\
    . \\
    b_n
  \end{bmatrix}
  $$
  
Sistemul se va rezolva *de sus in jos*, pornind de la $l_{11}$ astfel:

$l_{11}x_1 = b_1 \Rightarrow x_1 = \displaystyle\frac{b_1}{l_{11}}$

$l_{21}x_1 + l_{22}x_2 = b_2 \Rightarrow x_2 = \displaystyle\frac{b_2 - l_{21}x_1}{l_{22}}$

S.a.m.d. Deci pe cazul general:

$$x_i = \displaystyle\frac{b_i - \sum_{j=1}^{i-1} l_{ij}x_j}{u_{ii}} \ \ \forall i \in [1, n]$$

## Cum folosim matricele triunghiulare?
Daca stim ca putem rezolva **sisteme triunghiulare** mult mai eficient decat sisteme oarecare, incercam sa convertim un sistem oarecare la unul sau mai multe triunghiulare, adica sa scriem matricea sistemului oarecare (fie aceasta $A$) ca un **produs de matrice triunghiulare** ($L$ si $U$).

Fie deci $A = L \cdot U$, unde $L$ si $U$ sunt matrice inferior, respectiv superior triunghiulare. Asadar:

$$Ax = b \Leftrightarrow L(Ux)=b$$

$$\begin{bmatrix}
    l_{11} & 0 & 0 & \dots & 0 \\
    l_{21} & l_{22} & 0 & \dots & 0 \\
    l_{31} & l_{32} & l_{33} & \dots & 0 \\
    . \\
    . \\
    . \\
    l_{n1} & l_{n2} & l_{n3} & \dots & l_{nn} \\
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    u_{11} & u_{12} & u_{13} & \dots & u_{1n} \\
    0 & u_{22} & u_{23} & \dots & u_{2n} \\
    0 & 0 & u_{33} & \dots & u_{3n} \\
    . \\
    . \\
    . \\
    0 & 0 & 0 & \dots & u_{nn}
  \end{bmatrix}
    \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3 \\
    . \\
    . \\
    . \\
    x_n
  \end{bmatrix}
  =
  \begin{bmatrix}
    b_1 \\
    b_2 \\
    b_3 \\
    . \\
    . \\
    . \\
    b_n
  \end{bmatrix}
  $$

Fie $y = Ux \Rightarrow L(Ux) = b \Leftrightarrow Ly = x$. Vom rezolva mai intai acest sistem, dupa care sistemul $Ux = y$ folosind valoarea lui $y$ obtinuta din rezolvarea sistemului anterior.

$$\begin{bmatrix}
    l_{11} & 0 & 0 & \dots & 0 \\
    l_{21} & l_{22} & 0 & \dots & 0 \\
    l_{31} & l_{32} & l_{33} & \dots & 0 \\
    . \\
    . \\
    . \\
    l_{n1} & l_{n2} & l_{n3} & \dots & l_{nn} \\
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    y_1 \\
    y_2 \\
    y_3 \\
    . \\
    . \\
    . \\
    y_n
  \end{bmatrix}
  =
  \begin{bmatrix}
    b_1 \\
    b_2 \\
    b_3 \\
    . \\
    . \\
    . \\
    b_n
  \end{bmatrix}
  $$

$$\begin{bmatrix}
    u_{11} & u_{12} & u_{13} & \dots & u_{1n} \\
    0 & u_{22} & u_{23} & \dots & u_{2n} \\
    0 & 0 & u_{33} & \dots & u_{3n} \\
    . \\
    . \\
    . \\
    0 & 0 & 0 & \dots & u_{nn}
  \end{bmatrix}
    \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3 \\
    . \\
    . \\
    . \\
    x_n
  \end{bmatrix}
  =
  \begin{bmatrix}
    y_1 \\
    y_2 \\
    y_3 \\
    . \\
    . \\
    . \\
    y_n
  \end{bmatrix}
  $$

## De ce putem face descompuneri LU?
Se impun 2 intrebari:

1. Cum stim ca exista $L$ si $U$ astfel incat $A = LU \ \ \forall A \in \mathbb{R}^{n \texttt{x} n}$?
2. Daca stim ca (1) este adevarat, cum calculam $L$ si $U$?

Vom raspunde la ambele intrebari simultan, dand 3 metode de generare a matricelor $L$ si $U$ pe baza matricei $A$, $\forall A \in \mathbb{R}^{n \texttt{x} n}$.

## Nevoia unor constrangeri suplimentare
Sa presupunem initial ca raspunsul la intrebarea (1) este pozitiv. Vrem acum sa calculam $L$ si $U$. Astfel:

$$\begin{bmatrix}
    a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\
    a_{21} & a_{22} & a_{23} & \dots & a_{2n} \\
    a_{31} & a_{32} & a_{33} & \dots & a_{3n} \\
    . \\
    . \\
    . \\
    a_{n1} & a_{n2} & a_{n3} & \dots & a_{nn}
  \end{bmatrix}
  =
  \begin{bmatrix}
    l_{11} & 0 & 0 & \dots & 0 \\
    l_{21} & l_{22} & 0 & \dots & 0 \\
    l_{31} & l_{32} & l_{33} & \dots & 0 \\
    . \\
    . \\
    . \\
    l_{n1} & l_{n2} & l_{n3} & \dots & l_{nn} \\
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    u_{11} & u_{12} & u_{13} & \dots & u_{1n} \\
    0 & u_{22} & u_{23} & \dots & u_{2n} \\
    0 & 0 & u_{33} & \dots & u_{3n} \\
    . \\
    . \\
    . \\
    0 & 0 & 0 & \dots & u_{nn}
  \end{bmatrix}
  $$
  
Vom demonstra ca acest lucru nu se poate fara a impune constrangeri suplimentare. Problema se reduce la calcularea elementelor $l_{ij}$ si $u_{kl}$ din matricele de mai sus pe baza elementelor $a_{pq}$:

$$l_{11}u_{11} = a_{11}$$
$$l_{11}u_{12} = a_{12}$$
$$.$$
$$.$$
$$.$$
$$\sum_{i=1}^{n}l_{ni}u_{in} = a_{nn}$$

In total, avem $n^2$ ecuatii. In fiecare dintre matricele $L$ si $U$ avem cate $\displaystyle\frac{n(n + 1)}{2}$ necunoscute, deci in total $n^2 + n$ necunoscute, **mai multe decat numarul de ecuatii**, deci sistemul **nu are solutie unica!**

## Constrangerile
Din moment ce avem doar $n^2$ ecuatii, trebuie sa reducem numarul de necunoscute la $n^2$. Astfel, avem mai multe metode de factorizare _LU_ in functe de modul in care reducem necunoscutele, ceea ce presupune sa impunem anumite valori pentru unele dintre necunoscute.

# Metoda Crout
Inventata de matematicianul american [Prescott Durand Crout](https://en.wikipedia.org/wiki/Prescott_Durand_Crout), impune ca pe diagonala principala a matricei $U$ sa se gaseasca doar 1 ($u_{ii} = 1 \ \ \forall i \in [1, n]$).

$$\begin{bmatrix}
    a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\
    a_{21} & a_{22} & a_{23} & \dots & a_{2n} \\
    a_{31} & a_{32} & a_{33} & \dots & a_{3n} \\
    . \\
    . \\
    . \\
    a_{n1} & a_{n2} & a_{n3} & \dots & a_{nn}
  \end{bmatrix}
  =
  \begin{bmatrix}
    l_{11} & 0 & 0 & \dots & 0 \\
    l_{21} & l_{22} & 0 & \dots & 0 \\
    l_{31} & l_{32} & l_{33} & \dots & 0 \\
    . \\
    . \\
    . \\
    l_{n1} & l_{n2} & l_{n3} & \dots & l_{nn} \\
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    1 & u_{12} & u_{13} & \dots & u_{1n} \\
    0 & 1 & u_{23} & \dots & u_{2n} \\
    0 & 0 & 1 & \dots & u_{3n} \\
    . \\
    . \\
    . \\
    0 & 0 & 0 & \dots & 1
  \end{bmatrix}
  $$

Pentru un element oareacare $a_{pq}$:

$$a_{pq} = \sum_{i=1}^{n}l_{pi}u_{iq}$$

Dar $l_{pi} = 0 \ \ \forall i > p$ si $u_{iq} = 0 \ \ \forall i > q$, precum si $l_{pp} = 1$. Asadar, ecuatia de mai sus devine:

$$\text{Pentru } p \geq q: a_{pq} = l_{pq} + \sum_{i=1}^{q - 1}l_{pi}u_{iq} \Rightarrow l_{pq} = a_{pq} - \sum_{i=1}^{q - 1}l_{pi}u_{iq}$$

$$\text{Pentru } p \lt q: a_{pq} = l_{pp}u_{pq} + \sum_{i=1}^{p - 1}l_{pi}u_{iq} \Rightarrow u_{pq} = \displaystyle\frac{a_{pq} - \sum_{i=1}^{p - 1}l_{pi}u_{iq}}{l_{pp}}$$

## Problema la tabla!

Rezolvati sistemul urmator folosind factorizarea *Crout*:

$$\begin{bmatrix}
    7 & 3 & 1 \\
    2 & 7 & 1 \\
    1 & 1 & 3
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3
  \end{bmatrix}
  =
  \begin{bmatrix}
    1 \\
    2 \\
    1
  \end{bmatrix}
  $$

In [None]:
function [L, U] = crout(A)
    % TODO: urmariti explicatiile de la tabla si completati codul
    % BONUS: veniti cu idei de vectorizare
endfunction

In [None]:
A = magic(4)
[L, U] = crout(A)
L * U

# Metoda Doolittle
_Nu l-am gasit pe Doolittle pe Google... :(_. Metoda este un fel de invers al metodei *Crout*: acum matricea $L$ are elementele de pe diagonala principala egale cu $1$ ($l_{ii} = 1 \ \ \forall i \in [1, n]$).

$$\begin{bmatrix}
    a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\
    a_{21} & a_{22} & a_{23} & \dots & a_{2n} \\
    a_{31} & a_{32} & a_{33} & \dots & a_{3n} \\
    . \\
    . \\
    . \\
    a_{n1} & a_{n2} & a_{n3} & \dots & a_{nn}
  \end{bmatrix}
  =
  \begin{bmatrix}
    1 & 0 & 0 & \dots & 0 \\
    l_{21} & 1 & 0 & \dots & 0 \\
    l_{31} & l_{32} & 1 & \dots & 0 \\
    . \\
    . \\
    . \\
    l_{n1} & l_{n2} & l_{n3} & \dots & 1 \\
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    u_{11} & u_{12} & u_{13} & \dots & u_{1n} \\
    0 & u_{22} & u_{23} & \dots & u_{2n} \\
    0 & 0 & u_{33} & \dots & u_{3n} \\
    . \\
    . \\
    . \\
    0 & 0 & 0 & \dots & u_{nn}
  \end{bmatrix}
  $$

Pentru un element oareacare $a_{pq}$:

$$a_{pq} = \sum_{i=1}^{n}l_{pi}u_{iq}$$

Dar $l_{pi} = 0 \ \ \forall i > p$ si $u_{iq} = 0 \ \ \forall i > q$, precum si si $l_{pp} = 1$. Asadar, ecuatia de mai sus devine:

$$\text{Pentru } p \leq q: a_{pq} = u_{pq} + \sum_{i=1}^{p - 1}l_{pi}u_{iq} \Rightarrow u_{pq} = a_{pq} - \sum_{i=1}^{p - 1}l_{pi}u_{iq}$$

$$\text{Pentru } p \gt q: a_{pq} = l_{pq}u_{qq} + \sum_{i=1}^{q - 1}l_{pi}u_{iq} \Rightarrow l_{pq} = \frac{a_{pq} - \sum_{i=1}^{q - 1}l_{pi}u_{iq}}{u_{qq}}$$

## Problema la tabla!

Rezolvati sistemul urmator folosind factorizarea *Doolittle*:

$$\begin{bmatrix}
    7 & 3 & 1 \\
    2 & 7 & 1 \\
    1 & 1 & 3
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3
  \end{bmatrix}
  =
  \begin{bmatrix}
    1 \\
    2 \\
    1
  \end{bmatrix}
  $$

In [None]:
function [L, U] = doolittle(A)
    % TODO: implementati algoritmul Doolittle
    % BONUS: vectorizati cat mai mult codul
endfunction

In [None]:
A = magic(4)
[L, U] = doolittle(A)
L * U

# Metoda Cholesky
Propusa de [André-Louis Cholesky](https://en.wikipedia.org/wiki/Andr%C3%A9-Louis_Cholesky) (ofiter de artilerie si inginer geodez francez; metoda lui de factorizare a fost publicata post-mortem, Cholesky murind in Primul Razboi Mondial - *Press **F** to Pay Respects*).

Metoda impune ca $L = U^T$. Acest lucru inseamna ca acum avem $\displaystyle\frac{n(n + 1)}{2}$ necunoscute, deci trebuie sa reducem si numarul de ecuatii, fapt care se intampla automat pentru ca acum este nevoie ca **$A$ sa fie simetrica**:

$$A = LL^T \Rightarrow A^T = (LL^T)^T = (L^T)^TL^T = LL^T = A$$

De asemenea, mai trebuie ca $A$ **sa fie pozitiv definita** ($x^TAx > 0 \ \ \forall x \in \mathbb{R}^n \land x \neq 0$):

$$x^TAx = (x^TL)(L^Tx) = (x^TL)(x^TL)^T = ||x^TL||_{2}^2 \geq 0 \text{ ceea ce demonstreaza ca } A \text{ trebuie sa fie semipozitiv definita}$$

$$\begin{bmatrix}
    a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\
    a_{21} & a_{22} & a_{23} & \dots & a_{2n} \\
    a_{31} & a_{32} & a_{33} & \dots & a_{3n} \\
    . \\
    . \\
    . \\
    a_{n1} & a_{n2} & a_{n3} & \dots & a_{nn}
  \end{bmatrix}
  =
  \begin{bmatrix}
    l_{11} & 0 & 0 & \dots & 0 \\
    l_{21} & l_{22} & 0 & \dots & 0 \\
    l_{31} & l_{32} & l_{33} & \dots & 0 \\
    . \\
    . \\
    . \\
    l_{n1} & l_{n2} & l_{n3} & \dots & l_{nn} \\
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    l_{11} & l_{21} & l_{31} & \dots & l_{n1} \\
    0 & l_{22} & l_{32} & \dots & l_{n2} \\
    0 & 0 & l_{33} & \dots & l_{n3} \\
    . \\
    . \\
    . \\
    0 & 0 & 0 & \dots & l_{nn}
  \end{bmatrix}
  $$

Pentru un element oareacare $a_{pq}$:

$$a_{pq} = \sum_{i=1}^{n}l_{pi}l_{qi}$$

Dar $l_{pi} = 0 \ \ \forall i > p$. Asadar, ecuatia de mai sus devine:

$$\text{Pentru } p = q: a_{pp} = l_{pq}^2 + \sum_{i=1}^{p - 1}l_{pi}^2 \Rightarrow l_{pq} = \sqrt{a_{pp} - \sum_{i=1}^{p - 1}l_{pi}^2}$$

$$\text{Pentru } p > q \text{ (nu este nevoie sa tratam } p < q \text{)}: a_{pq} = l_{pq}l_{qq} + \sum_{i=1}^{q - 1}l_{pi}l_{qi} \Rightarrow l_{pq} = \frac{a_{pq} - \sum_{i=1}^{q - 1}l_{pi}l_{qi}}{l_{qq}}$$

In [None]:
function x = isPositiveDefinite(A)
    % Verifica daca o matrice este pozitiv definita.
    n = size(A);
    d = diag(A);

    % Verifica daca toate elementele de pe diagonala sunt pozitive.
    positiveDiag = sum(d > 0) == n;

    % Verifica daca matricea este diagonal dominanta.
    isDiagDominant = sum(abs(d) > abs(sum(A, 2) - d)) == n;
    
    % Verifica daca determinantii tuturor minorilor care incep in coltul din stanga sus sunt pozitivi.
    for dim = 1 : n
        positiveDet(dim) = det(A(1 : dim, 1 : dim)) > 0;
    endfor
    
    x = isDiagDominant && positiveDiag && (sum(positiveDet) == n);
endfunction

In [None]:
function [L, U] = cholesky(A)
    % TODO: implementati algoritmul Cholesky (folositi functia de mai sus care determina daca o matrice este
    %       pozitiv definita)
    % BONUS: vectorizati cat mai mult codul
endfunction

In [None]:
A = magic(4)
[L, U] = cholesky(A)
L * U

## Problema la tabla!

Rezolvati sistemul urmator folosind factorizarea *Cholesky*:

$$\begin{bmatrix}
    7 & 3 & 1 \\
    3 & 7 & 1 \\
    1 & 1 & 3
  \end{bmatrix}
  \cdot
  \begin{bmatrix}
    x_1 \\
    x_2 \\
    x_3
  \end{bmatrix}
  =
  \begin{bmatrix}
    1 \\
    2 \\
    1
  \end{bmatrix}
  $$