# Decomposición o factorización LU

Se refiere a que cualquier matríz cuadrada $\mathbf{A}$ puede expresarse como el producto de matrices triangulares inferior y superior

\begin{eqnarray}
\mathbf{A} = \mathbf{L~U}.
\end{eqnarray}

Dada una matríz cuadrada, su factorización LU no es única, a menos que impongamos constricciones en las matrices $\mathbf{L}$ ó $\mathbf{U}$, por ejemplo:


* Método de decomposición       
    1. Doolittle: $L_{ii}=1,~~~ i=1,2,\ldots ,n$
    2. Crout: $U_{ii}=1,~~~ i=1,2,\ldots ,n$
    3. Choleski: $L$ = $U^T$

Después de descomponer ${A}$, las ecuaciones a resolver son $LUx$ = $b$. Entonces primero resuelves $Ly$ = $b$ para $y$= $Ux$. Despúes resuelves esta última para $x$ con el método de sustitución hacia atrás.


## Método decomposición de Doolittle

Consideremos la matríz $\mathbf{A}$ de $3\times 3$
\begin{equation}
\mathbf{A} = \begin{bmatrix}
U_{11} & U_{12} & U_{13} \\
U_{11}L_{21} & U_{12}L_{21} + U_{22} & U_{13}L_{21} + U_{23} \\
U_{11}L_{31} & U_{12}L_{31} + U_{22}L_{32} & U_{13}L_{31} + U_{23}L_{32} + U_{33} 
 \end{bmatrix} \label{eq:eleu}
\end{equation}

que se puede factorizar en términos de $\mathbf{LU}$ donde
\begin{equation}
\mathbf{L} = \begin{bmatrix}
1 & 0 & 0 \\
L_{21} & 1 & 0 \\
L_{31}  & L_{32} & 1 
\end{bmatrix} 
\end{equation}

\begin{equation}
\mathbf{U} = \begin{bmatrix}
U_{11} & U_{12} & U_{13} \\
0 & U_{22} & U_{23} \\
0 & 0 & U_{33} 
 \end{bmatrix}. 
 \end{equation}

Podemos usar el método de eliminación de Gauss en la matriz $A$. En la fase de eliminación podemos seguir los siguientes pasos
* Para eliminar $A_{21}$: renglón 2 $\leftarrow$ renglón 2 - $L_{21} \times$ renglón 1
* Para eliminar $A_{31}$: renglón 3 $\leftarrow$ renglón 3 - $L_{31} \times$ renglón 1

En esta etapa la matríz de la matriz $A$ va como:

\begin{equation*}
\mathbf{A^\prime} = \begin{bmatrix}
U_{11} & U_{12} & U_{13} \\
0 & U_{22} & U_{23} \\
0 & U_{22}L_{32} & U_{23}L_{32} + U_{33} 
\end{bmatrix}
\end{equation*}

En la siguiente pasada tomamos el segundo renglón de pivote y operamos
* Para eliminar $A_{32}$: renglón 3 $\leftarrow$ renglón 3 - $L_{32} \times$ renglón 2

para culminar con

\begin{equation*}
\mathbf{A^{\prime\prime}} = \mathbf{U} = \begin{bmatrix}
U_{11} & U_{12} & U_{13} \\
0 & U_{22} & U_{23} \\
0 & 0 & U_{33} 
\end{bmatrix}
\end{equation*}

Entonces, la matríz $\mathbf{U}$ es idéntica a la que tenemos por eliminación de Gauss y la ventaja es que los elementos fuera de la diagonal de $\mathbf{L}$ son los multiplicadores de la ecuación pivote: $L_{ij}$ es el multiplicador que eliminó a $A_{ij}$.

Los multiplicadores se guardan en la porción inferior de la matríz de coeficientes a medida que son eliminados ($L_{ij}$ que reemplaza a $A_{ij}$). Los elementos de la diagonal de $\mathbf{L}$ no se tienen que guardar, porque ya se sabe que son 1, entonces la matríz aumentada es

\begin{equation}
\mathbf{\left[L\setminus U\right]} = \begin{bmatrix}
U_{11} & U_{12} & U_{13} \\
L_{21} & U_{22} & U_{23} \\
L_{31} & L_{32} & U_{33} \end{bmatrix} \label{eq:ldiagu}
\end{equation}

El algoritmo queda igual que *gaussElimin*, excepto que cada multiplicador $\lambda$ se guarda en la porción triangular inferior de $\mathbf{A}$.

In [None]:
n = 0
for k in range(0,n-1):
    for i in range(k+1,n):
        if a[i,k] != 0.0:
            lam = a [i,k]/a[k,k]
            a[i,k+1:n] = a[i,k+1:n] - lam*a[k,k+1:n]
            a[i,k] = lam

En la fase de sustitución para encontrar la solución de $\mathbf{Ly} = \mathbf{b}$, donde $L_{ii}=1$ tenemos

\begin{eqnarray*}
y_1 & = & b_1 \\
L_{21}y_1 + y_2 & = & b_2 \\
&& \vdots \\
L_{k1}y_1 + L_{k2}y_2 +\cdots +L_{k,k-1}y_{k-1} + y_k & = & b_k \\
&& \vdots
\end{eqnarray*}

Resolviendo la $k$-ésima ecuación para $y_k$ nos dá

\begin{equation}
y_k = b_k - \sum_{j=1}^{k-1}L_{kj}y_j, ~~~~~ k=2,3,\ldots , n.
\end{equation}

Entonces el algoritmo para sustitución **forward** es:

In [None]:
for k in range(1,n):
    b[k] = b[k] - np.dot(a[k,0:k],b[0:k])
    b[n-1] = b[n-1]/a[n-1,nb-1]

Y después se usa la sustitución **backwards** para resolver $\mathbf{Ux} = \mathbf{y}$.

## Algoritmo del método decomposición Doolittle

La función *LUdecomp* contiene las dos fases. La fase de decomposición entrega la matríz $\mathbf{\left[L\setminus U\right]}$. En la fase de solución, el contenido de $\mathbf{b}$ se reemplaza por $\mathbf{y}$ durante la sustitución **forward**. De manera análoga, la sustitución **backwards** reemplaza $\mathbf{y}$ con la solución $\mathbf{x}$.

In [None]:
## modulo LUdecomp - Doolittle

import numpy as np

def LUdecomp(a):
  n = len(a)
  for k in range(0,n-1):
    for i in range(k+1,n):
      if a[i,k] != 0.0:
           lam = a [i,k]/a[k,k]
           a[i,k+1:n] = a[i,k+1:n] - lam*a[k,k+1:n]
           a[i,k] = lam
  return a

def LUsolve(a,b):
  n = len(a)
  for k in range(1,n):
    b[k] = b[k] - np.dot(a[k,0:k],b[0:k])
  b[n-1] = b[n-1]/a[n-1,n-1]
  for k in range(n-2,-1,-1):
    b[k] = (b[k] - np.dot(a[k,k+1:n],b[k+1:n]))/a[k,k]
  return b

## Comentarios sobre otros métodos

* **Método de Crout.** Es igual que el de Doolittle pero ahora los $1$'s estan en la diagonal de $\mathbf{U}$, en lugar de estar en la diagonal de $\mathbf{L}$. El rendimiento de ambos métodos es indistinguible.

* **Método de Gauss-Jordan.** Es el método de eliminación de Gauss pero llevado a su límite. En el método de eliminación de Gauss, sólo las ecuaciones por debajo del pivote se transforman. En el de Gauss-Jordan, la eliminación también se realiza en las ecuaciones arriba del pivote, hasta obtener una matríz identidad. El problema es que Gauss-Jordan requiere $\sim n^3/2$ operaciones, mientras que eliminación de Gauss requiere menos $\sim n^3/3$.

* **Método de Choleski.** La decomposición de Choleski $\mathbf{A} = \mathbf{LL}^{\mathrm{\small T}}$ tiene las limitantes de que
    1. $\mathbf{A}$ tiene que ser simétrica
    2. el proceso involucra calcular raices cuadradas de combinaciones de elementos de $\mathbf{A}$, entonces $\mathbf{A}$ tiene que ser positiva definida.

# Ejemplo 1. Método de decomposición LU

Usa *LUdecomp* y *LUsolve* para resolver $\mathbf{AX=B}$ con decomposición de Doolittle y calcula el $\det{\mathbf{A}}$, para 

$$
\mathbf{A} = \begin{bmatrix}
3 & -1 & 4 \\
-2 & 0 & 5 \\
7 & 2 & -2 \end{bmatrix}~~~~~~~~~~\mathbf{B} = \begin{bmatrix}
6 & -4 \\
3 & 2 \\
7 & -5 \end{bmatrix}
$$

Muestra que $\det{\mathbf{A}}= -77.0$ y que las soluciones son
\begin{eqnarray*}
\mathbf{x}_1 &=& \left[1.~~1.~~1. \right] \\
\mathbf{x}_2 &=& \left[-1.~~1.~~2.3\times 10^{-17} \right] \\
\end{eqnarray*}

In [None]:
##### Arreglos del ejemplo
import numpy as np

a = np.array([[ 3.0, -1.0, 4.0],\
              [-2.0, 0.0, 5.0],\
              [ 7.0, 2.0,-2.0]])
b = np.array([[ 6.0, 3.0, 7.0],\
              [-4.0, 2.0, -5.0]])

### Decomposici\'on de a
a = LUdecomp(a)

### Determinante de a
det = np.prod(np.diagonal(a))
print("\nDeterminante =",det)

### Solucion para cada columna de B
for i in range(len(b)):
  x = LUsolve(a,b[i])
  print("Solucion x_",i+1,"=",x)


## Introducción: Simetría y Pivoteo

A veces los problemas que resolvemos nos llevan a tener matrices de coeficientes que son dispersas. Si los términos que no son cero estan agrupados alrededor de la diagonal principal, es una matríz de bandas. Por ejemplo ($X \neq 0$)
$$
\mathbf{A} = \begin{bmatrix}
X & X & 0 & 0 & 0 \\
X & X & X & 0 & 0 \\
0 & X & X & X & 0 \\
0 & 0 & X & X & X \\
0 & 0 & 0 & X & X 
\end{bmatrix}
$$

Esta matríz tiene un ancho de banda de tres, porque hay cuando mucho tres elementos no nulos en cada columna: matríz *tridiagonal*.

Si la matríz de bandas se descompone en la forma $\mathbf{A}=\mathbf{LU}$, tanto $\mathbf{L}$ como $\mathbf{U}$ también tienen la estructura de bandas. Por ejemplo, si descomponemos la matríz anterior, tendríamos
$$
\mathbf{L} = \begin{bmatrix}
X & 0 & 0 & 0 & 0 \\
X & X & 0 & 0 & 0 \\
0 & X & X & 0 & 0 \\
0 & 0 & X & X & 0 \\
0 & 0 & 0 & X & X 
\end{bmatrix} ~~~~~~~~~~ \mathbf{U} = \begin{bmatrix}
X & X & 0 & 0 & 0 \\
0 & X & X & 0 & 0 \\
0 & 0 & X & X & 0 \\
0 & 0 & 0 & X & X \\
0 & 0 & 0 & 0 & X 
\end{bmatrix}
$$

Entonces la estructura de bandas de la matríz de coeficientes, puede ser explotada para ahorrar memoria y tiempo de cómputo. Además, si la matríz de coeficientes es simétrica, podemos ahorrar más. ¿Qué sucede con los métodos que hemos discutido en estos casos?


## Matríz tridiagonal y decomposición de Doolittle

Considera la matríz $\mathbf{A}$ de $n \times n$

$$
\mathbf{A} = \begin{bmatrix}
d_1 & e_1 & 0 & 0 & \cdots & 0 \\
c_1 & d_2 & e_2 & 0 & \cdots & 0 \\
0 & c_2 & d_3 & e_3 & \cdots & 0 \\
0 & 0 & c_3 & d_4 & \cdots & 0 \\
\vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & 0 & c_{n-1} & d_n 
\end{bmatrix}
$$

Podemos guardar los elementos no-nulos de la matríz $\mathbf{A}$ en los vectores (para $n=100$ tenemos 10,000 elementos vs $99 + 100 + 99 =298$, factor de compresión de $33:1$)

$$
\mathbf{c}=\begin{bmatrix}
c_1 \\
c_2 \\
\vdots \\
c_{n-1}
\end{bmatrix}~~~~~~~~~~\mathbf{d}=\begin{bmatrix}
d_1 \\
d_2 \\
\vdots \\
d_{n-1} \\
d_n
\end{bmatrix}~~~~~~~~~~\mathbf{e}=\begin{bmatrix}
e_1 \\
e_2 \\
\vdots \\
e_{n-1} 
\end{bmatrix}
$$

Ahora podemos aplicar decomposición LU para resolver $\mathbf{Ax} = \mathbf{b}$. A partir del renglón $k$-ésimo, para eliminar $c_{k-1}$ necesitamos
1. renglón $k$ $\leftarrow$ renglón $k$ $- \frac{c_{k-1}}{d_{k-1}}\times$ renglón $(k-1)$, $k=2,3,\ldots , n$

1. $d_k$ $\leftarrow$ $d_k$ $- \frac{c_{k-1}}{d_{k-1}}\times$ $e_{k-1}$, $k=2,3,\ldots , n$

3. $e_k$ no se afecta

Para terminar con la decomposición de Doolittle de la forma $\mathbf{\left[L\setminus U\right]}$, guardamos el factor $\lambda = c_{k-1}/d_{k-1}$ en el lugar que ocupaba previamente $c_{k-1} \leftarrow \frac{c_{k-1}}{d_{k-1}}$. Entonces el algoritmo es:

In [None]:
for k in range(1,n):
    lam = c[k-1]/d[k-1]
    d[k] = d[k] - lam*e[k-1]
    c[k-1] = lam

Para la solución sucesiva del sistema $\mathbf{Ly} = \mathbf{b}$ y luego $\mathbf{Ux} = \mathbf{y}$. Comenzamos con $\mathbf{Ly} = \mathbf{b}$

![DIV](fig/dollitle1.jpg)

y resolvemos para $\mathbf{y}$ con sustitución **forward**

In [None]:
for k in range(1,n):
    b[k] = b[k] - c[k-1]*b[k-1]
    b[n-1] = b[n-1]/d[n-1]

Para $\mathbf{Ux} = \mathbf{y}$ trabajaremos con

![DIV](fig/dollitle2.jpg)

y resolvemos para $\mathbf{x}$ con sustitución *backward*

In [None]:
for k in range(n-2,-1,-1):
    b[k] = (b[k] - e[k]*b[k+1])/d[k]

Así, el algoritmo con funciones *LUdecomp3* y *LUsolve3* para las fases de decomposición y solución de una matríz tridiagonal es:

In [None]:
## modulo LUdecomp3
''' c,d,e = LUdecomp3(c,d,e).
Decomposicion LU de la matriz tridiagonal [c\d\e]. La salida
{c},{d} y {e} son las diagonales de la matriz decompuesta.
x = LUsolve(c,d,e,b).
Resuelve [c\d\e]{x} = {b}, donde {c}, {d} y {e} son los vectores
que da LUdecomp3.
'''

def LUdecomp3(c,d,e):
  n = len(d)
  for k in range(1,n):
    lam = c[k-1]/d[k-1]
    d[k] = d[k] - lam*e[k-1]
    c[k-1] = lam
  return c,d,e

def LUsolve3(c,d,e,b):
  n = len(d)
  for k in range(1,n):
    b[k] = b[k] - c[k-1]*b[k-1]
  b[n-1] = b[n-1]/d[n-1]
  for k in range(n-2,-1,-1):
    b[k] = (b[k] - e[k]*b[k+1])/d[k]
  return b

# Ejemplo 2: Decomp. de Doolittle para matríz tridiagonal

Usa las funciones *LUdecomp3* y *LUsolve3* para resolver $\mathbf{Ax} = \mathbf{b}$, donde

$$
\mathbf{A} = \begin{bmatrix}
2 & -1 & 0 & 0 & 0 \\
-1 & 2 & -1 & 0 & 0 \\
0 & -1 & 2 & -1 & 0 \\
0 & 0 & -1 & 2 & -1 \\
0 & 0 & 0 & -1 & 2 
\end{bmatrix} ~~~~~~~~~~ \mathbf{b}=\begin{bmatrix}
5 \\
-5 \\
4 \\
-5 \\
5
\end{bmatrix}
$$

La solución es x = [2. -1. 1. -1. 2.]

In [None]:
import numpy as np
d = np.ones((5))*2.0
c = np.ones((4))*(-1.0)
b = np.array([5.0, -5.0, 4.0, -5.0, 5.0])
e = c.copy()

c,d,e = LUdecomp3(c,d,e)

x = LUsolve3(c,d,e,b)

print("\nx =\n",x)

## Pivoteo

Algunas veces el orden en el cual se presentan las ecuaciones para encontrar la solución, afectan los resultados. Por ejemplo, consideren
\begin{eqnarray*}
2x_1 - x_2 &=& 1 \\
-x_1 + 2x_2 - x_3 &=& 0 \\
-x_2 + x_3 &=& 0
\end{eqnarray*}

La matríz aumentada correspondiente es

![DIV](fig/dollitle3.jpg)

Estas ecuaciones estan en el órden correcto y no habría ningún problema para resolver el sistema con eliminación de Gauss o con descomposición LU, para encontrar que $x_1=x_2=x_3=1$.

¿Qué sucede si intercambiamos la primera y la tercera ecuación?

\begin{eqnarray*}
-x_2 + x_3 &=& 0 \\
-x_1 + 2x_2 - x_3 &=& 0 \\
2x_1 - x_2 &=& 1
\end{eqnarray*}

Y la matríz aumentada ahora es

![DIV](fig/dollitle4.jpg)

Como no hemos cambiado el sistema, la solución es la misma $x_1=x_2=x_3=1$.
Sin embargo, eliminación de Gauss va a fallar inmediatamente debido a la presencia de un elemento nulo ($A_{11}=0$) en el pivote.

Vemos entonces que es escencial, reordenar las ecuaciones <font color='red'>durante</font> la fase de eliminación. Pero este *pivoteo* o reordenamiento de renglones, también será necesario cuando los elementos sean pequeños en comparación con otros elementos. Por ejemplo,

![DIV](fig/dollitle5.jpg)

que son iguales, pero hemos reemplazado el primer $0$ por un elemento pequeño $\varepsilon$. En el límite de $\varepsilon \to 0$, las soluciones a estos dos sistemas deben ser idénticas.

Después de primera ronda de eliminación de Gauss, queda

![DIV](fig/dollitle6.jpg)


Para valores suficientemente pequeños, los $1/\varepsilon$ dominan, entonces realmente se guardan como:

![DIV](fig/dollitle7.jpg)

Vemos que la segunda y tercera ecuación se contradicen y el proceso de resolución falla de nuevo. Este problema no sucedería si hubiéramos pivoteado antes de hacer eliminación de Gauss. También se muestra que para pivotear no se requiere solo un cero, sino que se requiere un criterio de pequeñéz para $\varepsilon$.


## Dominancia de la diagonal

Una matríz $\mathbf{A}$ de $n \times n$ se dice **diagonalmente dominante** si cada elemento de la diagonal satisface
\begin{equation}
|A_{ii}| > \sum_{j(\neq i)=1}^{n} |A_{ij}| ~~~~~~~~~ i=1,2,\ldots ,n
\end{equation}

Por ejemplo una matríz que NO es diagonalmente dominante es
$$
\begin{bmatrix}
-2 & 4 & -1 \\
1 & -1 & 3 \\
4 & -2 & 1
\end{bmatrix}
$$
pero si cambiamos los renglones de manera cíclica
$$
\begin{bmatrix}
4 & -2 & 1 \\
-2 & 4 & -1 \\
1 & -1 & 3 
\end{bmatrix}
$$
aparece la dominancia de la diagonal.

Si la matríz de coeficientes del sistema de ecuaciones $\mathbf{Ax}=\mathbf{b}$ es diagonalmente dominante, la solución del mismo, no requiere pivoteo: la matríz ya está escrita de manera óptima.

Entonces la estrategia para pivoteo debe ser siempre a favor de ordenar las ecuaciones para que la matríz de coeficientes tenga la mayor dominancia de la diagonal. Para ello podemos construir un arreglo de monitoreo, el *factor de escala del renglón* $i$

\begin{equation}
s_i = \overset{max}{\mbox{$j$}} \left|A_{ij}\right| ~~~~~~~~~~ i=1,2,\ldots ,n
\end{equation}

y el valor relativo de un elemento de la matríz 
$A_{ij}$ con respecto al elemento más grande del renglón $i$ puede medirse con la razón

\begin{equation}
r_{ij} = \frac{|A_{ij}|}{s_i}.
\end{equation}

Supongamos que en la fase de eliminación se llega a un punto en donde queremos trabajar con el pivote en el $k$-ésimo renglón,

![DIV](fig/dollitle8.jpg)

pero no lo aceptamos de inmediato como pivote, primero lo estudiamos y comparamos con los siguientes renglones para ver si no hay una mejor opción. La mejor opción es el elemento $A_{pk}$ que tiene el mayor valor relativo, es decir escogemos a $p$ tal que
$$
r_{pk} = \overset{max}{\mbox{$j$}} \left(r_{jk} \right), ~~~~~~ j \geq k
$$

Hay dos desventajas de pivotear:

1. aumento del costo de cómputo (se vuelve criterio importante en sistemas grandes)
2. destrucción de propiedades de simetría o de bandas de la matríz coeficientes (aunque usualmente las de bandas diagonales, son diagonalmente dominantes)

* En general, el pivoteo es contraproductivo si la matríz tiene bandas, definida positiva o simétrica.

* Una alternativa al pivoteo como control de error de redondeo es usar artimética con doble precisión.
