<a href="https://colab.research.google.com/github/Nacho2904/AnalisisNumerico/blob/main/ecus_lineales.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Sistemas de ecuaciones lineales

## Métodos directos

Buena parte de los métodos de resolución de ecuaciones lineales directos consisten en llevar una matriz cuadrada no singular $A \in \mathbb{R}^{n \times n}$ a una matriz $U \in \mathbb{R}^{n \times n}$, tal que:
- $U = \begin{bmatrix} a_{11} & a_{12} & \ldots & a_{1n} \\ 0 & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \ldots & a_{nn} \end{bmatrix}$

Es decir, $U$ es **triangular superior**

Teniendo la matriz de esa forma, es fácil ver que:
- $Ux = \begin{bmatrix} a_{11} & a_{12} & \ldots & a_{1n} \\ 0 & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \ldots & a_{nn} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n\end{bmatrix} = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{bmatrix} \iff x_n = \frac{b_n}{a_{nn}}, x_{n-1} = \frac{b_{n-1} - a_{34}x_n}{a_{33}}, \ldots, x_i = \frac{b_i - \sum_{j=i}^na_{ij}x_j}{a_{ii}}$

Este método para resolver sistemas de ecuaciones lineales en forma de matriz triangular superior se conoce como **back-substitution**. Para matrices triangulares inferiores se puede aplicar el mismo algoritmo trivialmente empezando desde la primer fila, en un proceso conocido como **forward-substitution**

El método tradicional de dejar a la matriz original en su forma triangular superior es aplicando **Eliminación de Gauss** y su versión más avanzada **Eliminación de Gauss con pivoteo parcial**

### LU Decomposition

La descomposición LU surge de la necesidad de resolver sucesivamente un sistema de ecuaciones lineales de manera que cada solución depende de un paso anterior. El objetivo es encontrar dos matrices $L, U \in \mathbb{R}^{n \times n}$ tales que $L$ es triangular inferior, $U$ es triangular superior, y, siendo $A \in \mathbb{R}^{n \times n}$ la matriz de coeficientes del sistema:
- $A = LU \Rightarrow Ax = b \iff Ux = y, Ly = b$

Nota: Las ecuaciones de arriba implican multiplicar por $L^{-1}$ en ambos lados de la ecuación $LUx = b$, lo que levanta la pregunta de si $L$ es efectivamente inversible. La respuesta se encuentra en la propiedad:
- Sean $A.B \in \mathbb{R}^{n \times n}$, entonces se cumple que $rg(AB) \leq min\{rg(A), rg(B)\}$. De aquí se deduce inmediatamente que $rg(A) = rg(LU) = n \leq min(rg(L), rg(U)) \iff rg(L) = rg(U) = n$ siempre y cuando $A$ sea una matriz no singular, es decir, $rg(A) = n$

De forma que si pudiéramos encontrar dichas matrices, el problema se transformaría en aplicar forward-substitution para encontrar $y$, y luego back-substitution para encontrar $x$.

Para ver como obtener ambas matrices, exponemos un ejemplo simple:
- Sea $A = \begin{bmatrix} 1 & 2 \\ 2 & 2\end{bmatrix}$.

Buscamos reducirla mediante eliminación gaussiana. Luego:
- $A = \begin{bmatrix} 1 & 2 \\ 2 & 2\end{bmatrix} \underbrace{\Rightarrow}_{R_2^{(2)} = R_2^{(1)} - 2R_1^{(1)}} \begin{bmatrix} 1 & 2 \\ 0 & -2\end{bmatrix}$

Pero notamos que podemos representar ese cambio en la segunda fila mediante una multiplicación matricial:
- $\begin{bmatrix} 1 & 2 \\ 0 & -2\end{bmatrix} = \begin{bmatrix} 1 & 0 \\ -2 & 1\end{bmatrix}\begin{bmatrix} 1 & 2 \\ 2 & 2\end{bmatrix} \Rightarrow A = \underbrace{\begin{bmatrix} 1 & 0 \\ 2 & 1\end{bmatrix}}_L\underbrace{\begin{bmatrix} 1 & 2 \\ 0 & -2\end{bmatrix}}_U$ 

Pensemos bien en qué representan respectivamente $L$ y $U$. $U$ es claramente el resultado de la aplicación de eliminación gaussiana a la matriz $A$. $L^{-1}$, como vemos en el lado izquierdo de la expresión descrita arriba, es una especie de "historial" de los cambios que fuimos haciendo a la matriz, mientras que $L$ nos da los pasos para reconstruir la matriz original a partir de las filas de $U$, en este caso sumando dos veces la primera fila y una vez la segunda.

Más generalmente:
- $L = \begin{bmatrix} 1 & 0 & 0 & \ldots & 0\\ m_{21} & 1 & 0 & \ldots & 0 \\ \vdots & \ddots & \ddots & \ddots & \vdots \\ m_{n-1,1} & \ldots & m_{n-1,n-2} & 1 & 0 \\ m_{n1} & \ldots & m_{n, n-2} & m_{n, n-1} & 1\end{bmatrix}$

Donde $m_{ij}$ es el coeficiente correspondiente de la eliminación gaussiana realizada a A. Por ejemplo:
- $A = \begin{bmatrix} 1 & 2 & 3 \\ 6 & 7 & 8 \\ 2 & 4 & 5\end{bmatrix} \underbrace{\Rightarrow}_{R_2^{(2)} = R_2^{(1)} - 6R_1^{(1)} \\ R_3^{(2)} = R_3^{(1)} - 2R_1^{(1)}} \begin{bmatrix} 1 & 2 & 3 \\ 0 & -5 & -10 \\ 0 & 0 & -1\end{bmatrix}$

Notamos que allí, $m_{21} = 6, m_{31} = 2, m_{23} = 0, m_{32} = 0$. Luego:
- $L = \begin{bmatrix} 1 & 0 & 0 \\ 6 & 1 & 0 \\ 2 & 0 & 1\end{bmatrix} \Rightarrow A = \begin{bmatrix} 1 & 2 & 3 \\ 6 & 7 & 8 \\ 2 & 4 & 5\end{bmatrix}  =  \underbrace{\begin{bmatrix} 1 & 0 & 0 \\ 6 & 1 & 0 \\ 2 & 0 & 1\end{bmatrix}}_L \underbrace{\begin{bmatrix} 1 & 2 & 3 \\ 0 & -5 & -10 \\ 0 & 0 & -1\end{bmatrix}}_U$

Obtenidas $L$ y $U$ procedemos por forward-substitution y back-substitution como ya hemos visto antes.

En caso de que hubiésemos tenido que permutar filas para obtener la matriz $U$, es decir, que hubiésemos usado pivoteo parcial, simplemente agregaríamos una matriz de permutación $P$ a la ecuación:
- $PA = LU$

### Método de Cholesky

Digamos que además de tener una matriz de rango completo $A \in \mathbb{R}^{n \times n}$, también asumimos que es definida positiva ($A ≻ 0$), y simétrica $(A^T = A)$. Por ejemplo:
- $A = \begin{bmatrix} 2 & 2 & 1 \\ 2 & 5 & 2 \\ 1 & 2 & 5 \end{bmatrix}$

Calculando su descomposición $LU$ obtenemos que:
- $A = \begin{bmatrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ \frac{1}{2} & \frac{1}{3} & 1\end{bmatrix}\begin{bmatrix} 2 & 2 & 1 \\ 0 & 3 & 1 \\ 0 & 0 & \frac{25}{6}\end{bmatrix} = \begin{bmatrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ \frac{1}{2} & \frac{1}{3} & 1\end{bmatrix}\begin{bmatrix} 2 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & \frac{25}{6}\end{bmatrix}\begin{bmatrix} 1 & 1 & \frac{1}{2} \\ 0 & 1 & \frac{1}{3} \\ 0 & 0 & 1\end{bmatrix} = LDL^T$

Esta descomposición, intuitivamente conocida como **descomposición LDL**, es propia de todas las matrices simétricas definidas positivas. Yendo un paso más allá, podemos definir $\sqrt{D}: \sqrt{D}\sqrt{D} = D$ como la matriz de las raíces de cada elemento de la diagonal de $D$. Entonces: 
- $A = LDL^T = L\sqrt{D}\sqrt{D}L^T = \underbrace{L\sqrt{D}}_S(L\sqrt{D})^T = SS^T \Rightarrow A = SS^T$

Esta descomposición se conoce como **descomposición de Cholesky**, y es la base del **algoritmo de Cholesky** para resolver sistemas de ecuaciones lineales con matriz de coeficientes simétrica definida positiva. Una vez obtenida la descomposición de Cholesky, nos queda el sistema resultante:
- $S^Tx = y, Sy = b$

Que podemos resolver por forward-substitution seguido de back-substitution, y tiene la ventaja de que solo necesitamos almacenar una matriz en vez de dos como teníamos con la descomposición $LU$.

## Métodos iterativos

Los métodos que resumimos en el apartado anterior se conocen como *métodos directos* pues tienen una cantidad finita de pasos y dan resultados que teóricamente deberían ser exactos. Estos métodos de suelen utilizar con matrices densas, es decir, con muchos coeficientes distintos de cero.

Sin embargo, cuando tratamos con matrices **dispersas**, al utilizar métodos directos estaremos introduciendo, en las entradas que antes eran nulas, errores que antes no existían. Los métodos **iterativos** tienen en cuenta este tipo de matrices. En estos métodos obtenemos la solución a partir de una solución inicial que vamos refinando hasta obtener la solución correcta.

Sabemos que nuestro sistema se puede expresar de la forma
- $Ax = B \Rightarrow  B - Ax = 0$

Luego podemos sumar $Mx$ en ambos miembros de la igualdad. Obtenemos:
- $B - Ax + Mx = Mx \iff Mx = B + (M-A)x \iff x = M^{-1}B + M^{-1}(M-A)x$

Renombrando algunas variables y reacomodando la ecuación, obtenemos:
- $x^{(i+1)} = (I - M^{-1}A)x^{(n)} + M^{-1}B$

Que puede escribirse de una forma más general como
- $x^{(i+1)} = Tx^{(n)} + C$

Con esta última expresión podemos definir dos tipos de métodos iterativos: los métodos **estacionarios**, en los que $T$ y $C$ no sufren modificaciones durante las iteraciones, y los **no estacionarios**, aquellos en los que los valores de $T$ y $C$ dependen de la iteración. 

### Métodos iterativos estacionarios

Supongamos que conocemos nuestra solución exacta $\bar{x}$. Entonces podemos decir que:
- $\bar{x} = x^{(n+1)} + e^{(n+1)} = T(x^{(n)} + e^{(n)}) + C = \underbrace{Tx^{(n)} + C}_{ x^{(n+1)}} + Te^{(n)} =  x^{(n+1)} +  Te^{(n)}$

Luego:
- $e^{(n+1)} = Te^{(n)} ⇒ e^{(n+1)} = T^{n+1}e^{(0)}$

Lo que nos indica que para un método iterativo estacionario sea convergente se debe cumplir que $||T|| < 1$.

#### Método de Jacobi

Es evidente que podemos descomponer cualquier matriz cuadrada $A$ de la forma:
- $A = L + D + U$

En donde $L$ es una matriz triangular inferior con diagonal nula, $D$ es una matriz diagonal y $U$ es una matriz triangular superior con diagonal nula. Si definimos $M = D$ para nuestro método iterativo, obtenemos:
- $x^{(i+1)} = (I - D^{-1}A)x^{(n)} + D^{-1}B = (I - D^{-1}(L + D + U))x^{(n)} + D^{-1}B = (-D^{-1}(L+U))x^{(n)} + D^{-1}B$

Finalmente, obtenemos la expresión:
- $x^{(i+1)} = D^{-1}(B-(L+U)x^{(n)})$

El método 