# Sistema de $n$ ecuaciones lineales

Nos interesa resolver un sistema de $n$ ecuaciones lineales con $n$ incógnitas. ¿Porqué? y ¿cómo?

* Porque típicamente en los problemas que resolvemos estan involucradas muchas variables y muchas relaciones entre ellas.

* Para resolver estos sistemas es necesario consumir muchos recursos computacionales (memoria, procesamiento, etc.).

* Es posible reducir el uso intensivo de estos recursos, si conocemos diferentes algoritmos para resolver estos sistemas, dependiendo del tipo de **matríz coeficiente**, tal como sus simetrías o qué tan dispersa es, o si tiene bandas.

Revisaremos 3 métodos directos que son los más usados.


## Notación

Un sistema de ecuaciones algebráicas  con $x_i$ incógnitas y con coeficientes $A_{ij}$ y constantes $b_j$ conocidos, tiene la forma

\begin{eqnarray}
A_{11}x_1 + A_{12}x_2 + \cdots + A_{1n}x_n &=& b_1 \nonumber \\
A_{21}x_1 + A_{22}x_2 + \cdots + A_{2n}x_n &=& b_2 \nonumber \\
\vdots & & \vdots \nonumber \\
A_{n1}x_1 + A_{n2}x_2 + \cdots + A_{nn}x_n &=& b_n \nonumber \\
\end{eqnarray}

En notación matricial,

\begin{eqnarray}
\begin{bmatrix}
A_{11} & A_{12} & \cdots & A_{1n} \\
A_{21} & A_{22} & \cdots & A_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
A_{n1} & A_{n2} & \cdots & A_{nn}
\end{bmatrix} \begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n \end{bmatrix} = \begin{bmatrix}
b_1 \\
b_2 \\
\vdots \\
b_n
\end{bmatrix}
\end{eqnarray}

que simplemente denotamos como

\begin{eqnarray}
\mathbf{A~x} = \mathbf{b}.
\end{eqnarray}

## La matríz de coeficientes aumentada

A veces nos interesa generar en nuestros códigos una representación del sistema de ecuaciones en términos de **la matríz de coeficientes aumentada**, que se obtiene anexando el vector $\mathbf{b}$ a la matríz $\mathbf{A}$, de la siguiente manera:

\begin{eqnarray}
\left[\left.\mathbf{A}\right|\mathbf{b} \right] = \begin{bmatrix}
A_{11} & A_{12} & \cdots & A_{1n} &  b_1 \\
A_{21} & A_{22} & \cdots & A_{2n} &  b_2 \\
\vdots & \vdots & \ddots & \vdots &  \vdots \\
A_{n1} & A_{n2} & \cdots & A_{nn} &  b_n
 \end{bmatrix}
\end{eqnarray}

## Unicidad de la solución

Un sistema de $n$ ecuaciones lineales con $n$ incógnitas tiene **solución única** si el determinante de la matríz de coeficientes **no es singular o degenerada**, es decir

\begin{eqnarray}
\det{\mathbf{A}} \neq 0.
\end{eqnarray}

Es decir, los renglones y columnas de $\mathbf{A}$ son **linealmente independientes**

Si la matríz de coeficientes $\mathbf{A}$ es singular, el sistema de ecuaciones puede tener infinitas soluciones o ninguna solución, dependiendo de $\mathbf{b}$.

Pero, ¿qué sucede cuando $\mathbf{A}$ es *casi* singular ($\det{\mathbf{A}}$ muy pequeña)?

## Condiciones sobre singularidad de $\mathbf{A}$

Para determinar la singularidad de $\mathbf{A}$, necesitamos una medida de referencia: **la norma de la matríz** que se denota como ||$\mathbf{A}$||.

Entonces el criterio para un determinante pequeño o matríz singular es si se cumple que $\det{\mathbf{A}} \ll ||\mathbf{A}||$.

Existen diferentes maneras de obtener la norma de una matríz

* norma Euclideana
$$
||\mathbf{A}||_e = \sqrt{\sum_{i=1}^{n} \sum_{j=1}^{n} A_{ij}^2}
$$

* norma infinita ó norma de suma de renglones
$$
||\mathbf{A}||_\infty = \overset{max}{\mbox{$1\leq i \leq n$}} \sum_{j=1}^{n} |A_{ij}|
$$

Una vez que decides que norma usar, puedes darle seguimiento a las condiciones sobre singularidad es usando el **número de condición de matríz**

$$
\mbox{cond}(\mathbf{A}) = ||\mathbf{A}||\cdot||\mathbf{A}^{-1}||
$$

Entonces si $\mbox{cond}(\mathbf{A}) \sim 1$, la matríz tiene "buena" condición. Y a medida que se deteriora la condición $\mbox{cond}(\mathbf{A}) \to \infty$, cuando la matríz es singular.

Nota que el comportamiento de $\mbox{cond}(\mathbf{A})$ depende de la prescripción de norma que uses y es muy caro (en recursos computacionales) calcularlo cuando la matríz es muy grande.

En la práctica puedes sondear la condición de la matríz comparando $\det{\mathbf{A}}$ vs $|A_{ij}|$



## Ejemplo - condición singular de matríz

Consideren el sistema

\begin{eqnarray}
2x + y = 3 ~~~~~~~~~~ 2x + 1.001y = 0,
\end{eqnarray}

cuya solución es $x=1501.5$, $y=-3000$.

La matríz $\mathbf{A}$ del sistema y su determinante son

\begin{eqnarray}
\mathbf{A} = \begin{bmatrix}
2 & 1 \\
2 & 1.001
 \end{bmatrix}, ~~~~~~~~~~ \det{\mathbf{A}} = 2(1.001) - 2(1) = 0.002
\end{eqnarray}

Vemos que $\det{\mathbf{A}} \ll |A_{ij}|$, matríz singular!

Pueden verificar el efecto de la condición singular de la matríz al cambiar 1.001 en el coeficiente de la segunda ecuación del sistema por el valor 1.002.

Ahora la solución al sistema es $x=751.5$, $y=-1500$.

**Un cambio de 0.1\% en una entrada de la matríz, provocó un cambio en la solución de 100\% !!!**

**MORALEJA:** No se puede confiar en la solución numérica de sistemas de ecuaciones con matríz singular de coeficientes.

¿Por? Errores de redondeo durante el proceso de solución equivalen a introducir pequeños cambios en la matríz de coeficientes. Esto introduce grandes errores en la solución. 

La magnitud de estos errores esta directamente conectada con el grado de condición singular de la matríz.

**CONSEJO:** Monitorea la condición singular de las matrices con las que trabajas.


## Sistemas Lineales

Cualquier sistema cuya respuesta es proporcional al input ó entrada, es un sistema lineal, e.g. estructuras, flujo de calor, drenaje de fluidos, campos electromagnéticos, circuitos eléctricos, etc.
	
* Si el sistema es discreto (por ejemplo un circuito eléctrico), entonces el análisis lleva a un sistema lineal de ecuaciones algebráicas.
	
* Si el sistema es contínuo, se describe con ecuaciones diferenciales. A veces, el método numérico para la resolución de las ecuaciones diferenciales, aproxima el sistema de ecuaciones diferenciales a un sistema de ecuaciones algebráicas.

En resumen, el modelaje de sistemas lineales, invariablemente te lleva a resolver el sistema $\mathbf{A~x} = \mathbf{b}$, donde $\mathbf{b}$ es el input o entrada y $\mathbf{x}$ es la respuesta del sistema.
	
La matríz coeficiente $\mathbf{A}$, que codifica las características del sistema, es independiente del input o entrada.
	
Es decir, si se cambia la entrada o input, las ecuaciones de tienen que resolver de nuevo con una $\mathbf{b}$ diferente, pero con la misma $\mathbf{A}$.
	
Por lo anterior, es deseable tener un algoritmo que resuelva las ecuaciones y que pueda manejar cualquier cantidad de vectores constantes, con el mínimo esfuerzo computacional.

Hay dos métodos de solución de sistemas de ecuaciones algebráicas lineales:

1. **Métodos directos:** transforman las ecuaciones originales en ecuaciones equivalentes, i.e. ecuaciones que llevan a la misma solución pero que se resuelven más facilmente. La transformación de las ecuaciones originales se lleva a cabo aplicando tres operaciones elementales que no cambian la solución pero que afectan el $\det{\mathbf{A}}$.

* intercambiar dos ecuaciones (cambia el signo de $\det{\mathbf{A}}$)
* multiplicar una ecuación por una constante no nula (multiplica $\det{\mathbf{A}}$ por dicha constante)
* multiplicar una ecuación por una constante no nula y después restarla a otra ecuación ( $\det{\mathbf{A}}$ no cambia}) 

2. Métodos indirectos o iterativos: comienzan con una solución supuesta $\mathbf{x}$ y de manera repetitiva refinan la solución hasta que se cumple cierto criterio de convergencia. Estos métodos son menos eficientes puesto que requieren muchas iteraciones, pero son mejores para mbatrices de coeficientes muy escazas o dispersas y muy grandes.



## Resumen de métodos directos

Existen métodos directos populares que usan operaciones elementales para producir ecuaciones equivalentes fáciles de resolver.

                    |        Método            | forma inicial | forma final  |
                    | eliminación de Gauss     |    Ax = b     |    Ux = c    |
                    | descomposición LU        |    Ax = b     |   LUx = b    |
                    | eliminación Gauss-Jordan |    Ax = b     |    Ix = c    |

donde (por ejemplo en $3\times 3$)


$U = \begin{bmatrix}
U_{11} & U_{12} & U_{13} \\
0 & U_{22} & U_{23} \\
0 & 0 & U_{33} 
\end{bmatrix} ~~~~~~ L = \begin{bmatrix}
L_{11} & 0 & 0 \\
L_{21} & L_{22} & 0 \\
L_{31}  & L_{32} & L_{33} 
\end{bmatrix} ~~~~~~ I = \begin{bmatrix}
1 & 0 & 0 \\
0 & 1 & 0 \\
0 & 0 & 1
\end{bmatrix}
$

Nos gustan las matrices triangulares porque simplifican los cálculos. Por ejemplo en las ecuaciones $\mathbf{LU~x} = \mathbf{b}$

\begin{eqnarray*}
		L_{11}x_1 &=& c_1 \\
		L_{21}x_1 + L_{22}x_2 &=& c_2 \\
		L_{31}x_1 + L_{32}x_2 + L_{33}x_3 &=& c_3 \\
\end{eqnarray*}

Si las resolvemos, el procedimiento es de sustitución **forward** y es muy sencillo

\begin{eqnarray*}
		x_1 &=& c_1/L_{11} \\
		x_2 &=& (c_2 - L_{21}x_1)/L_{22} \\
		x_3 &=& (c_3 - L_{31}x_1 - L_{32}x_2)/L_{33} \end{eqnarray*}
        

De manera similar en el método de eliminación de Gauss, la ecuación $\mathbf{U~x} = \mathbf{c}$ puede ser resuelta con sustitución **backward** que comienza con la última ecuación y va hacia atrás con el resto de las ecuaciones.

Para resolver las ecuaciones $\mathbf{LU~x} = \mathbf{b}$ en la decomposición LU, puedes usar las dos ideas anteriores: primero sustitución **forward** para las ecuaciones $\mathbf{L~y} = \mathbf{b}$ y ya que conocemos $\mathbf{y}$, finalmente resolvemos $\mathbf{U~x} = \mathbf{y}$ con sustitución **backward**.
	
Las ecuaciones $\mathbf{I~x} = \mathbf{c}$ que se producen en el método de eliminación de Gauss-Jordan, son equivalentes a $\mathbf{x} = \mathbf{c}$, entonces $\mathbf{c}$ es ya la solución.	        

## Método de Eliminación de Gauss

Tiene dos fases
* **Fase de eliminación**, en donde el objetivo es transformar las ecuaciones $\mathbf{A~x} = \mathbf{b}$ y llevarlas a la forma $\mathbf{U~x} = \mathbf{c}$.
* **Fase de sustitución backward**, en donde el objetivo es encontrar la solución a $\mathbf{U~x} = \mathbf{c}$ usando sustituciones.

Utilicemos el siguiente sistema como ejemplo para resolverlo con este método:

\begin{eqnarray*}
		4x_1 - 2x_2 + x_3 &=& 11 ~~~~~~~~~~~~~~~ \mbox{(a)} \\
		-2x_1 + 4x_2 - 2x_3 &=& -16 ~~~~~~~~~~~~~ \mbox{(b)}\\
		x_1 - 2x_2 + 4x_3 &=& 17 ~~~~~~~~~~~~~~~~ \mbox{(c)}
\end{eqnarray*}

Solo se usa una operación elemental: multiplicar la Ec.($j$) por la constante $\lambda$ y restarla de la Ec.($i$). La representación simbólica de esta operación es  ($\det{\mathbf{A}}$ no cambia)

\begin{eqnarray}
\mbox{Ec.}(i) \leftarrow \mbox{Ec.}(i) ~-~ \lambda\times\underbrace{\mbox{Ec.}(j)}_{pivote}
\end{eqnarray}
	
Comenzamos el proceso de eliminación tomando a la Ec.(a) como la pivote y escogiendo $\lambda$ para que podamos eliminar $x_1$ de las ecuaciones (b) y (c):

* Ec.(b)$\leftarrow$Ec.(b)-(-0.5)$\times$ Ec.(a)
* Ec.(c) $\leftarrow$Ec.(c)-(0.25)$\times$ Ec.(a)

para tener ahora el sistema de ecuaciones asi

\begin{eqnarray*}
4x_1 - 2x_2 + x_3 &=& 11 ~~~~~~~~~~~~~~~ \mbox{(a)} \\
3x_2 - 1.5x_3 &=& -10.5 ~~~~~~~~~~~\mbox{(b)}\\
- 1.5x_2 + 3.75x_3 &=& 14.25 ~~~~~~~~~~~~ \mbox{(c)}
\end{eqnarray*}

Ya completamos la primera pasada en la eliminación, ahora podemos escoger la ecuación (b) de pivote:

* Ec.(c) $\leftarrow$ Ec.(c) $-(-0.5)\times$ Ec.(b)

y esto nos deja el sistema de ecuaciones asi:
\begin{eqnarray*}
4x_1 - 2x_2 + x_3 &=& 11 ~~~~~~~~~~~~~~~ \mbox{(a)} \\
3x_2 - 1.5x_3 &=& -10.5 ~~~~~~~~~~~\mbox{(b)}\\
3x_3 &=& 9 ~~~~~~~~~~~~~~~~~ \mbox{(c)}
\end{eqnarray*}

Con esto completamos la fase de eliminación y ahora las ecuaciones se pueden resolver con sustitución **backward** facilmente para tener: $x_3=3, x_2=-2, x_1=1$.

El procedimiento de eliminación de Gauss que llevamos a cabo, se puede ver como una transformación de la matríz aumentada:

![DIV](fig/aumentada.jpg)

donde se preserva la determinante, que en el caso de una matríz tringular es el producto de los elementos de la diagonal:

$$
\det{\mathbf{A}} = \det{\mathbf{U}} = U_{11}\times U_{22}\times \cdots \times U_{nn}.
$$





**Fase de Eliminación.** Imagina que durante esta fase los primeros $k$ renglones de $\mathbf{A}$ ya se transformaron a una forma trinagular superior. 

En este momento <font color='red'>la ecuación $k$-ésima es la pivote</font>  y las ecuaciones debajo de ella faltan de transformarse. 

![DIV](fig/pivote.jpg)


NOTA: Las componentes de $\mathbf{A}$ y de $\mathbf{b}$ en la parte transformada ya no son los originales, excepto el primer renglón.

Por ejemplo, <font color='blue'>en la ecuación $i$-ésima </font>queremos eliminar el coeficiente $A_{ik}$. Podemos multiplicar el <font color='red'>renglón pivote</font> por 
$\lambda= A_{ik}/A_{kk}$ y restarlo al renglón <font color='blue'> $i$-ésimo</font>.
	
Podemos resumir los cambios que haremos en el <font color='blue'> $i$-ésimo </font>renglón asi:

\begin{eqnarray}
A_{ij} &\leftarrow & A_{ij} - \lambda A_{kj}, ~~~\forall ~~~ j=k,k+1,\ldots ,n \label{eq:g1}\\
b_i &\leftarrow & b_i - \lambda b_k \label{eq:g2}
\end{eqnarray}

Si queremos transformar la matríz completa, escogemos el <font color='red'> renglón pivote cambiando $k=1,2,\ldots ,n-1$</font> y escogemos el <font color='blue'>  renglón a transformar cambiando $i = k+1, k+2,\ldots ,n$.</font>


## Algoritmo del método de eliminación de Gauss

!Prácticamente se escribe solo!

In [None]:
# Fase de eliminacion
n
for k in range(0,n-1):
    for i in range(k+1,n):
        if a[i,k] != 0.0:
            lam = a [i,k]/a[k,k]
            a[i,k+1:n] = a[i,k+1:n] - lam*a[k,k+1:n]
            b[i] = b[i] - lam*b[k]          

Nos estamos ahorrando cálculos porque 

* si $A_{ik} = 0$, ese renglón no necesitamos transformarlo y nos lo saltamos,
* el índice $j$ comienza en $k$, pero nosotros comenzamos en $k+1$, por lo tanto $A_{ik}$ no se reemplaza por cero, sino que se queda con su valor original $\to$ la fase de encontrar solución con sustitución **backward** nunca accesa la parte inferior de la matríz triangular, asi que su contenido es irrelevante.

**Fase de sustitución backwards** Después de la eliminación de Gauss, la matríz de coeficientes aumentada tiene la forma:

![DIV](fig/backward.jpg)

La última ecuación $A_{nn}x_n=b_n$  se resuelve primero para tener $x_n= b_n/A_{nn}$. Si seguimos sustituyendo hacia atrás y usamos $x_n$ para encontrar $x_{n-1}, x_{n-2}, \ldots ,x_k$ a partir de la $k$-ésima ec.,

\begin{equation}
A_{kk}x_k + A_{k,k+1}x_{k+1} + \cdots + A_{kn}x_n = b_k,
\end{equation}

la solución será

\begin{equation}
x_k = \left(b_k - \sum_{j=k+1}^n A_{kj}x_j \right)\frac{1}{A_{kk}}, ~~~~~~~~~k=n-1,n-2,\ldots,1.
\end{equation}

Entonces el algoritmo para sustitución hacia atrás o **backwards** es

In [None]:
for k in range(n-1,-1,-1):
    b[k] = (b[k] - np.dot(a[k,k+1:n],b[k+1:n]))/a[k,k]

## Conteo de operaciones y eficiencia del algoritmo.

El tiempo de ejecución de un algortimo depende en buena medida del número de multiplicaciones y divisiones que realice. Puedes mostrar que el método de eliminación de Gauss contiene $\sim n^3/3$ de esas operaciones (para un sistema de $n$ ecuaciones) en la fase de eliminación y $\sim n^2/2$ operaciones en la fase de sustitución hacia atrás.

# Algoritmo del método de eliminación de Gauss

La función *gaussElimin* combina la eliminación y la sustitución hacia atrás. Durante la sustitución hacia atrás $\mathbf{b}$ se reescribe por el vector solución $\mathbf{x}$, para que $\mathbf{b}$ contenga la solución del sistema al terminar.

In [None]:
## modulo gaussElimin
'''x = gaussElimin(a,b).
  Resuelve [a]{x} = {b} por metodo eliminacion de Gauss.
'''
import numpy as np

def gaussElimin(a,b):
  n = len(b)
  # Fase de eliminacion
  for k in range(0,n-1):
    for i in range(k+1,n):
      if a[i,k] != 0.0:
        lam = a [i,k]/a[k,k]
        a[i,k+1:n] = a[i,k+1:n] - lam*a[k,k+1:n]
        b[i] = b[i] - lam*b[k]
  # Fase de sustitucion hacia atras
  for k in range(n-1,-1,-1):
    b[k] = (b[k] - np.dot(a[k,k+1:n],b[k+1:n]))/a[k,k]
  return b

## Múltiples sistemas de ecuaciones

Muchas veces necesitamos resolver el sistema $\mathbf{A~x} = \mathbf{b}$
	para varios vectores constantes $\mathbf{b}$. Supongamos que tenemos $m$ vectores constantes que denotamos como $\mathbf{b}_1, \mathbf{b}_2,\ldots ,\mathbf{b}_m$ y supongamos que los correspondientes vectores solución son $\mathbf{x}_1, \mathbf{x}_2,\ldots ,\mathbf{x}_m$. Entonces podemos múltiples sistemas de ecuaciones de la siguiente manera: $\mathbf{A~X} = \mathbf{B}$, donde $\mathbf{X, B}$ son matrices de $n\times m$
	$$
	\mathbf{X} = \left[\mathbf{x}_1 ~~\mathbf{x}_2~~\ldots ~~\mathbf{x}_m \right],~~~~~\mathbf{B} = \left[\mathbf{b}_1 ~~\mathbf{b}_2~~\ldots ~~\mathbf{b}_m \right].
	$$
    
Una manera de manejar estos conjuntos de ecuaciones es incluir los $m$ vectores constantes en la matríz aumentada y dejar que se afecten de igual manera en la fase de eliminación. Al final se puede obtener cada solución con sustitución **backwards**, un vector a la vez. Haremos esta implementación en el método LU mas adelante.

## Ejemplo 1: Método de eliminación de Gauss

Usa *gaussElimin* para calcular la solución de $\mathbf{A~x} = \mathbf{b}$, donde $\mathbf{A}$ es una matríz Vandermode de $6 \times 6$ generada a partir del vector 

$$
\mathbf{v} = \left[1.0 ~~1.2~~1.4 ~~1.6~~1.8~~2.0 \right]^{\mathrm{\small T}}
$$

y

$$
\mathbf{b} = \left[0 ~~1~~0 ~~1~~0~~1 \right]^{\mathrm{\small T}}.
$$

Una matríz Vandermode $\mathbf{A}$ de $n \times n$ esta definida por un vector $\mathbf{v}$ como

$$
A_{ij} = v_i^{n-j},~~~~~ i=1,2,\ldots ,n~~~~~ j = 1,2,\ldots ,n.
$$
	
También evalúa la precisión de la solución, ya que las matrices Vandermode suelen tener condición pobre ($\det{\mathbf{A}} \ll |A_{ij}|$).
	
	

In [None]:
### Funcion para matriz de coeficientes a partir de vector Vandermode
def vandermode(v):
  n = len(v)
  a = np.zeros((n,n))
  for j in range(n):
    a[:,j] = v**(n-j-1)
  return a

### Vectores dados en ejemplo
v = np.array([1.0, 1.2, 1.4, 1.6, 1.8, 2.0])
b = np.array([0.0, 1.0, 0.0, 1.0, 0.0, 1.0])

### Matriz de coeficientes
a = vandermode(v)

### Guarda una copia de la matriz y el vector original
aOrig = a.copy() 
bOrig = b.copy() 

### Encuentra la solucion con eliminacion de Gauss
x = gaussElimin(a,b)

### Calcula el determinante de la matriz de coeficientes
det = np.prod(np.diagonal(a))

### Imprime la matriz de coeficientes
print('\n Matriz de coeficientes: A= \n',aOrig)
### Imprime el vector solucion
print('\n Vector solucion: x =\n',x)
### Imprime la determinante de la matriz de coeficientes
print('\n determinante =',det)
### Imprime la verificacion del resultado
print('\nVerificacion del resultado: [a]{x} - b =\n',np.dot(aOrig,x) - bOrig)