**Notas para contenedor de docker:**

Comando de docker para ejecución de la nota de forma local:

nota: cambiar `dir_montar` por la ruta de directorio que se desea mapear a `/datos` dentro del contenedor de docker.

```
dir_montar=<ruta completa de mi máquina a mi directorio>#aquí colocar la ruta al directorio a montar, por ejemplo: 
#dir_montar=/Users/erick/midirectorio.
```

Ejecutar:

```
$docker run --rm -v $dir_montar:/datos --name jupyterlab_prope_r_kernel_tidyverse -p 8888:8888 -d palmoreck/jupyterlab_prope_r_kernel_tidyverse:2.1.4   

```

Ir a `localhost:8888` y escribir el password para jupyterlab: `qwerty`

Detener el contenedor de docker:

```
docker stop jupyterlab_prope_r_kernel_tidyverse
```


Documentación de la imagen de docker `palmoreck/jupyterlab_prope_r_kernel_tidyverse:2.1.4` en [liga](https://github.com/palmoreck/dockerfiles/tree/master/jupyterlab/prope_r_kernel_tidyverse).

---

Para ejecución de la nota usar:

[docker](https://www.docker.com/) (instalación de forma **local** con [Get docker](https://docs.docker.com/install/)) y ejecutar comandos que están al inicio de la nota de forma **local**. 

O bien dar click en alguno de los botones siguientes:

[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/palmoreck/dockerfiles-for-binder/jupyterlab_prope_r_kernel_tidyerse?urlpath=lab/tree/Propedeutico/Python/clases/3_algebra_lineal/1_ecuaciones_lineales.ipynb) esta opción crea una máquina individual en un servidor de Google, clona el repositorio y permite la ejecución de los notebooks de jupyter.

[![Run on Repl.it](https://repl.it/badge/github/palmoreck/dummy)](https://repl.it/languages/python3) esta opción no clona el repositorio, no ejecuta los notebooks de jupyter pero permite ejecución de instrucciones de Python de forma colaborativa con [repl.it](https://repl.it/). Al dar click se crearán nuevos ***repl*** debajo de sus users de ***repl.it***.


## Lo siguiente está basado en el capítulo 2 y apéndice del libro de texto de J. Kiusalas Numerical Methods in Engineering with Python 3 y el libro de Matrix Analysis and Applied Linear Algebra de C. D. Meyer.

**Se sugiere haber revisado la sección 1.5 del libro de texto de J. Kiusalas Numerical Methods in Engineering with Python 3: uso de numpy**

# Sistemas de ecuaciones lineales

En general son de la forma: $$\begin{array}{ccc} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n  &= & b_1 \\ a_{21}x_1 + a_{22}x_2 +  \cdots + a_{2n}x_n &= & b_2 \\ \vdots & & \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &=& b_m \end{array}$$

donde: las $x_i$'s son las incógnitas y las $a_i$'s y $b_i$'s son constantes conocidas.

Las entradas $a_{ij}$'s son llamadas coeficientes del sistema y el conjunto de $b_i$'s se le llama lado derecho del sistema. Si todas las $b_i$'s son iguales a $0$ el sistema se le nombra **homogéneo**.

**3 posibilidades para solución del sistema anterior:**

* Una única solución: sólo existe uno y sólo un conjunto de valores de $x_i$'s que satisfacen todas las ecuaciones simultáneamente y el sistema se nombra **consistente** o **no singular**.

* Ninguna solución: no existe ningún conjunto de valores de $x_i$'s que satisfacen todas las ecuaciones simultáneamente (el conjunto solución es vacío) y el sistema se nombra **inconsistente** o singular.

* Infinitas soluciones: hay una infinidad de conjuntos (distintos) de valores de las $x_i$'s que satisfacen todas las ecuaciones simultáneamente. **obs:** si un sistema tiene más de una solución entonces tiene una infinidad de soluciones y el sistema se nombra **consistente** o **no singular**.



## Interpretación geométrica

Resolver un sistema de ecuaciones lineales equivale a encontrar la intersección entre rectas, planos o hiperplanos (2,3 o n dimensiones respectivamente). Por ejemplo para un caso de dos dimensiones se tiene:

<img src="https://dl.dropboxusercontent.com/s/p92z7zlquo1adbm/algebra_lineal_1.jpg?dl=0" heigth="700" width="700">


El inciso a) representa un sistema de ecuaciones lineales sin solución, el inciso b) infinitas soluciones (en el dibujo ligeramente se desplazó hacia abajo una de las rectas para mostrar ambas) y el inciso c) una única solución. 

## Algoritmos

Existen una gran cantidad de algoritmos para resolver los sistemas de ecuaciones. Típicamente se elige el algoritmo de acuerdo a las características de los coeficientes de la matriz del sistema y sus dimensiones.

### Sistemas triangulares

Son sistemas cuya matriz es triangular inferior o superior. Un sistema triangular inferior se resuelve con el método de sustitución hacia delante. Si es triangular superior se resuelve con el método de sustitución hacia atrás.


**Ejemplo matriz triangular inferior:**

In [2]:
import numpy as np

In [3]:
np.tril(np.ones(4))

array([[1., 0., 0., 0.],
       [1., 1., 0., 0.],
       [1., 1., 1., 0.],
       [1., 1., 1., 1.]])

**Ejemplo matriz triangular superior:**

In [4]:
np.triu(np.ones(4))

array([[1., 1., 1., 1.],
       [0., 1., 1., 1.],
       [0., 0., 1., 1.],
       [0., 0., 0., 1.]])

### Sistemas no triangulares

Para sistemas de ecuaciones lineales más generales (no tienen estructura identificable) se tienen los métodos iterativos y directos o basados en factorizaciones matriciales.

Entre los directos o basados en factorizaciones matriciales se encuentran:


* Eliminación Gaussiana o factorización LU.
* Factorización de Cholesky. (solo para matrices definidas positivas).
* Factorización QR.
* Descomposición en valores singulares (DVS o SVD por sus siglas en inglés).

y como ejemplo de los iterativos están:

* Jacobi.
* Gauss-Seidel.
* Gradiente conjugado.



Los algoritmos directos encuentran sistemas de ecuaciones equivalentes a partir de operaciones básicas del álgebra lineal. **Obs:** dos sistemas de ecuaciones lineales son equivalentes si tienen el mismo conjunto solución.

Ambos métodos: iterativos y directos o basados en factorizaciones matriciales encuentran sistemas de ecuaciones equivalentes a partir de operaciones básicas del álgebra lineal. Dos sistemas de ecuaciones lineales son equivalentes si tienen el mismo conjunto solución.

Solo vamos a revisar los directos

### Ejemplos de uso de los paquetes numpy y scipy para resolver ecuaciones lineales

1)Resolver: $$\begin{array}{ccc} 8x_1 -6x_2 + 2x_3  &= & 28 \\ -4x_1 + 11x_2 -7x_3 &= & -40 \\ 4x_1 -7x_2 + 6x_3 &=& 33\end{array} $$

In [12]:
import numpy as np
import pprint
from pytest import approx

In [6]:
A = np.array([[8, -6, 2], [-4, 11, -7], [4, -7, 6]])
b = np.array([28,-40,33])

In [7]:
print('A:')
pprint.pprint(A)
print('b:')
pprint.pprint(b)

A:
array([[ 8, -6,  2],
       [-4, 11, -7],
       [ 4, -7,  6]])
b:
array([ 28, -40,  33])


Usamos la función de [solve](https://numpy.org/doc/stable/reference/generated/numpy.linalg.solve.html) dentro de [numpy.linalg](https://numpy.org/doc/stable/reference/routines.linalg.html)

In [8]:
x = np.linalg.solve(A,b)

In [9]:
print('x:')
pprint.pprint(x)

x:
array([ 2., -1.,  3.])


In [10]:
print('Verificando resultado Ax = b')
print('b:')
pprint.pprint(b)

## Aquí estamos validando el resultado
print('Ax:')
pprint.pprint(A@x)

Verificando resultado Ax = b
b:
array([ 28, -40,  33])
Ax:
array([ 28., -40.,  33.])


In [16]:
## Validación del resultado
b == A@x

array([ True,  True,  True])

#### Validación del resultado con

In [13]:
sol_numpy = A@x

In [14]:
sol_numpy

array([ 28., -40.,  33.])

In [15]:
b

array([ 28, -40,  33])

In [17]:
sol_numpy == approx(b)

True

#### Validación de resultado con `np.allclose`

In [18]:
np.allclose(sol_numpy, b)

True

---

2) Resolver $AX = B$ 

Cambiar la notación de las $x$s

$$\begin{array}{l}
\begin{array}{ccc}
6x_1-4x_2+x_3&=&\\
-4x_1+6x_2-4x_3&=&\\
x_1-4x_2+6x_3&=&
\end{array}
\left[\begin{array}{cc}
-14 & 22\\
36 & -18\\
6 & 7
\end{array}
\right] 
\end{array}
$$

In [19]:
A = np.array([[6,-4,1], [-4,6,-4], [1,-4,6]])
B = np.array([[-14,22],[36,-18],[6,7]])

In [20]:
print('A:')
pprint.pprint(A)
print('B:')
pprint.pprint(B)

A:
array([[ 6, -4,  1],
       [-4,  6, -4],
       [ 1, -4,  6]])
B:
array([[-14,  22],
       [ 36, -18],
       [  6,   7]])


In [21]:
X=np.linalg.solve(A,B)

In [22]:
print('X:')
pprint.pprint(X)

X:
array([[10.,  3.],
       [22., -1.],
       [14.,  0.]])


In [23]:
print('Verificando resultado AX = B')
print('B:')
pprint.pprint(B)
print('AX:')
pprint.pprint(A@X)

Verificando resultado AX = B
B:
array([[-14,  22],
       [ 36, -18],
       [  6,   7]])
AX:
array([[-14.,  22.],
       [ 36., -18.],
       [  6.,   7.]])


### Ejemplo factorización P, L, U

**¿Dado el sistema $Ax=b$, $A \in \mathbb{R}^{n \times n}$ cómo se resuelve con la factorización $PLU$?**

Paso 1: encontrar factores $P,L,U$ tales que $PA=LU$. ($P$ es matriz de permutación; $L$ es matriz triangular inferior; $L$ matriz triangular superior.)

Paso 2: resolver con el método de sustitución hacia delante el sistema triangular inferior $Ld=Pb$. (La incógnita es el vector $d$ y sacarlo solo es un paso intermedio)

Paso 3: resolver con el método de sustitución hacia atrás el sistema triangular superior $UX=d$.

Por que querríamos hacer esto en lugar de usar `solve`?
- La matriz A y el lado derecho son muy grandes; no es posible guardarlos en memoria. Tendríamos que particionar a la matriz. Podemos hacer particiones por bloques y resolver por cachos.
- Lo más eficiente puede ser utilizar una factorización.

**Ejemplo:**

Obtener los factores $P, L, U$ de la matriz $A$: $$A = \begin{bmatrix} 2& -1&2 \\ 1& 6& -1 \\ 1& 4& 1\end{bmatrix}$$ 

y utilizarlos para resolver $AX = B$ con $$B=\begin{bmatrix}7 & -1\\13 & 6\\5 & 7\end{bmatrix}$$

La factorización P,L,U la encontramos con el nombre [lu](https://docs.scipy.org/doc/scipy/reference/generated/scipy.linalg.lu.html) dentro de [scipy.linalg](https://docs.scipy.org/doc/scipy/reference/linalg.html).

#### Paso 1

In [24]:
import scipy
import scipy.linalg 

In [26]:
A = np.array([[2,-1,2], [1,6,-1], [1,4,1]])
A

array([[ 2, -1,  2],
       [ 1,  6, -1],
       [ 1,  4,  1]])

In [27]:
P, L, U = scipy.linalg.lu(A)

In [30]:
print('A:')
pprint.pprint(A)
print('\n')

print('P:')
pprint.pprint(P)
print('\n')

print('L:')
pprint.pprint(L)
print('\n')

print('U:')
pprint.pprint(U)

A:
array([[ 2, -1,  2],
       [ 1,  6, -1],
       [ 1,  4,  1]])


P:
array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])


L:
array([[1.        , 0.        , 0.        ],
       [0.5       , 1.        , 0.        ],
       [0.5       , 0.69230769, 1.        ]])


U:
array([[ 2.        , -1.        ,  2.        ],
       [ 0.        ,  6.5       , -2.        ],
       [ 0.        ,  0.        ,  1.38461538]])


In [31]:
print('Verificando que es igual PA al producto LU')
print('L*U:')
pprint.pprint(L@U)
print('P*A')
pprint.pprint(P@A)

Verificando que es igual PA al producto LU
L*U:
array([[ 2., -1.,  2.],
       [ 1.,  6., -1.],
       [ 1.,  4.,  1.]])
P*A
array([[ 2., -1.,  2.],
       [ 1.,  6., -1.],
       [ 1.,  4.,  1.]])


#### Paso 2: $LD = PB$

In [32]:
print('Usando los factores P,L,U para resolver AX = B')
B = np.array([[7,-1],[13,6],[5,7]])
B

Usando los factores P,L,U para resolver AX = B


array([[ 7, -1],
       [13,  6],
       [ 5,  7]])

In [33]:
D = scipy.linalg.solve_triangular(L, P@B, lower=True)
D

array([[ 7.        , -1.        ],
       [ 9.5       ,  6.5       ],
       [-5.07692308,  3.        ]])

#### Paso 3: $UX = d$

In [34]:
X = scipy.linalg.solve_triangular(U, D) #by default parameter lower is False
X

array([[ 7.33333333, -1.83333333],
       [ 0.33333333,  1.66666667],
       [-3.66666667,  2.16666667]])

In [35]:
print('X:')
pprint.pprint(X)

X:
array([[ 7.33333333, -1.83333333],
       [ 0.33333333,  1.66666667],
       [-3.66666667,  2.16666667]])


In [36]:
print('Verificando resultado AX = B')
print('B:')
pprint.pprint(B)
print('AX:')
pprint.pprint(A@X)

Verificando resultado AX = B
B:
array([[ 7, -1],
       [13,  6],
       [ 5,  7]])
AX:
array([[ 7., -1.],
       [13.,  6.],
       [ 5.,  7.]])


Otra matriz de permutación podría ser

$$
\begin{array}{ccc}
0 & 1 & 0\\
1 & 0 & 0\\
0 & 0 & 1\\
\end{array}
$$

### Ejercicio anterior con la factorización QR del paquete `numpy`

**¿Dado el sistema $Ax=b$, $A \in \mathbb{R}^{n \times n}$ cómo se resuelve con la factorización $QR$?**

* **Paso 1: encontrar factores $Q,R$ tales que $A=QR$.**

In [37]:
Q, R = np.linalg.qr(A)

In [38]:
print('A:')
pprint.pprint(A)
print('Q:')
pprint.pprint(Q)
print('R:')
pprint.pprint(R)


A:
array([[ 2, -1,  2],
       [ 1,  6, -1],
       [ 1,  4,  1]])
Q:
array([[-0.81649658,  0.56354707, -0.12549116],
       [-0.40824829, -0.71724173, -0.56471022],
       [-0.40824829, -0.40985242,  0.81569255]])
R:
array([[-2.44948974, -3.26598632, -1.63299316],
       [ 0.        , -6.5064071 ,  1.43448345],
       [ 0.        ,  0.        ,  1.12942045]])


En esta factorización sabemos que la matriz $Q$ es ortogonal:

$$Q^TQ = I$$

También quiere decir que los productos puntos entre columnas es cero.

**Verificando la ortogonalidad:**

- Norma de las columnas de $Q$

In [39]:
np.linalg.norm(Q[:, 0])

0.9999999999999999

In [40]:
np.linalg.norm(Q[:, 1])

0.9999999999999999

In [41]:
np.linalg.norm(Q[:, 2])

1.0

- Productos puntos entre 1ra y 2da columna

In [42]:
Q[:, 0].dot(Q[:, 1])

-2.7755575615628914e-17

- Cálculo de la siguiente igualdad:

$$Q^TQ = I$$

In [55]:
Q.T.dot(Q)

array([[ 1.00000000e+00, -1.57222206e-17,  4.07309668e-17],
       [-1.57222206e-17,  1.00000000e+00, -6.35279172e-17],
       [ 4.07309668e-17, -6.35279172e-17,  1.00000000e+00]])

In [57]:
Q.T.dot(Q) == approx(np.eye(3))

True

In [43]:
print('Verificando que es igual A al producto QR')
print('QR:')
pprint.pprint(Q@R)
print('A')
pprint.pprint(A)

Verificando que es igual A al producto QR
QR:
array([[ 2., -1.,  2.],
       [ 1.,  6., -1.],
       [ 1.,  4.,  1.]])
A
array([[ 2, -1,  2],
       [ 1,  6, -1],
       [ 1,  4,  1]])


* **Paso 2: resolver con el método de sustitución hacia atrás el sistema triangular superior $Rx=Q^Tb$.**

Resolvemos: $RX = QˆTB$

In [44]:
print('Usando los factores Q,R para resolver AX = B')
X = scipy.linalg.solve_triangular(R, Q.T@B) #by default parameter lower is False


Usando los factores Q,R para resolver AX = B


In [45]:
print('X:')
pprint.pprint(X)

X:
array([[ 7.33333333, -1.83333333],
       [ 0.33333333,  1.66666667],
       [-3.66666667,  2.16666667]])


In [46]:
print('Verificando resultado AX = B')
print('B:')
pprint.pprint(B)
print('AX:')
pprint.pprint(A@X)

Verificando resultado AX = B
B:
array([[ 7, -1],
       [13,  6],
       [ 5,  7]])
AX:
array([[ 7., -1.],
       [13.,  6.],
       [ 5.,  7.]])


**(Tarea) Ejercicio: resolver los sistemas de ecuaciones lineales $Ax = b$ con la factorización P,L,U y QR. Para esto crear un módulo con nombre `solve_linear_system_of_equations.py` y colocar en tal módulo las siguientes funciones de Python:**

Para factorización `PLU`:

```
def PLU(matrix, rhs):
    """
    Compute numerical approximation to linear system of equations Ax=b using
    factorization PLU via scipy.
    Args:
        matrix (numpy 2d array of floats): Square system matrix.
        rhs (numpy 1d array of floats): Right hand side of linear system of equations.
    Returns:
        x (numpy 1d array of floats or string): solution of Ax=b if A is square, if not returns string 
        "System matrix must be square"
    """
```

Para factorización `QR`:

```
def QR(matrix, rhs):
    """
    Compute numerical approximation to linear system of equations Ax=b using
    factorization QR via numpy.
    Args:
        matrix (numpy 2d array of floats): Square system matrix.
        rhs (numpy 1d array of floats): Right hand side of linear system of equations.
    Returns:
        x (numpy 1d array of floats or string): solution of Ax=b if A is square, if not returns string 
        "System matrix must be square"
    """
```

**La implementación de ambas funciones deben realizar un chequeo de dimensiones (ver *docstring* anteriores para saber qué mensaje deben regresar si la matriz del sistema no es cuadrada)**.

## Referencias:
* [numpy.linalg.solve](https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.solve.html)
* [scipy.linalg.lu](https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.linalg.lu.html)
* [scipy.linalg.solve_triangular](https://docs.scipy.org/doc/scipy/reference/generated/scipy.linalg.solve_triangular.html)

### Algoritmos iterativos

A diferencia de los algoritmos directos que utilizan un número finito de pasos para resolver un sistema de ecuaciones lineales, esta clase de algoritmos utilizan un punto inicial y con un proceso iterativo van mejorando la solución hasta que se satisfaga un criterio de paro. Típicamente tienen un desempeño más lento que los directos pero aprovechan mejor la estructura de las matrices. Dependiendo de las características de las matrices convergen o no a la solución.

Revisar sección 2.7 del libro de texto de J. Kiusalas Numerical Methods in Engineering with Python 3:

* Gauss-Seidel.
* Gradiente conjugado.
