# **Algebra lineal con Numpy**

___

**Saúl Arciniega Esparza** | Ph.D. Profesor Asociado C Tiempo Completo

* [Twitter](https://twitter.com/zaul_arciniega) | [LinkedIn](https://www.linkedin.com/in/saularciniegaesparza/) | [ResearchGate](https://www.researchgate.net/profile/Saul-Arciniega-Esparza)
* [Hydrogeology Group](https://www.ingenieria.unam.mx/hydrogeology/), [Facultad de Ingeniería de la UNAM](https://www.ingenieria.unam.mx/)
___


En Python, el uso de **loops** puede representar un mayor tiempo de cómputo que el uso de de vectorización, esto es, conviene aplicar operaciones matriciales directamente con la librería de Numpy.

Para la aplicación de muchos algoritmos de algebra lineal debemos utilizar el submódulo [linalg](https://numpy.org/doc/stable/reference/routines.linalg.html) dentro de la librería de Numpy.

In [None]:
import numpy as np
from numpy import linalg

In [None]:
array1 = np.array([[1,2,3],[4,5,6],[7,8,9]])
array1

In [None]:
array2 = np.array([[9,8,7],[6,5,4],[3,2,1]])
array2

## Operaciones elemento por elemento

Cuando necesitamos operar los elementos de un arreglo, con los elementos de otro arreglo con las mismas dimensiones (o con un escalar), podemos aplicar directamente los operadores matemáticos en Python sin ningún cambio.


- Multiplicación elemento por elemento:

Por ejemplo, queremos realizar la operación elemento por elemento de dos arreglos, si lo quisieramos hacer de forma manual sería:

In [None]:
def multiplicacion_elementos(m1, m2):
    res = np.zeros_like(m1)
    for i in range(m1.shape[0]):
        for j in range(m1.shape[1]):
            res[i,j] = m1[i,j] * m2[i,j]
    return res

multiplicacion_elementos(array1, array2)

La forma simplificada de hacer lo anterior es:

In [None]:
array1 * array2

Lo anterior es una simplificación de utilizar *np.multiply*

In [None]:
np.multiply(array1, array2)

Si comparamos los tiempos de ejecución tenemos:

In [None]:
# Definamos unas matrices más grandes
x1 = np.random.rand(1000, 1000)
x2 = np.random.rand(1000, 1000)

In [None]:
# Veamos el caso manual
%timeit multiplicacion_elementos(x1, x2)

In [None]:
# Veamos el caso simplificado
%timeit x1 * x2

In [None]:
# Veamos con la función de numpy
%timeit np.multiply(x1, x2)

## Multiplicación de matrices

- Producto matricial:

![](img/matmult.png)


In [None]:
np.matmul(array1, array2)

Lo anterior lo podemos simplificar utilizando **@**:

In [None]:
array1 @ array2

- Producto punto

![](img/dotproduct.png)

In [None]:
np.dot([1, 2, 3], [1, 2, 3])

> **Nota**: Cuando utilizamos dos arreglos de mxn en lugar de dos vectores, *np.dot* utiliza *np.matmult*:

In [None]:
np.dot(array1, array2)

- Números complejos con matrices

Para expresar un número imaginario lo podemos hacer mediante dos componentes, la real y la imaginaria:

```python
numero_complejo = 3+2j
```

In [None]:
# Suma de dos números complejos
(3+2j) + (1-3j)

In [None]:
# Suma de vectores con numeros complejos
np.array([3+2j, 3]) + np.array([-4j, -4+1j])

In [None]:
# Producto punto (complex-conjugated)
np.dot([3+2j, 2j], [-1, -3j])

In [None]:
# Obtener parte real de un número
np.real(3+2j)

In [None]:
# Obtener parte imaginaria de un número
np.imag(3+2j)

## Otras operaciones algebráicas

- Inversa de una matriz:

La matriz inversa para una matriz A cuadrada de nxn es aquella que cumple con:

$$ A * A^{-1} = A^{-1} * A = I $$

In [None]:
linalg.inv(array1)

- Determinante de una matriz:

In [None]:
linalg.det(array1)

- Transpuesta de una matriz:

In [None]:
np.transpose(array1)

In [None]:
array1.transpose()

In [None]:
array1.T

## Solución de un sistema de ecuaciones lineales:

Imaginemos que tenemos el siguiente sistema de ecuaciones

$$x0 + 2 * x1 = 1$$
$$3 * x0 + 5 * x1 = 2$$

Para representarlo matricial mente tendríamos:

$$ A *  x = b $$

In [None]:
A = np.array([[1, 2], [3, 5]])
A

In [None]:
b = np.array([1, 2])
b

In [None]:
x = linalg.solve(A, b)
x

In [None]:
# Otra forma de resolver el sistema es
linalg.inv(A) @ b

In [None]:
# Para validar que nuestro resultado es correcto podemos usar
x = linalg.solve(A, b)
np.dot(A, x)

In [None]:
# O tambien podemos comparar los dos vectores
np.allclose(np.dot(A, x), b)

## Matrices esparcidas

Una matriz dispersa (sparse matrix) es una matriz de gran tamaño en la que la mayor parte de sus elementos son cero.

Con matrices de gran tamaño los métodos tradicionales para almacenar la matriz en la memoria de una computadora o para la resolución de sistemas de ecuaciones lineales necesitan una gran cantidad de memoria y de tiempo de proceso. Se han diseñado algoritmos específicos para estos fines cuando las matrices son dispersas.

En Python, los algoritmos para trabajar con matrices esparcidas se encuentran en el submódulo sparse de la librería [Scipy](https://docs.scipy.org/doc/scipy/reference/sparse.html).

In [None]:
from scipy import sparse as sp
from scipy.sparse.linalg import spsolve

Hay varias formas de definir una matriz esparcida con Scipy:

- csc_matrix: Compressed Sparse Column format
- csr_matrix: Compressed Sparse Row format
- bsr_matrix: Block Sparse Row format
- lil_matrix: List of Lists format
- dok_matrix: Dictionary of Keys format
- coo_matrix: COOrdinate format (aka IJV, triplet format)
- dia_matrix: DIAgonal format

Cada uno de los formatos anteriores se construye de forma distinta, ya sea indicando renglones y columnas, ingresando los datos por bloques, o mediante sus coordenadas.

Algunos de esos formatos son compatibles con algoritmos de Numpy, pero otros requieren que se realicen transformaciones previas.

- Creando matrices esparcidas

Veamos un ejemplo con una matriz crs:

In [None]:
A = sp.csr_matrix([[1, 2, 0], [0, 0, 3], [4, 0, 5]])
A

In [None]:
# creamos un vector con numpy y multiplicamos nuestra informacion
v = np.array([1, 0, -1])
A.dot(v)

Noten que en este caso no es igual si se usa:

In [None]:
np.dot(A, v)

También, si queremos ver nuestra matriz esparcida en un formato de Numpy usamos:

In [None]:
A.toarray()

¿Qué beneficios nos aporta una matriz esparcida? Básicamente que se reduce el tamaño de almacenamiento de la matriz en la memoria, y mientras mayor sea la matriz, mayor será el ahorro:

In [None]:
# obtener el tamaño de matriz esparcida en bytes
A.__sizeof__()

In [None]:
# convertir la matriz esparcida a matriz de numpy y obtener su tamaño en bytes
A.toarray().__sizeof__()

Y así como podemos pasar de una matriz esparcida a una de Numpy, se puede hacer el proceso inverso:

In [None]:
x = np.array([[1, 2, 0], [0, 0, 3], [4, 0, 5]])
x

In [None]:
# convertir a matriz esparcida con formato csr
sp.csr_matrix(x)

- Sistemas de ecuaciones con matrices esparcidas

La matriz de coeficientes en los sistemas de ecuaciones lineales en métodos de diferencias finitas es una candidata a ser manipulada como una matriz esparcida, debido a que muy pocos elementos suelen tener valores distintos de ceros.

Para crear esta matriz se recomienda utilizar una *lil_matrix*, indicando los renglones y columnas, y luego guardando los coeficientes según su renglón y columna:

In [None]:
A = sp.lil_matrix((1000, 1000))

In [None]:
A[0, :100] = np.random.rand(100)  # guardar valores aleatorios 
A[1, 100:200] = A[0, :100]
A.setdiag(np.random.rand(1000))

Vamos a visualizar nuestra matriz para ver cómo está llenada:

In [None]:
import matplotlib.pyplot as plt

In [None]:
plt.spy(A)

Intentemos resolver un sistema de ecuaciones con esta matriz esparcida:

In [None]:
b = np.random.rand(1000)

In [None]:
spsolve(A, b)

> **NOTA**: nos marca una advertencia debido a que las matrices *lil_matrix* no se pueden utilizar para estos propósitos, se necesita transformar a una matriz *csr_matrix*.

In [None]:
spsolve(A.tocsr(), b)

Podemos comprobar que da lo mismo si convertimos la matriz esparcida a una matriz normal de Numpy:

In [None]:
np.linalg.solve(A.toarray(), b)

In [None]:
# calculemos el error de las dos estimaciones
xs = spsolve(A.tocsr(), b)            # resuelto con matrices esparcidas
xn = np.linalg.solve(A.toarray(), b)  # resuelto con matrices de numpy
error = np.sum(np.abs(xs - xn))
error

## Ejemplo de un modelo numérico con matrices esparcidas

Para este ejemplo resolvemos el flujo subterráneo en 2D en un acuífero confinado, descrito por la ecuación de conservación de masa y la Ley de Darcy:

$$ Ss \frac{\delta h}{\delta t} -f =  \frac{\delta}{\delta x} \left ( Tx \frac{\delta h}{\delta x} \right ) + \frac{\delta}{\delta y} \left ( Ty \frac{\delta h}{\delta y} \right )$$

In [None]:
import numpy as np
from scipy.sparse import lil_matrix
from scipy.sparse.linalg import spsolve
import matplotlib.pyplot as plt

# Variables de entrada
x = np.full(40, 20)  # ancho de bloques en x
y = np.full(60, 20)  # ancho de bloques en y

nx = len(x)  # numero de columnas
ny = len(y)  # numero de renglones
Ho = np.ones((ny,nx))*-1  # matriz cargas
w = np.zeros((ny,nx))     # matriz de recarga o extraccion
dx = np.zeros((ny,nx))    # ancho de bloques
dy = np.zeros((ny,nx))    # largo de bloques
Tx = np.zeros((ny,nx))    # transmisividad de bloques direccion x
Ty = np.zeros((ny,nx))    # transmisividad de bloques direccion y

# Asignar valores de carga
Ho[0,:] = 0.2  # primer renglon, carga 0.2
Ho[-1,:]= 0.0  # último renglon, carga cero 

# Asignar incrementos de malla
for i in range(nx):
    dx[:,i] = x[i]
for i in range(ny):
    dy[i,:] = y[i]

# Asignar recarga
w[2:4,2:4] = 1.27e-6

# Asignar transmisividad
Tx[:,:] = 0.0015
Tx[4:7,0:3] = 0.0008
Ty[:,:] = 0.0015
Ty[4:7,0:3] = 0.0008

# Calcular transmisividad interbloques
Tx0=np.zeros((ny,nx)) 
Tx2=np.zeros((ny,nx))
Ty0=np.zeros((ny,nx)) 
Ty2=np.zeros((ny,nx))
for i in range(1,nx):
    Tx0[:,i]=2*Tx[:,i]*Tx[:,i-1]/(dx[:,i]*Tx[:,i-1]+dx[:,i-1]*Tx[:,i])/dx[:,i]        
    Tx2[:,i-1]=2*Tx[:,i]*Tx[:,i-1]/(dx[:,i]*Tx[:,i-1]+dx[:,i-1]*Tx[:,i])/dx[:,i-1]
for i in range(1,ny):
    Ty0[i,:]=2*Ty[i,:]*Ty[i-1,:]/(dy[i,:]*Ty[i-1,:]+dy[i-1,:]*Ty[i,:])/dy[i,:]        
    Ty2[i-1,:]=2*Ty[i,:]*Ty[i-1,:]/(dy[i,:]*Ty[i-1,:]+dy[i-1,:]*Ty[i,:])/dy[i-1,:]       
    
# Numerar nodos
Nid=np.ones((nx*ny,4),dtype=int)*-1 #indices de los nodos
Nid[:,0]=np.arange(0,nx*ny) #numerar nodos
c,r=np.where(np.transpose(Ho==Ho)) #obtener coordenadas de los elementos
ij=np.array([r,c])
Nid[:,2]=ij[0] #renglon i dentro de la matriz
Nid[:,3]=ij[1] #columna j dentro de la matriz

#Tx0,Tx2,Ty0,Ty2,H,w
N=np.zeros((nx*ny,6),dtype=float) #elementos de los nodos
N[:,0]=Tx0[ij[0],ij[1]]
N[:,1]=Tx2[ij[0],ij[1]]
N[:,2]=Ty0[ij[0],ij[1]]
N[:,3]=Ty2[ij[0],ij[1]]
N[:,4]=Ho[ij[0],ij[1]]
N[:,5]=w[ij[0],ij[1]]
n=np.where(np.transpose(N[:,4]<0)) #nodos por resolver
n=n[0]
nnod=len(n) #numero de nodos por resolver
Nid[n,1]=np.arange(0,nnod,dtype=int)
del dx,dy,w,Tx,Ty

# Sistema de ecuaciones
# Generar sistema de ecuaciones
A=lil_matrix((nnod,nnod)) #matriz de coeficientes (Row-based list of lists sparse matrix)
B=np.zeros(nnod) #matriz de terminos independientes
for i in range(nnod):
    nij=n[i] #nodo central
    B[i]=B[i]-N[nij,5] #recarga o evapotranspiracion
    #nodo izquierdo
    if Nid[nij,3]>0: #nodo de borde izquierdo
        A[i,i]=A[i,i]-N[nij,0]
        if Nid[Nid[nij,0]-ny,1]==-1: #Carga establecida
            B[i]=B[i]-N[nij,0]*N[Nid[nij,0]-ny,4]
        else: #Carga izquierda por calcular
            A[i,Nid[Nid[nij,0]-ny,1]]=N[nij,0]
    #nodo derecho
    if Nid[nij,3]<nx-1: #nodo de borde izquierdo
        A[i,i]=A[i,i]-N[nij,1]
        if Nid[Nid[nij,0]+ny,1]==-1: #Carga establecida
            B[i]=B[i]-N[nij,1]*N[Nid[nij,0]+ny,4]
        else: #Carga izquierda por calcular
            A[i,Nid[Nid[nij,0]+ny,1]]=N[nij,1]
    #nodo superior
    if Nid[nij,2]>0: #nodo de borde superior
        A[i,i]=A[i,i]-N[nij,2]
        if Nid[Nid[nij,0]-1,1]==-1: #Carga establecida
            B[i]=B[i]-N[nij,2]*N[Nid[nij,0]-1,4]
        else: #Carga superior por calcular
            A[i,Nid[Nid[nij,0]-1,1]]=N[nij,2]
    #nodo inferior
    if Nid[nij,2]<ny-1: #nodo de borde inferior
        A[i,i]=A[i,i]-N[nij,3]
        if Nid[Nid[nij,0]+1,1]==-1: #Carga establecida
            B[i]=B[i]-N[nij,3]*N[Nid[nij,0]+1,4]
        else: #Carga superior por calcular
            A[i,Nid[Nid[nij,0]+1,1]]=N[nij,3]
#Resolver sistema de ecuaciones
A=A.tocsr()  # Convert this matrix to Compressed Sparse Row format
h=spsolve(A,B)
#Acomodar cargas calculadas
Ho[ij[0][n],ij[1][n]]=h

#Graficar
fig, ax = plt.subplots(figsize=(5, 10))
p = ax.imshow(Ho)
plt.show()