<img src="images/keepcoding.png" width=200 align="left">

# Matrices

Al oír hablar de matrices es posible que nos imaginemos una malla bidimensional. En efecto, una matriz es un conjunto bidimensional de números, ordenados en filas y columnas. Como ya hemos visto por encima, las matrices nos van a servir para almacenar conjuntos de datos y para resolver sistemas de ecuaciones.

<img src="images/matrix.jpg" width=400 align="center">

## 1. Definición y operaciones básicas

Una matriz es un conjunto p-dimensional de números (elementos de la matriz) ordenados en filas (o renglones) y columnas. Si A es una matriz $m × n$, esto es, una matriz con $m$ filas y $n$ columnas, entonces la entrada escalar en la i-ésima y la j-ésima columna de $A$ se denota mediante $a_{ij}$ y se llama entrada $(i, j)$ de A.<br><br>

<center>$
  M=
  \left[ {\begin{array}{cc}
   a_{11} & a_{12}  & ... & a_{1j}  \\
   a_{21} & a_{22}  & ... & a_{2j}  \\
   ... & ...  & ... & ...  \\
   a_{i1} & a_{i2}  & ... & a_{ij}  \\
  \end{array} } \right]
$</center><br><br>  

Se dice que dos **matrices** son **iguales** si tienen el mismo tamaño, es decir, el mismo número de filas y de columnas, y sus columnas correspondientes son iguales.  

En python, podemos usar listas o arrays de Numpy para almacenar matrices, muy parecido a como hacíamos para los vectores (no deja de ser un vector con una dimensión más). La opción del array es la más cómoda y la que más usaremos. 

En numpy, vamos a usar la misma función que usábamos para los arrays, solo que ahora le añadimos una dimensión más (más adelante, le añadiremos más dimensiones aún!)

In [None]:
import numpy as np


No es recomendable usar `len()` cuando tratamos con matrices porque solo nos va a devolver una de las dimensiones.

### 1.1 Suma de matrices

Si A y B son matrices m × n, entonces la **suma** A + B es la matriz m × n cuyas columnas son las sumas de las columnas correspondientes de A y B. Es decir, es una suma elemento a elemento. Además, la suma A + B está definida sólo cuando A y B son del mismo tamaño.  

Para la resta se procede de modo similar, y podemos verlo como la suma de los elementos negativos de la segunda matriz.

Las propiedades de la suma de matrices son:

- Asociativa: (A + B) + C = A + (B + C)
- Conmutativa: A + B = B + A
- Elemento neutro: A + 0 = A, donde 0 es una matriz del mismo tamaño que A formada por ceros
- Elemento inverso: A + -A = 0

### 1.2 Producto de una matriz por un escalar

Si r es un escalar y A es una matriz, entonces el múltiplo escalar $r \cdot A$ es la matriz cuyos elementos son los elementos de A multiplicados por r. El producto de una matriz y un escalar es:

- Asociativo: rsA = r(sA)
- Distributivo respecto a la suma de matrices: r(A+B) = rA + rB
- Tiene elemento neutro: 1A = A

### 1.3 Producto de matrices

Hasta ahora todo había sido bastante intuitivo, pero el producto de matrices se complica un poco. 

Si $A$ es una matriz $m × n$, y si $B$ es una matriz $n × p$ con columnas $b_1, b_2,... b_p$, entonces el **producto AB** es la matriz $m × p$ cuyas columnas son:<br><br>

<center>A*B= $
  \left[ {\begin{array}{cc}
   a_{11} & a_{12}  & ... & a_{1n}  \\
   a_{21} & a_{22}  & ... & a_{2n}  \\
   ... & ...  & ... & ...  \\
   a_{m1} & a_{m2}  & ... & a_{mn}  \\
  \end{array} } \right]
$ * $
  \left[ {\begin{array}{cc}
   b_{11} & b_{12}  & ... & b_{1p}  \\
   b_{21} & b_{22}  & ... & b_{2p}  \\
   ... & ...  & ... & ...  \\
   b_{n1} & b_{n2}  & ... & b_{np}  \\
  \end{array} } \right]
$ =<br><br> $
  \left[ {\begin{array}{cc}
   a_{11}\cdot b_{11}+ a_{12}\cdot b_{21} + ... + a_{1n}\cdot b_{n1}& a_{11}\cdot b_{12}+ a_{12}\cdot b_{22} + ... + a_{1n}\cdot b_{n2}  & ... & a_{11}\cdot b_{1p}+ a_{12}\cdot b_{2p} + ... + a_{1n}\cdot b_{np}  \\
   a_{21}\cdot b_{11}+ a_{22}\cdot b_{21} + ... + a_{2n}\cdot b_{n1}& a_{21}\cdot b_{12}+ a_{22}\cdot b_{22} + ... + a_{2n}\cdot b_{n2}  & ... & a_{21}\cdot b_{1p}+ a_{22}\cdot b_{2p} + ... + a_{2n}\cdot b_{np}  \\
   ... & ...  & ... & ...  \\
      a_{m1}\cdot b_{11}+ a_{m2}\cdot b_{21} + ... + a_{mn}\cdot b_{n1}& a_{m1}\cdot b_{12}+ a_{m2}\cdot b_{22} + ... + a_{mn}\cdot b_{n2}  & ... & a_{m1}\cdot b_{1p}+ a_{m2}\cdot b_{2p} + ... + a_{mn}\cdot b_{np}  \\
  \end{array} } \right]
$  
</center>

La notación para las dimensiones no es casual, para poder multiplicar las matrices necesitamos que el número de columnas de la primera matriz sea igual al número de filas de la segunda. El producto de matrices cumple:

- Asociatividad: A(BC) = (AB)C
- Distributividad respecto de la suma de matrices por la derecha: (A+B)C = AC + BC
- Distributividad respecto de la suma de matrices por la izquierda: C(A+B) = CA + CB

¿Echamos en falta algo habitual? El producto de matrices **no es conmutativo**.

**Ojo**, este no es el producto matricial, sino una multiplicación elemento a elemento, que además solo va a funcionar si las matrices tienen el mismo tamaño. Para el producto de matrices _de verdad_, usamos `.dot`

Vemos que efectivamente el producto no es conmutativo. En general, a no ser que las matrices sean cuadradas (mismo número de filas que de columnas) tampoco va a ser posible multiplicar AB o BA indistintamente, sino solo una de ellas.

## 2. Algunas matrices interesantes

### 2.1 Matrices cuadradas

Las matrices cuadradas son aquellas que tienen el mismo número de filas que de columnas.

### 2.2 Matrices triangulares


Una **matriz triangular** es una matriz cuadrada la cual tiene triángulos de ceros por encima o por debajo de la diagonal. En caso de que los valores ceros estén por encima de la diagonal se denomina **matriz triangular superior** y si es por debajo de la diagonal se denomina como **matriz triangular inferior**.<br><br>

**Matriz triangular inferior**:

<center>$
  U_{nxm}=
  \left[ {\begin{array}{cc}
   1 & 4  & 6  \\
   0 & 2  & 2  \\
   0 & 0  & 1  \\
  \end{array} } \right]
$</center><br><br>

**Matriz triangular superior**:

<center>$
  U_{nxm}=
  \left[ {\begin{array}{cc}
   1 & 0 & 0 \\
   4 & 2  & 0\\
   7 & 3  & 1  \\
  \end{array} } \right]
$</center><br><br>

### 2.3 Matrices diagonales y la matriz identidad

La diagonal principal de una matriz cuadrada es la que empieza en el elemento (1,1), por ejemplo:

La diagonal principal está formada por los elementos (1, 0, -3, 0.6, -1).

Se llama **matriz diagonal** a una matriz que solo tiene elementos en su diagonal principal. Si estos elementos son unos, se trata de la **matriz identidad**.

In [None]:
# Podemos multiplicar la identidad por un escalar


Aunque no es la matriz identidad y no cumple sus propiedades, podemos crear una matriz de cualquier tamaño que solo tenga 1s en los elementos de la diagonal.

### 2.4 La matriz traspuesta

La traspuesta de una matriz es el resultado de intercambiar filas por columnas. 

### 2.5 Matriz simétrica

Una **matriz cuadrada** va a ser **simétrica** si $A^T=A$, es decir si $A$ es igual a su propia matriz transpuesta.

### 2.6 La matriz inversa

Este apartado solo aplica a **matrices cuadradas**, es decir, con el mismo número de filas que de columnas. La inversa de una matriz A se representa como $A^{-1}$ y es otra matriz tal que $A \cdot A^{−1} = I$ donde I es la matriz identidad de la misma dimensión (es decir, mismo número de filas/columnas).

No todas las matrices cuadradas tienen inversa, las que no tienen son las llamadas matrices singulares, y veremos más adelante algunas de sus características.

Hay varias formas de calcular la inversa de una matriz, la más sencilla seguramente sea la de eliminación guassiana. El cálculo de una matriz inversa es un proceso un poco engorroso, pero por suerte podemos utilizar numpy.

### 2.7 Ejemplo: matriz de adyacencia de un grafo

Imaginamos un grafo con N nodos o vértices, podemos representar todas las conexiones posibles entre esos nodos utilizando una matriz cuadrada de tamaño N por N. Cada fila y columna en la matriz corresponde a un nodo en particular. Esta es la llamada matriz de adyacencia de un grafo.

Si es un grafo no dirigido, es decir, las conexiones entre nodos no tienen una dirección específica, la matriz de adyacencia será simétrica respecto a su diagonal principal. Los valores en la matriz representan si existe o no una conexión entre los nodos.

**Ejercicio:** Escribe la matriz de adyacencia del siguiente grafo:

<img src="images/grafo.png" width=400 align="center">

In [14]:
import numpy as np

# Creamos una matriz de ceros 4x4
matriz_adyacencia = np.zeros((4,4))
print("Antes: \n", matriz_adyacencia)

# Establecemos las conexiones en la matriz
conexiones = [(0,1),(1,2),(2,3),(0,3)]

for fila, columna in conexiones:
    matriz_adyacencia[fila][columna] = 1
    matriz_adyacencia[columna][fila] = 1
    
print("Despues: \n", matriz_adyacencia)

Antes: 
 [[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
Despues: 
 [[0. 1. 0. 1.]
 [1. 0. 1. 0.]
 [0. 1. 0. 1.]
 [1. 0. 1. 0.]]


## Indexing y slicing

Los ndarrays se pueden indexar con la sintaxis habitual de Python: x[obj], donde x es el array y obj la selección. Dependiendo del valor de este obj hay diferentes tipos de indexing. ¡Recordamos que se empieza a contar en el 0!

#### np.random.seed
La función np.random.seed en NumPy se utiliza para establecer una semilla en el generador de números aleatorios. Esto garantiza que las secuencias de números aleatorios sean reproducibles. Es decir, si estableces la misma semilla y ejecutas el mismo código de generación de números aleatorios, obtendrás la misma secuencia de números cada vez.

In [57]:
import numpy as np

# Sin establecer una semilla
print(np.random.rand(3))

# Establecer una semilla
np.random.seed(0)
print(np.random.rand(3))

# Establecer la misma semilla de nuevo
np.random.seed(0)
print(np.random.rand(3))

# Salida esperada:
# [0.54488318 0.4236548  0.64589411]  # Estos números serán diferentes cada vez
# [0.5488135  0.71518937 0.60276338]  # Estos números serán siempre los mismos
# [0.5488135  0.71518937 0.60276338]  # Estos números serán siempre los mismos

[0.54488318 0.4236548  0.64589411]
[0.5488135  0.71518937 0.60276338]
[0.5488135  0.71518937 0.60276338]


En resumen, np.random.seed es una herramienta esencial para garantizar la reproducibilidad y consistencia en la generación de números aleatorios en proyectos que requieren análisis y experimentación rigurosos.

In [52]:
import numpy as np
np.random.seed(0)
print(np.random.rand(3))

[0.5488135  0.71518937 0.60276338]


In [43]:
import numpy as np
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
x[::-1]

array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])

#### Explicación del ejemplo x[1:7:2]

In [58]:
import numpy as np
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
x[1:7:2]

array([1, 3, 5])


**La expresión x[1:7:2]** utiliza la notación de slicing (corte) de arrays en NumPy, que sigue la sintaxis array[start:stop:step]. Aquí está el desglose de cada parte y cómo se aplica a tu array x:

1. start: El índice de inicio del slice, que es 1 en este caso.
1. stop: El índice de fin (exclusivo) del slice, que es 7 en este caso.
1. step: El tamaño del paso entre elementos seleccionados, que es 2 en este caso.

Entonces, x[1:7:2] significa:

* Comienza en el índice 1.
* Termina antes del índice 7 (exclusivo).
* Selecciona elementos con un paso de 2.

Tu array x es: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Aplicando el slicing:

* Comenzando en el índice 1: el elemento es 1.
* Con un paso de 2, los siguientes índices serán 1, 3, 5.
  
Elementos seleccionados:

* Índice 1: 1
* Índice 3: 3
* Índice 5: 5

Entonces, x[1:7:2] devuelve los elementos [1, 3, 5].

#### Explicación del ejemplo x[-3:3:-1]

In [59]:
import numpy as np
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
x[-3:3:-1]

array([7, 6, 5, 4])

**La expresión x[-3:3:-1]** utiliza la notación de slicing con índices negativos y un paso negativo. Aquí está el desglose de cada parte y cómo se aplica a tu array x:

1. start: El índice de inicio del slice, que es -3 en este caso.
1. stop: El índice de fin (exclusivo) del slice, que es 3 en este caso.
1. step: El tamaño del paso entre elementos seleccionados, que es -1 en este caso (recorre el array hacia atrás).

Tu array x es: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Índices negativos:
- 1 es el último elemento.
- 2 es el penúltimo.
- 3 es el antepenúltimo.

Aplicando el slicing:
- Comenzando en el índice -3: el elemento es 7.
- Con un paso de -1, los siguientes índices serán -3, -4, -5, ..., recorriendo el array hacia atrás hasta llegar al índice 3 (exclusivo).
  
Elementos seleccionados:
- Índice -3: 7
- Índice -4: 6
- Índice -5: 5
- Índice -6: 4

La posición 4 (que es el índice 3) es el límite donde se detiene el slicing, y como el índice de fin es exclusivo, el número 3 no se incluye en el resultado.

##### Visualización:

- **x =** [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
- **Indices:** [0,1,2,3,4,5,6,7,8,9]
- **Indices negativos:** [−10,−9,−8,−7,−6,−5,−4,−3,−2,−1]
- **Slice:** x[−3:3:−1]
- **Elementos seleccionados:** [7,6,5,4]

Por lo tanto, x[-3:3:-1] devuelve array([7, 6, 5, 4]) porque selecciona elementos desde el índice -3 hasta justo antes del índice 3, recorriendo el array hacia atrás con un paso de -1, y no incluye el número 3 ya que el índice 3 es exclusivo en el slicing.

In [48]:
np.random.seed(0)
x = np.random.randint(10, size=(4, 3, 5))
print(x)
print("----")
print(x[:, :,0])

[[[5 0 3 3 7]
  [9 3 5 2 4]
  [7 6 8 8 1]]

 [[6 7 7 8 1]
  [5 9 8 9 4]
  [3 0 3 5 0]]

 [[2 3 8 1 3]
  [3 3 7 0 1]
  [9 9 0 4 7]]

 [[3 2 7 2 0]
  [0 4 5 5 6]
  [8 4 1 4 9]]]
----
[[5 9 7]
 [6 5 3]
 [2 3 9]
 [3 0 8]]


In [49]:
np.random.seed(0)
x = np.random.randint(10, size=(4, 3, 5))
print(x)
print("----")
print(x[..., 0]) # Es igual al anterior. print(x[:, :,0])

[[[5 0 3 3 7]
  [9 3 5 2 4]
  [7 6 8 8 1]]

 [[6 7 7 8 1]
  [5 9 8 9 4]
  [3 0 3 5 0]]

 [[2 3 8 1 3]
  [3 3 7 0 1]
  [9 9 0 4 7]]

 [[3 2 7 2 0]
  [0 4 5 5 6]
  [8 4 1 4 9]]]
----
[[5 9 7]
 [6 5 3]
 [2 3 9]
 [3 0 8]]


## Reshaping

Otra de las herramientas más usadas es reshape, que sirve para cambiar las dimensiones de un array sin transformar sus datos. Por ejemplo si queremos transformar:

In [64]:
import numpy as np
grid = np.arange(1, 10)
print(grid)
grid.reshape(3, 3)

[1 2 3 4 5 6 7 8 9]


array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [67]:
v = np.arange(1, 11)
print(v)
w = v.reshape(2, 5)
w

[ 1  2  3  4  5  6  7  8  9 10]


array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10]])

In [66]:
u = np.arange(6).reshape((3, 2))
u

array([[0, 1],
       [2, 3],
       [4, 5]])

## Joining and splitting

En ocasiones podemos necesitar unir o separar arrays, y numpytiene funciones específicas para estas situaciones. Para unir arrays, usamos concatenate y para separarlos, usamos split.

In [68]:
import numpy as np
grid = np.arange(1, 10)
np.concatenate([grid, grid])

array([1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9])

Para arrays con distinta dimensiones, se suele usar vstack (vertical stack) o hstack (horizontal).

In [70]:
grid_reshape = grid.reshape(3, 3)
x = np.array([20, 20, 20])
print(grid_reshape)
print("\n---\n")
print(x)
print("\n---\n")
np.vstack([grid_reshape, x])

[[1 2 3]
 [4 5 6]
 [7 8 9]]

---

[20 20 20]

---



array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [20, 20, 20]])

#### splitting

In [71]:
x = np.arange(1, 10)
x

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [72]:
x1, x2, x3 = np.split(x, [3, 5])
print(x1)
print(x2)
print(x3)

[1 2 3]
[4 5]
[6 7 8 9]


La función np.split en NumPy divide un array en múltiples subarrays según los índices proporcionados. En tu caso, np.split(x, [3, 5]) divide el array x en tres subarrays usando los índices 3 y 5 como puntos de división.

##### Visualización de la división:

- Primer subarray (x1): Desde el inicio hasta el índice 3 (exclusivo).
    - x1=[1,2,3]
- Segundo subarray (x2): Desde el índice 3 hasta el índice 5 (exclusivo).
    - x2=[4,5]
- Tercer subarray (x3): Desde el índice 5 hasta el final del array.
    - x3=[6,7,8,9]
 
##### Resumen:
- x1 contiene los elementos desde el índice 0 hasta 2.
- x2 contiene los elementos desde el índice 3 hasta 4.
- x3 contiene los elementos desde el índice 5 hasta el final.

In [73]:
x1, x2, x3 = np.split(x, 3)
print(x1)
print(x2)
print(x3)

[1 2 3]
[4 5 6]
[7 8 9]


### 3 Factorización LU

La factorización LU, llamada así por sus factores L (lower triangular) y U (upper triangular), es un método de descomposición de una matriz en el producto de dos matrices triangulares. Sea $A$ una matriz, entonces buscamos:  
 
<center>$A = LU$</center>

donde $L$ y $U$ son matrices inferiores y superiores triangulares respectivamente.  

Si pensamos en una matriz cuadrada:<br><br>
$
  \left[ {\begin{array}{cc}
   a_{11} & a_{12}  & ... & a_{1n}  \\
   a_{21} & a_{22}  & ... & a_{2n}  \\
   ... & ...  & ... & ...  \\
   a_{n1} & a_{n2}  & ... & a_{nn}  \\
  \end{array} } \right]
$ =
$
  \left[ {\begin{array}{cc}
   1      & 0       & 0    & ... & 0  \\
   l_{21} & 1       & 0    & ... & 0  \\
   ...    & ...     & ...  & ... & ... \\
   l_{n1} & l_{n2}  & ...  & ... & 1  \\
  \end{array} } \right]
$* $
  \left[ {\begin{array}{cc}
   u_{11} & u_{12} & u_{13} & ... & u_{1n}  \\
   0      & u_{22} & u_{23} & ... & b_{2n}  \\
   ...    & ...    & ...    & ... & ...     \\
   0      & 0      & ...    & ... & u_{nn}  \\
  \end{array} } \right]
$
  
Si la matriz A es invertible, es decir, tiene inversa, las matrices L y U son únicas.  

El proceso de factorización LU se utiliza comúnmente en la resolución de sistemas de ecuaciones lineales, ya que facilita la resolución de sistemas de ecuaciones mediante la sustitución hacia adelante (forward substitution) y la sustitución hacia atrás (backward substitution).

Para realizar la factorización LU, se utilizan operaciones de eliminación gaussiana para transformar la matriz original en las matrices L y U. Esto se hace aplicando operaciones elementales de fila para llevar la matriz original a una forma triangular. Las operaciones utilizadas para convertir A en U también se aplican a una matriz 
L inicialmente igual a la identidad, de tal manera que L guarda la información de las operaciones realizadas.

La factorización LU tiene aplicaciones en la resolución de sistemas de ecuaciones lineales, cálculos de determinantes, inversión de matrices y en la resolución numérica de ecuaciones diferenciales, entre otros campos matemáticos y científicos. Al descomponer una matriz en dos matrices triangulares, se simplifica la resolución de sistemas de ecuaciones lineales y otros problemas algebraicos.

In [None]:
import sys
!{sys.executable} -m pip install scipy

In [80]:
from scipy import linalg 
import numpy as np

A = np.array([[2, 1, 1], [1, 2, 1], [1, 1, 2]])
print(A)

[[2 1 1]
 [1 2 1]
 [1 1 2]]


In [83]:
_, l, u = linalg.lu(A)
l

array([[1.        , 0.        , 0.        ],
       [0.5       , 1.        , 0.        ],
       [0.5       , 0.33333333, 1.        ]])

In [84]:
u

array([[2.        , 1.        , 1.        ],
       [0.        , 1.5       , 0.5       ],
       [0.        , 0.        , 1.33333333]])

In [85]:
np.dot(l,u)

array([[2., 1., 1.],
       [1., 2., 1.],
       [1., 1., 2.]])

## 4 Determinantes

El determinante $|A|$ de una matriz cuadrada  $A$ es un número que obtenemos a partir de los elementos de la matriz, y que nos dará una idea de cómo estos elementos se relacionan entre ellos.

Con Numpy, podemos calcular el determinante fácilmente usando `linalg.det`.

In [86]:
A

array([[2, 1, 1],
       [1, 2, 1],
       [1, 1, 2]])

In [88]:
print(np.linalg.det(A))

4.0


### 4.1 Matrices inversas e invertibles

Una **matriz** $A$ es **invertible** si y sólo si $|A|≠0$.

In [95]:
A = np.array([[2, 1, 1], [1, 2, 1], [1, 1, 2]])
print(A)

print("\n---\n")

# La Matriz es invertible
print(np.linalg.inv(A))

[[2 1 1]
 [1 2 1]
 [1 1 2]]

---

[[ 0.75 -0.25 -0.25]
 [-0.25  0.75 -0.25]
 [-0.25 -0.25  0.75]]


In [92]:
# Modificar la última fila para que el determinando sea 0
A[2] = np.array([2, 1, 1])

print("Determinante:", np.linalg.det(A))

# Debe arrojar un error
print(np.linalg.inv(A))

Determinante: 0.0


LinAlgError: Singular matrix

In [93]:
np.linalg.pinv(A)

array([[ 0.31818182, -0.36363636,  0.31818182],
       [-0.18181818,  0.63636364, -0.18181818],
       [ 0.04545455,  0.09090909,  0.04545455]])