# Algebra Lineal con Python

<img alt="Algebra lineal" title="Algebra lineal" src="http://relopezbriega.github.io/images/lin-alg.jpg">

## Introducción

Una de las herramientas matemáticas más utilizadas en machine learning y data mining es el [Álgebra lineal](http://es.wikipedia.org/wiki/%C3%81lgebra_lineal); por tanto, si queremos incursionar en el fascinante mundo del aprendizaje automático y el análisis de datos es importante reforzar los conceptos que forman parte de sus cimientos. 

El Álgebra lineal es una rama de las matemáticas que es sumamente utilizada en el estudio de una gran variedad de ciencias, como ingeniería, finanzas, investigación operativa, entre otras. Es una extensión del álgebra que aprendemos en la escuela secundaria, hacia un mayor número de dimensiones; en lugar de trabajar con incógnitas a nivel de escalares comenzamos a trabajar con matrices y vectores.  

El estudio del Álgebra lineal implica trabajar con varios objetos matemáticos como:

* **Los <a href="http://es.wikipedia.org/wiki/Escalar_(matem%C3%A1tica)">Escalares</a>**: Un *escalar* es un solo número, en contraste con la mayoría de los otros objetos estudiados en [Álgebra lineal](http://es.wikipedia.org/wiki/%C3%81lgebra_lineal), que son generalmente una colección de múltiples números.

* **Los [Vectores](http://es.wikipedia.org/wiki/Vector)**:Un *vector* es una serie de números. Los números tienen una orden preestablecido, y podemos identificar cada número individual por su índice en ese orden. Podemos pensar en los  *vectores* como la identificación de puntos en el espacio, con cada elemento que da la coordenada a lo largo de un eje diferente. Existen dos tipos de *vectores*, los *vectores de fila* y los *vectores de columna*. Podemos representarlos de la siguiente manera, dónde *f* es un vector de fila y *c* es un vector de columna:
$$f=\begin{bmatrix}0&1&-1\end{bmatrix}   \\ \\
c=\begin{bmatrix}0\\1\\-1\end{bmatrix}$$

* **Las <a href="http://es.wikipedia.org/wiki/Matriz_(matem%C3%A1ticas)">Matrices</a>**: Una *matriz* es un arreglo bidimensional de números (llamados entradas de la matriz) ordenados en filas (o renglones) y columnas, donde una fila es cada una de las líneas horizontales de la matriz y una columna es cada una de las líneas verticales. En una *matriz* cada elemento puede ser identificado utilizando dos índices, uno para la fila y otro para la columna en que se encuentra. Las podemos representar de la siguiente manera, *A* es una matriz de 3x2.
$$A=\begin{bmatrix}0 & 1& \\-1 & 2 \\ -2 & 3\end{bmatrix}$$

* **Los [Tensores](http://es.wikipedia.org/wiki/C%C3%A1lculo_tensorial)**:En algunos casos necesitaremos una matriz con más de dos ejes. En general, una serie de números dispuestos en una cuadrícula regular con un número variable de ejes es conocido como un *tensor*.

Sobre estos objetos podemos realizar las operaciones matemáticas básicas, como sumas, multiplicaciones, restas y divisiones

## Numpy

La librería principal que Python nos ofrece para realizar operaciones de Álgebra linea es **[Numpy](http://www.numpy.org/)**, la cual nos va a permitir crear *vectores*, *matrices* y *tensores* con suma facilidad.

**Recuerda!**
<img src="./img/import_numpy_meme.png">


## Vectores

Un *[vector](http://es.wikipedia.org/wiki/Vector)* de largo `n` es una secuencia (o *array*, o *tupla*) de `n` números. La solemos escribir como x=(x1,...,xn) o x=[x1,...,xn]

En [Python](http://python.org/), un *[vector](http://es.wikipedia.org/wiki/Vector)* puede ser representado con una simple *lista*, o con un *array* de [Numpy](http://www.numpy.org/); siendo preferible utilizar esta última opción.

In [None]:
# Vector como lista de Python


In [None]:
# Vectores con numpy


In [None]:
# Vectores con numpy


In [None]:
# Utilizando la funcion arange de numpy


In [None]:
# Se puede indexar igual que una lista


### Operaciones con vectores

Las operaciones más comunes que utilizamos cuando trabajamos con vectores son la *suma*, la *resta* y la *multiplicación por escalares*.


$$ \begin{split}x + y
=
\left[
\begin{array}{c}
    x_1 \\
    x_2 \\
    \vdots \\
    x_n
\end{array}
\right]
+
\left[
\begin{array}{c}
     y_1 \\
     y_2 \\
    \vdots \\
     y_n
\end{array}
\right]
:=
\left[
\begin{array}{c}
    x_1 + y_1 \\
    x_2 + y_2 \\
    \vdots \\
    x_n + y_n
\end{array}
\right]\end{split}$$

De forma similar funciona la operación de resta.

$$ \begin{split}x - y
=
\left[
\begin{array}{c}
    x_1 \\
    x_2 \\
    \vdots \\
    x_n
\end{array}
\right]
-
\left[
\begin{array}{c}
     y_1 \\
     y_2 \\
    \vdots \\
     y_n
\end{array}
\right]
:=
\left[
\begin{array}{c}
    x_1 - y_1 \\
    x_2 - y_2 \\
    \vdots \\
    x_n - y_n
\end{array}
\right]\end{split}$$


$$\begin{split}\gamma x
:=
\left[
\begin{array}{c}
    \gamma x_1 \\
    \gamma x_2 \\
    \vdots \\
    \gamma x_n
\end{array}
\right]\end{split}$$


In [None]:
# Ejemplo en Python


In [None]:
# sumando dos vectores numpy


In [None]:
# restando dos vectores


In [None]:
# multiplicando por un escalar


#### Producto escalar 

El [producto escalar](https://es.wikipedia.org/wiki/Producto_escalar) de dos vectores se define como la suma de los productos de sus elementos, suele representarse matemáticamente como < x, y > o x'y, donde x e y son dos vectores.

$$< x, y > := \sum_{i=1}^n x_i y_i$$


Todo producto escalar induce una [norma](https://es.wikipedia.org/wiki/Norma_vectorial) sobre el espacio en el que está definido, de la siguiente manera:

$$\| x \| := \sqrt{< x, x>} := \left( \sum_{i=1}^n x_i^2 \right)^{1/2}$$



In [None]:
# Calculando el producto escalar de los vectores x e y


In [None]:
# o lo que es lo mismo, que:


In [None]:
# Calculando la norma del vector X


In [None]:
# otra forma de calcular la norma de x


In [None]:
# vectores ortogonales


### Ejemplo práctico
Vamos a calcular similitudes entre películas. Representaremos a las películas con vectores binarios en función de sus géneros:

$$[Acción,  Aventura , Animación, Comedia, Romance]$$


* Toy Story: Aventura, Animación, Comedia
* Jumanji: Aventura   
* Mortal Kombat: Acción, Aventura  
* Pocahontas: Animación, Romance

La similitud del coseno permite calcular similitudes entre vectores.       


 <img src ="https://goodboychan.github.io/chans_jupyter/images/cos_sim.png" width="300">
 
Vamos a calcular la similitud entre cada par de películas. ¿Cuáles son las más parecidas?

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Ejercicio de distancias</h3>

Implementa una función que reciba dos vectores y calcule la distancia entre ellos.  
Por ejemplo, la distancia entre $[x_1,y_1]$ y $[x_2, y_2]$ se calcula como
         
$$d = \sqrt {\left( {x_1 - x_2 } \right)^2 + \left( {y_1 - y_2 } \right)^2 }$$
         
         
comprueba que obtienes el mismo resultado con el método de numpy
```Python
        dist = np.linalg.norm(a-b)
```
         
NOTA: Los vectores pueden ser de cualquier dimensión
         
Aplica la función para calcular la distancia entre los dos jugadores de la imagen
 </td></tr>
</table>


<img src=./img/distancias2.png align="left" >

## Matrices

Las matrices son una forma clara y sencilla de organizar los datos para su uso en operaciones lineales.

Una matriz `n × k` es una agrupación rectangular de números con n filas y k columnas; se representa de la siguiente forma:

$$\begin{split}A =
\left[
\begin{array}{cccc}
    a_{11} & a_{12} & \cdots & a_{1k} \\
    a_{21} & a_{22} & \cdots & a_{2k} \\
    \vdots & \vdots &  & \vdots \\
    a_{n1} & a_{n2} & \cdots & a_{nk}
\end{array}
\right]\end{split}$$

En la matriz A, el símbolo $a_{nk}$ representa el elemento  n-ésimo de la fila en la k-ésima columna. La matriz A también puede ser llamada un vector si cualquiera de n o k son iguales a 1. En el caso de n=1, A se llama un vector fila, mientras que en el caso de k=1 se denomina un vector columna.


### Operaciones con matrices

Al igual que con los *vectores*, que no son más que un caso particular, las matrices se pueden *sumar*, *restar* y la *multiplicar por escalares*.

Multiplicacion por escalares:
$$\begin{split}\gamma A
\left[
\begin{array}{ccc}
    a_{11} &  \cdots & a_{1k} \\
    \vdots & \vdots  & \vdots \\
    a_{n1} &  \cdots & a_{nk} \\
\end{array}
\right]
:=
\left[
\begin{array}{ccc}
    \gamma a_{11} & \cdots & \gamma a_{1k} \\
    \vdots & \vdots & \vdots \\
    \gamma a_{n1} & \cdots & \gamma a_{nk} \\
\end{array}
\right]\end{split}$$

Suma de matrices: $$\begin{split}A + B =
\left[
\begin{array}{ccc}
    a_{11} & \cdots & a_{1k} \\
    \vdots & \vdots & \vdots \\
    a_{n1} & \cdots & a_{nk} \\
\end{array}
\right]
+
\left[
\begin{array}{ccc}
    b_{11} & \cdots & b_{1k} \\
    \vdots & \vdots & \vdots \\
    b_{n1} & \cdots & b_{nk} \\
\end{array}
\right]
:=
\left[
\begin{array}{ccc}
    a_{11} + b_{11} &  \cdots & a_{1k} + b_{1k} \\
    \vdots & \vdots & \vdots \\
    a_{n1} + b_{n1} &  \cdots & a_{nk} + b_{nk} \\
\end{array}
\right]\end{split}$$

Resta de matrices: $$\begin{split}A - B =
\left[
\begin{array}{ccc}
    a_{11} & \cdots & a_{1k} \\
    \vdots & \vdots & \vdots \\
    a_{n1} & \cdots & a_{nk} \\
\end{array}
\right]-
\left[
\begin{array}{ccc}
    b_{11} & \cdots & b_{1k} \\
    \vdots & \vdots & \vdots \\
    b_{n1} & \cdots & b_{nk} \\
\end{array}
\right]
:=
\left[
\begin{array}{ccc}
    a_{11} - b_{11} &  \cdots & a_{1k} - b_{1k} \\
    \vdots & \vdots & \vdots \\
    a_{n1} - b_{n1} &  \cdots & a_{nk} - b_{nk} \\
\end{array}
\right]\end{split}$$

Para los casos de suma y resta, hay que tener en cuenta que solo se pueden sumar o restar matrices que tengan las mismas dimensiones, es decir que si tengo una matriz A de dimensión 3x2 (3 filas y 2 columnas) solo voy a poder sumar o restar la matriz B si esta también tiene 3 filas y 2 columnas.

In [None]:
# Ejemplo en Python


In [None]:
# suma de las matrices A y B


In [None]:
# resta de matricesA - B

In [None]:
# multiplicando matrices por escalares


In [None]:
# ver la dimension de una matriz


In [None]:
# ver cantidad de elementos de una matriz


In [None]:
# sumar las columnas de la matriz


In [None]:
# sumar las filas de la matriz


In [None]:
# sumar todos los elementos de la matriz


#### Multiplicacion o Producto de matrices

Cuando multiplicamos matrices, el número de columnas de la primera matriz debe ser igual al número de filas de la segunda matriz; y el resultado de esta multiplicación va a tener el mismo número de filas que la primer matriz y el número de la columnas de la segunda matriz. Es decir, que si yo tengo una  matriz A de dimensión 3x4 y la multiplico por una matriz B de dimensión 4x2, el resultado va a ser una matriz C de dimensión 3x2.

Algo a tener en cuenta a la hora de multiplicar matrices es que la propiedad [connmutativa](https://es.wikipedia.org/wiki/Conmutatividad) no se cumple. AxB no es lo mismo que BxA.


In [None]:
# Ejemplo multiplicación de matrices


In [None]:
# Multiplicando A x B


In [None]:
# Multiplicando B x A


Este ultimo ejemplo vemos que la propiedad conmutativa no se cumple, es más, Python nos arroja un error, ya que el número de columnas de B no coincide con el número de filas de A, por lo que ni siquiera se puede realizar la multiplicación de B x A.



#### La matriz identidad,  la matriz inversa y  la matrix transpuesta 

La **matriz identidad** es el elemento neutro en la multiplicación de matrices, es el equivalente al número 1. Cualquier matriz multiplicada por la matriz identidad nos da como resultado la misma matriz. La matriz identidad es una matriz cuadrada (tiene siempre el mismo número de filas que de columnas); y su diagonal principal se compone de todos elementos 1 y el resto de los elementos se completan con 0. Suele representase con la letra I

Por ejemplo la matriz identidad de 3x3 sería la siguiente:

$$I=\begin{bmatrix}1 & 0 & 0 & \\0 & 1 & 0\\ 0 & 0 & 1\end{bmatrix}$$

Ahora que conocemos el concepto de la matriz identidad, podemos llegar al concepto de la **matriz inversa**. Si tenemos una matriz A, la matriz inversa de A, que se representa como $A^{-1}$ es aquella matriz cuadrada que hace que la multiplicación $A$x$A^{-1}$ sea igual a la matriz identidad I. Es decir que es la matriz recíproca de A.

$$A × A^{-1} = A^{-1} × A = I$$

Tener en cuenta que esta matriz inversa en muchos casos puede no existir.En este caso se dice que la matriz es singular o degenerada. 

Por último, la **matriz transpuesta** es aquella en que las filas se transforman en columnas y las columnas en filas. Se representa con el símbolo $A^\intercal$

$$\begin{bmatrix}a & b & \\c & d & \\ e & f & \end{bmatrix}^T:=\begin{bmatrix}a & c & e &\\b & d & f & \end{bmatrix}$$



In [None]:
# Creando una matriz identidad de 2x2


In [None]:
# Multiplicar una matriz por la identidad nos da la misma matriz


In [None]:
# AxI = A

In [None]:
# Calculando la inversa de A.


In [None]:
# A x A_inv nos da como resultado I.


In [None]:
# Trasponiendo una matriz


### Ejemplo Práctico: Detección de bordes en imágenes
¿Sabías que las imágenes se representan digitalmente como una matriz de píxeles?   
![imagen](./img/Imagen.png)

El álgebra lineal se usa en muchas aplicaciones como el reconocimiento de imágenes. 
Por ejemplo, para detectar bordes y otros patrones en imágenes, se aplica una técnica conocida como **convolución**, en la que una pequeña matriz llamada *kernel* recorre la imagen original, aplicando una operación matemática, y produciendo una nueva matriz (una nueva imagen)

<img src='./img/kernel2.gif' width = 500>

![imagen](./img/convolution.png)

Si te fijas, el *kernel* multiplica elemento a elemento en cada posición de la matriz y suma el resultado para producir un nuevo pixel en la imagen resultante. Dependiendo del tipo de *kernel* empleado, se destacarán diferentes aspectos de la imagen original (bordes, relieves, etc.).

En este ejemplo, vamos a utilizar una imagen "fake", con solo 4 pixeles:  

$$\begin{bmatrix}100 & 100\\100 & 100 \end{bmatrix}$$

y el siguiente *kernel* para detectar bordes:

$$\begin{bmatrix}2 & -2 \\ 2 & -2\end{bmatrix}$$

1. Crea la imagen con la matriz correspondiente en la variable `plain_img`

2. Crea el kernel en la variable `kernel` 

3. Implementa una función llamada `apply_kernel`, que reciba como argumentos una imagen y un kernel, aplique la función `multiply()` de numpy y sume todos los elementos de la matriz resultante con la función `sum()` de numpy.
Si la suma es distinta de cero, significará que ha detectado un borde y la función devolverá `True`. En caso contrario devuelve `False`

4. Ejecuta el siguiente código para dibujar la imagen e imprimir por pantalla si se han detectado bordes
```Python
import matplotlib.pyplot as plt 
plt.imshow(plain_img) 
plt.axis('off') 
plt.show() 
if apply_kernel(plain_img,kernel):
    print("Se ha detectado un borde")
else:
    print("No se han detectado bordes")
```

5. Repite el proceso con la imagen 
$$\begin{bmatrix}100 & 0\\100 & 0 \end{bmatrix}$$

Si tienes curiosidad sobre la convolución en imágenes, visita esta página: https://setosa.io/ev/image-kernels/