# Autovalores y Autovectores | Eigenvalues, Eigenvectores

Ya vimos anteriormente que un sistema de ecuaciones lineales tiene la siguiente forma:<br><br>

<center>$Ax=B$</center>

¿De dónde proviene los **autovalores** y **autovectores**? Pues provienen de realizarse la siguiente pregunta:

<div class="alert alert-success">
Suponiendo que tenemos una matriz cuadrada $A$ de $nxn$, ¿existe algún vector $x$ distinto de $0$ para el cual $Ax$ es un escalar múltiplo de $x$? Si escribimos esta pregunta en lenguaje matemático, nos encontramos con la definición de los autovalores y autovectores:<br><br>
    
<center>$Ax = \lambda x$</center>
</div>

Cuando esta ecuación es válida y $x$ no es $0$, decimos que $\lambda$ es el **Eigenvalue** o **autovalores** de $A$ Y $x$ es su correspondiente **Eigenvector** o **autovector**. Un ejemplo muy simple es el siguiente:<br><br>

<center>$A\left( {\begin{array}{cc}
   1\\
   1\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   5\\
   5\\
  \end{array} } \right) = 5\left( {\begin{array}{cc}
   1\\
   1\\
  \end{array} } \right)$ </center><br><br>
  
En este caso:

$\lambda = 5$<br>
$x = \left( {\begin{array}{cc}
   1\\
   1\\
  \end{array} } \right)$

Vamos a intentar explicar con un ejemplo gráfico que le sucede a los vectores cuando lo multiplicamos por una matriz $A$. Considera que tenemos la siguiente matriz:<br><br>

<center>$A = \left( {\begin{array}{cc}
   3 & 2\\
   1 & 4\\
  \end{array} } \right)
$</center><br>

Si la multiplicamos por un vector:<br>

<center>$A = \left( {\begin{array}{cc}
   3 & 2\\
   1 & 4\\
  \end{array} } \right)\left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   3x + 2y\\
   x + 4y\\
  \end{array} } \right)
$</center><br>

Para poder ver el efecto que hace dicha operación vamos a considerar un cuadrado y vamos a resolver dicha ecuación para cada vértice del cuadrado, es decir:

In [None]:
import matplotlib.pyplot as plt

plt.axes()
rectangle = plt.Rectangle((0,0), 1, 1)
plt.gca().add_patch(rectangle)
plt.xlim(-0.25, 1.25)
plt.ylim(-0.25, 1.25)
plt.grid()
plt.show()

Los vértices del cuadrado son:

<center>$v_1 = \left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   0\\
   0\\
  \end{array} } \right)
$</center><br>
<center>$v_2 = \left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   0\\
   1\\
  \end{array} } \right)
$</center><br>
<center>$v_3 = \left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   1\\
   1\\
  \end{array} } \right)
$</center><br>
<center>$v_4 = \left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   1\\
   0\\
  \end{array} } \right)
$</center><br>

Si evaluamos la ecuación anterior en dichos puntos, obtenemos:<br><br>

En resumen, hemos hecho estas operaciones:

<center>$A(v_1) = \left( {\begin{array}{cc}
   3 & 2\\
   1 & 4\\
  \end{array} } \right)\left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   3x + 2y\\
   x + 4y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   0\\
   0\\
  \end{array} } \right)
$</center><br>
<center>$A(v_2) = \left( {\begin{array}{cc}
   3 & 2\\
   1 & 4\\
  \end{array} } \right)\left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   0 + 2\\
   0 + 4\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   2\\
   4\\
  \end{array} } \right)
$</center><br>
<center>$A(v_3) = \left( {\begin{array}{cc}
   3 & 2\\
   1 & 4\\
  \end{array} } \right)\left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   3 + 2\\
   1 + 4\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   5\\
   5\\
  \end{array} } \right)
$</center><br>
<center>$A(v_4) = \left( {\begin{array}{cc}
   3 & 2\\
   1 & 4\\
  \end{array} } \right)\left( {\begin{array}{cc}
   x\\
   y\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   3 + 0\\
   1 + 0\\
  \end{array} } \right) = \left( {\begin{array}{cc}
   3\\
   1\\
  \end{array} } \right)
$</center><br>

Podemos graficarlo:

In [None]:
from matplotlib.patches import Polygon

pts = np.array([A_v1, A_v2, A_v3, A_v4])
p = Polygon(pts, closed=False)
ax = plt.gca()
ax.add_patch(p)
ax.set_xlim(-0.25, 5.25)
ax.set_ylim(-0.25, 5.25)
ax.grid()
plt.show()

Si recordamos bien, una de las componentes de los vectores (cuando pensamos en ellos geométricamente) es la `dirección`. **¿Se mantiene aquí la dirección de los vectores?**... Vamos a verlo...😄

- El punto `v2` ha pasado de $(0, 1)$ a $(2, 4)$
- El punto `v4` ha pasado de $(1, 0)$ a $(3, 1)$
- El punto `v3` ha pasado de $(1, 1)$ a $(5, 5)$

Vemos como el punto `v3` es el único que ha mantenido su dirección, y de hecho se ha dilatado por 5. Este vector que ha mantenido su dirección se denomina **autovector** y el factor de dilatación es el **autovalor** correspondiente.

<div class="alert alert-success">
Suponiendo que tenemos una matriz cuadrada $A$ de $nxn$, ¿existe algún vector $x$ distinto de $0$ para el cual $Ax$ es un escalar múltiplo de $x$? Si escribimos esta pregunta en lenguaje matemático, nos encontramos con la definición de los autovalores y autovectores:<br><br>
    
<center>$Ax = \lambda x$</center>
</div>

Podemos desarrollarla un poco:

<center>$Ax = \lambda x$</center>

Moviendo un miembro al otro lado:

<center>$Ax - \lambda x = 0$</center>

Multiplicando por $I$:
<center>$(A - \lambda I)x= 0$</center>

Al término $(A - \lambda I)$ se denomina **matriz de coeficientes**. Queremos obtener los resultados para cuando esta ecuación sea distinto de cero:<br><br>

<center>$(A - \lambda I)x= 0$</center>

Un escalar $\lambda$ es un valor propio de una matriz $A$ de $(nxn)$ si, y sólo si, $\lambda$ satisface la ecuación característica:<br><br>

<center>$det(A - \lambda I) = 0$</center>

<div class="alert alert-success">
Considera la siguiente matriz<br><br>
    
<center>$A = \left( {\begin{array}{cc}
   3 & 2\\
   7 & -2\\
  \end{array} } \right)
$</center><br>
</div>

Podemos encontrar los autovalores de la siguiente forma:

O usando `sympy`:

## 9.1-  Eigenvalues y Eigenvectors en ML

El cálculo de autovectores y autovalores tiene muchísimas aplicaciones, como puede ser el cálculo de componentes principales en Machine Learning.

Veamos un ejemplo sencillo:  es la de obtener los ejes principales de una matriz de dispersión (o de covarianza) de un conjunto de muestras. En otras palabras, ver en qué direcciones tienden a estar alineados un montón de puntos.

Un ejemplo en dos dimensiones: si calculamos la matriz de covarianza de los puntos de la figura, sus dos autovectores nos indican las direcciones marcadas por flechas, cuya longitud está dada por los autovalores. Y el autovector del mayor autovalor nos dice la dirección principal en la que se alinean los puntos.  

<img src="Images/PCA.png" width=40%/>

## 9.2-  Singular Value Decomposition - SVD

Dada una matrix $X$ con tamaño $(m,n)$, puede ser expresada como:

<img src="Images/svd.png" width=30%/>

Donde:

- r es el rango de la matrix X
- U es una matriz $(m ,r)$ y orthornormal
- V es una matriz $(n, r)$ y orthonormal
- $\Sigma$ es una matriz diagonal de $(r, r)$ - cuyos valores se llaman _singular values_

1- Podemos usar `SVD` de una forma cualitativa, es decir, que nos sirve para extraer información de nuestros datos.
2- O de una forma cuantitativa, que nos permite reducir la dimensionalidad de nuestra matrix $X$ y seguir manteniendo la información importante.

<img src="Images/svd_movies.png" width=60%/>

Donde:

- $U$ es una matriz que relaciona: user-concept
- $V$ es una matriz que relaciona: movie-concept
- $\Sigma$: importancia de cada concepto

Usando Python:

In [None]:
import numpy as np

#user vs movie, a 7x5 matrix
A = np.array([[1, 1, 1, 0, 0],\
              [3, 3, 3, 0, 0],\
              [4, 4, 4, 0, 0],\
              [5, 5, 5, 0, 0],\
              [0, 2, 0, 4, 4],\
              [0, 0, 0, 5, 5],\
              [0, 1, 0, 2, 2]])

Otra utilidad que nos proporciona este tipo de descomposiciones, es que podemos aplicar una reducción de dimensionalidad a la matriz original y mantener la información relevante.

Para entender este concepto, vamos a usar esta página web: http://timbaumann.info/svd-image-compression-demo/

Ahora vamos a hacerlo en Python: