# Espacio Vectoriales

Una vez que ya hemos hablado de vectores podemos tratar los __espacios vectoriales__. Los espacios vectoriales son probablemente las estructuras matemáticas más comunes que podemos encontrar. Todos los fenómenos calificados como *"lineales"* en multitud de contextos están vinculados de algún modo a un espacio vectorial, lo que da una idea de su importancia. 

## 4.1- La Estructura del Espacio Vectorial

Un __espacio vectorial__ es un conjunto no vacío $V$ de objetos, llamados __vectores__, en el que se han definido dos operaciones: la __suma__ y el __producto por un escalar__ (número real) sujetas a diez axiomas aquí [definidos](https://es.wikipedia.org/wiki/Espacio_vectorial#Definición_de_espacio_vectorial)

y con las siguientes propiedades: 

Para la __suma__:
+ Propiedad asociativa: 
<center>$u + (v+w) = (u+v) + w \;\;\;\; \forall u, v, w \in V$</center>

+ Propiedad conmutativa: 
<center>$u + v = v + u \;\;\;\; \forall u, v \in V$</center>

+ Existencia del elemento neutro:
<center>Existe $u \in V$ tal que $u + 0 = 0 + u = u \;\;\;\; \forall u \in V  $</center>

+ Existencia del elemento opuesto:
<center>Existe $u \in V$ tal que $u + (-u) = 0 \;\;\;\; \forall u \in V  $</center>

Para el __producto por un escalar__:
+ Propiedad asociativa:
<center>$\alpha \cdot (\beta \cdot u) = (\alpha\beta) \cdot u$</center>
    
+ Existencia del elemento neutro:
<center>$1 \cdot u = u \;\;\;\; \forall u \in V$</center>

+ Propiedad distributiva del producto respecto la suma de vectores:
<center>$\lambda \cdot (u+v) = \lambda \cdot u + \lambda \cdot v \;\;\;\; \forall u,v \in V \;\;\; and \;\;\; \forall \lambda \in K$</center>

+ Propiedad distributiva del producto respecto la suma de escalares: 
<center>$(\lambda + \mu) \cdot u = \lambda \cdot v + \mu \cdot u \;\;\;\; \forall u \in V \;\;\; and \;\;\; \forall\lambda,\mu \in K$</center>

## 4.2- Combinaciones lineales

Dados los vectores $v_1, v_2, ... , v_j$ en $\mathbb{V}$ y los escalares $c_1, c_2, ... , c_j$ en $\mathbb{K}$, el vector $y$ definido por:<br><br>

<center>$y = c_1 v_1 + ··· + c_j v_j$</center>

se llama **combinación lineal**. 

Una __combinación lineal__ no es más que una expresión matemática construida sobre un conjunto de vectores, en el que cada vector es multiplicado por un escalar y los resultados son luego sumados. Matemáticamente lo podemos expresar de la siguiente forma:<br><br>

<center>$w = \alpha_1v_1 + \alpha_2v_2 + ... \alpha_nv_n = {\displaystyle \sum _{\begin{smallmatrix}\alpha \in A\\v\in V\end{smallmatrix}}\alpha b.}$</center>

En una combinación lineal, los coeficientes pueden ser cualesquiera números reales, incluso el cero.

<div class="alert alert-success">
    <b>Ejercicio:</b> Dados los vectores <b>$\vec{x} = (1, 2)$</b> y <b>$\vec{y} = (1, -1)$</b>, hallar el vector combinación lineal <b>$\vec{z} = 2\vec{x} + 3\vec{y}$</b>
</div>

### Visualización

Vamos a tratar de visualizar que está sucediendo cuando estamos realizando calculando un vector que es combinación lineal de otros dos. En este caso vamos a usar los vectores del ejemplo anterior.

<center>$\vec{x} = (1, 2)$</b> y <b>$\vec{y} = (1, -1)$</center><br>
<center>$\vec{z} = 2\vec{x} + 3\vec{y}$</center>

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np
import scipy.sparse as sp
import scipy.sparse.linalg
import scipy.linalg as la
import sympy

# imprimir con notación matemática.
sympy.init_printing(use_latex='mathjax')

Funciones para visualizar los vectores

In [None]:
def move_spines():
    """Crea la figura de pyplot y los ejes. Mueve las lineas de la izquierda 
    y de abajo para que se intersecten con el origen. Elimina las lineas de
    la derecha y la de arriba. Devuelve los ejes."""
    fix, ax = plt.subplots()
    for spine in ["left", "bottom"]:
        ax.spines[spine].set_position("zero")
    
    for spine in ["right", "top"]:
        ax.spines[spine].set_color("none")
    
    return ax

def vect_fig(vector, color): 
    """Genera el grafico de los vectores en el plano"""
    v = vector
    ax.annotate(" ", xy=v, xytext=[0, 0], color=color,
                arrowprops=dict(facecolor=color,
                                shrink=0,
                                alpha=0.7,
                                width=0.5))
    ax.text(1.1 * v[0], 1.1 * v[1], v)

Para el ejercicio anterior:

Ahora, en vez de sumar las componentes directamente vamos a guardar en la variable __z1__ y __z2__ los resultados

Graficamos las componentes del resultado anterior

In [None]:
ax = move_spines()
ax.set_xlim(-5, 5)
ax.set_ylim(-5, 5)
ax.grid()

vecs = [z1, z2] # lista de vectores
for v in vecs:
    vect_fig(v, "blue")
    
# Dibujamos el vector resultante
v = z1 + z2
vect_fig(v, "red")

ax.plot([z1[0], v[0]], [z1[1], v[1]], linestyle='--')
ax.plot([z2[0], v[0]], [z2[1], v[1]], linestyle='--' )

Que los vectores no estén centrados es por la función `spines` de matplotlib, hay que adjustar la escala y los límites de los axis para poder visualizarlo correctamente. Para el propósito de visualizar la __combinación lineal__ no es relevante.

## 4.3- Dependencia lineal de vectores

Dado un conjunto finito de vectores $x_1, x_2, ..., x_n$ se dice que los mismos son linealmente independientes, si y solo si, los únicos escalares $α_1, α_2,..., α_n$ que satisfacen la ecuación:

<center>$0 = \alpha_1 x_1 + ··· + \alpha_n x_n$</center>

son todos ceros, $α_1 = α_2 =... = α_n = 0$.

En caso de que no se cumpla, es decir, existe una solución a la ecuación anterior en la que no todos los escalares son ceros, a esta solución se llama no trivial y se dice que los vectores son __linealmente dependientes.__

<div class="alert alert-success">
    <b>Ejercicio:</b> Entonces, teniendo en cuenta lo anterior, supongamos que queremos determinar si los siguientes vectores son linealmente independientes</b>
    <p><center>$x_1 = [1.2, 1.1]$</center></p>
    <p><center>$x_2 = [-2.2, 1.4]$</center></p>
</div>

Para calcular si son linealmente independientes, debemos resolver el siguiente sistema de ecuaciones y verificar si la única solución es aquella en que los escalares sean ceros.<br><br>

<center>$\alpha_1[1.2, 1.1] + \alpha_2 [-2.2, 1.4] = 0$</center>

Vamos a ver dos formas de resolverlo.

#### Opción 1

Usando la librería `sympy`

#### Opción 2

Usando la función `solve` de `numpy`

Como podemos ver por la solución numérica, estos vectores son linealmente independientes, ya que __la única solución a dicha ecuación, es aquella en que los escalares son cero.__

<div class="alert alert-success">
    <b>Ejercicio:</b> Determinemos ahora si por ejemplo, los siguientes vectores son linealmente independientes</b>
    <p><center>$x_1 = [3, 2, 2, 3]$</center></p>
    <p><center>$x_2 = [3, 2, 1, 2]$</center></p>
    <p><center>$x_3 = [3, 2, 0, 1]$</center></p>
</div>

La ecuación a resolver viene definida por: 
<center>$\alpha_1[3, 2, 2, 3] + \alpha_2 [3, 2, 1, 2] + \alpha_3 [3, 2, 0, 1] = 0$</center>

Como vemos, esta solución es no trivial, ya que por ejemplo existe la solución $\alpha_1=1$, $\alpha_2=−2$, $\alpha_3=1$ en la que los escalares no son ceros. __Por lo tanto este sistema es linealmente dependiente.__

### 4.6- Espacios Vectoriales en Machine Learning

Los espacios vectoriales se usan constantemente en Machine Learning, por ejemplo: __Word embeddings__. En ese caso estaríamos mapeando las palabras a vectores en un espacio vectorial/embedding space.

Hay que mencionar que no solo se puede mapear palabras/documentos a un espacio vectorial, podemos crear un espacio vectorial de cualquier cosa. 

Por ejemplo, imaginaos que tenemos una tienda de ropa, podríamos mapear los vestidos a un espacio vectorial de dimensiones __n__ y luego recomendarle a un cliente los vestidos más parecidos a los que a él le gusta (usando cosine similarity por ejemplo).

#### ¿A qué nos referimos con un espacio vectorial de dimensiones *n*?

Basicamente son features del modelo que estamos creando. Por ejemplo:

- Personas: edad, peso, altura, color del pelo, color de ojos, ...
- Casas: número de habitaciones, precio de venta, año de construcción, ...
- Coches: velocidad máxima, tiempo de aceleración, precio, ...

El número de dimensiones lo defines tú cuando estás creando el modelo.

<div class="alert alert-success">
    <b>Ejercicio:</b> Modela los siguientes modelos de coche en un espacio vectorial:
    

</div>


| Modelo | Precio | Velocidad Máxima | Tiempo de Aceleración |
| --- | --- | --- | --- |
| Porsche Taycan  | €110000 | 280 km/h | 3.8s |
| Tesla 3  | €90000 | 260 km/h | 3.5s |
| BMW i3  | €60000 | 160 km/h | 7s |

Para modelar estos coches a un espacio vectorial debemos crear los vectores correspondientes a cada uno de ellos. ¿Cómo serán dichos vectores si tenemos en cuenta que nuestro espacio vectorial va a ser de 3 dimensiones (precio, velocidad, aceleración)?<br><br>

<center>$taycan = (110000, 280, 3.8)$</center>
<center>$tesla = (90000, 260, 3.5)$</center>
<center>$i3 = (60000, 160, 7)$</center>

Vamos a graficar estos vectores en nuestro espacio vectorial y ver que sucede.

Definimos un nombre para cada vector para poder visualizarlos

Ya tenemos modelado nuestros coches a un espacio vectorial, en este caso un espacio vectorial de 3 dimensiones. 

#### ¿Qué sucede si tenemos más de 3 dimensiones?

He elegido modelas estos coches a un espacio vectorial de solo 3 dimensiones para poder representarlo graficamente. Normalmente, solemos tener miles de dimensiones/features, en concreto en NLP.

Cuando en el módulo de NLP veáis los __word embeddings__ (si!😄 soy un pesado con esto... pero es una herramienta super potente y que conviene conocer bien) veréis que se trata algunos modelos típicos como __Word2Vec__, __Glove__, __FastText__,... y que se menciona por ejemplo: "vectores de 100 dimensiones" o "vectores de 300 dimensiones". Dichas dimensiones hacen referencia a lo comentado anteriormente, al número de features que han elegido para modelarlos.

#### ¿Podemos medir la similaridad entre nuestros coches? Por supuesto!!!

Para ello, vamos a hacer uso de la librería de `sklearn` que tiene implementado internamente el `cosine similarity` (que nosotros implementamos en el módulo anterior).

Vamos a visualizarlo en una tabla

 Modelos | Taycan | Tesla | i3
------ |------|------|------
Taycan | 1  | 0.746 | -0.962
Tesla | 0.746  | 1 | -0.898
i3 | -0.962  | -0.898 | 1

Podemos ver que los modelos `Taycan` y `Tesla` son más parecidos entre ellos y que poco tienen de similitud el `Taycan` o `Tesla` con el `i3`.