# Vectores

<img src="./Images/vectores.jpg" alt="Drawing" style="width: 250px;"/>

Imagina que un avión está volando dirección al este a unos __800 km/h__. De repente, una corriente de aire frío a __35 km/h__ proveniente del sur-este golpea al avión. 

<img src="./Images/plane.jpg" alt="Drawing" style="width: 200px;"/>

El efecto del viento sobre el avión vendrá determinado por su __velocidad__ y su __dirección__. Las magnitudes físicas o variables se pueden clasificar en dos grandes grupos:

- __Escalares:__ Son aquellas que quedan definidas exclusivamente por un módulo, es decir, por un número acompañado de una unidad de medida. Es el caso de masa, tiempo, temperatura, distancia. Por ejemplo, 5,5 kg, 2,7 s, 400 °C y 7,8 km, respectivamente.


- __Vectoriales:__ Son aquellas que quedan totalmente definidas con un módulo, una dirección y un sentido. Es el caso de la fuerza, la velocidad, el desplazamiento. En estas magnitudes es necesario especificar hacia dónde se dirigen y, en algunos casos  dónde se encuentran aplicadas. Todas las magnitudes vectoriales se representan gráficamente mediante vectores, que sesimbolizan a través de una flecha.

# 3- Vectores

## 3.1- ¿Qué es un vector?

Se denomina __vector de dimensión__ $n$, a una tupla de números reales (que se llaman componentes del vector). Así, un vector $v$ perteneciente a un espacio ${R}^{n}$ se representa como:

<center>$v = (a_{1}, a_{2}, a_{3}, ... a_{n})$ donde $v \in {R}^{n}$</center>

Un vector también se puede ver desde el punto de vista de la geometría como __vector geométrico__ (usando frecuentemente el espacio tridimensional $R^{3}$ o bidimensional ${R}^{2}$).

## 3.2- Notación de vectores geométricos

Considerando el siguiente vector de $O$ a $A$, contenido en el espacio bidimensional $R^{2}$:

<img src="./Images/vector.jpg" alt="Drawing" style="width: 500px;"/>

La __posición__ del vector puede ser representada como $\overrightarrow{OA}$ o $\vec{v}$. 

El __módulo__ puede ser denotado como: $|\overrightarrow{OA}|$ o $OA$ o $|\vec{v}|$. Está representado por el tamaño del vector, y hace referencia a la intensidad de la magnitud (número).

La __dirección__ corresponde a la inclinación de la recta, y representa al ángulo entre ella y un eje horizontal imaginario.

El __sentido__ está indicado por la punta de la flecha (signo positivo que por lo general no se coloca, o un signo negativo).


## 3.3- ¿Qué podemos representar con un vector?

Considerando que un __vector__ es una tupla de números reales, podemos usarlo para representar:

- __Cadenas binarias:__ La clave secreta de un criptosistema 101101011 puede ser representada como:

<center>$[1, 0, 1, 1, 0, 1, 0, 1, 1]$</center>

- __Palabras:__ Usando ciertos algoritmos (word2vec, glove...), podemos codificar las palabras a vectores únicos que representan dicha palabra.
    
```
king = [ 0.50451 , 0.68607 , -0.59517 , -0.022801, 0.60046 , -0.13498 , -0.08813 , 0.47377 , -0.61798 , -0.31012 ... 0.78321 , -0.91241 , -1.6106 , -0.64426 , -0.51042 ]
```
    
- __Distribuciones de probabilidad:__  La probabilidad de un dado: 

<center>$[1/6, 1/6, 1/6, 1/6, 1/6, 1/6]$</center>

## 3.4- Vectores en Python

Para crear un vector en Python usamos la función `array()` de la biblioteca `numpy`.

### 3.4.1- Suma y resta de Vectores

<img src="./Images/suma_vectores.png" style="width: 300px;"/>

El __vector suma__ está definido por:


<center>$[u_{1}, u_{2}, ..., u_{n}] + [v_{1}, v_{2}, ..., v_{n}] = [u_{1}+v_{1}, u_{2}+v_{2}, ..., u_{n}+v_{n}]$</center>

Para cualesquiera vectores **u**, **v**, **w**, se tiene:
* Propiedad asociativa: $(u+v)+w=u+(v+w)$
* Propiedad conmutativa: $u+v=v+u$

¿Qué sucede si no usamos `np.array`?

Python considera las variables `x` y `y` como listas, por lo que las concatena al usar el operador `+`.

Sin embargo, al usar `np.array` es considerado como `array`

De forma similar para la `resta`:

¿Qué hace internamente numpy cuando sumamos dos arrays?
<a id='ex1'></a>
<div class="alert alert-success">
    <b>Ejercicio:</b> Realizar la suma de estos dos arrays <b>[2, 3, 10]</b> y <b>[10, 20, 30]</b> sin usar numpy. (Usa un bucle para realizarlo).
</div>

In [22]:
x=[2,3,10]
y=[10,20,30]
suma = []

for i in range(len(x)):
    suma.append(x[i] + y[i])

print(suma)


[12, 23, 40]


De una forma más compacta:

<hr style="height: 2px; background-color: #858585;">

¿Qué sucede si introducimos dos `arrays` de distinta longitud?

Podemos imprimir su longitud usando `shape`

<div class="alert alert-block alert-danger">
    <b>⚠️ ATENCIÓN ⚠️</b> Hay una diferencia entre usar `len` y usar `shape`
</div>

Por ejemplo, si definimos el siguiente `array`:

La longitud del array `z_np` es 3 y la longitud de `w_np` es 2

Esto sucede porque `w_np` es una matriz de 2 filas y 3 columnas. Sin embargo, `z_np` es solo un vector de 3 dimensiones.

#### Un segundo...esto es importante!

Al principio puede resultar un poco confuso, pero...¿cómo se representa visualmente un array cuando los creamos de la siguiente forma?

Si creamos un `1D array`

También lo podemos crear de la siguiente forma:

<img src="./Images/array1D.PNG" alt="Drawing" style="width: 200px;"/>

Al crear un `2D array`

Al igual que antes, lo podemos crear usando `arange()`

<img src="./Images/array2D.PNG" alt="Drawing" style="width: 200px;"/>

Por último, si creamos un array con 3 dimensiones, `3D array`

De una forma más concisa:

<img src="./Images/array3D.PNG" alt="Drawing" style="width: 200px;"/>

### 3.4.2- Suma de un escalar a un array

Dado un escalar $a$ y un vector $v$, la suma viene definida por:
<br>
<center>$a + (v_{1}, v_{2}, ... v_{n}) = (a + v_{1}, a + v_{2}, ... a + v_{n})$</center>

`numpy` nos simplifica mucho las cosas, nos permite sumar un escalar a todos los elementos de un `array` realizando simplemente:

Internamente está realizando algo muy parecido a lo realizado en el [ejercicio anterior](#ex1)

### 3.4.3- Multiplicación por escalares: Multiplicar un escalar por un vector

Dado un número $a$ y un vector $v$, la multiplicación viene definida por:
<br>
<center>$a \cdot (v_{1}, v_{2}, ... v_{n}) = (a \cdot v_{1}, a \cdot v_{2}, ... a \cdot v_{n})$</center>


Si no usaramos `numpy`, `python` considera que queremos duplicar una lista `n` veces:

Usando `numpy`:

¿Qué hace internamente numpy cuando multiplicamos un escalar por un array?

<div class="alert alert-success">
    <b>Ejercicio:</b> Realizar la multiplicación de un escalar por un array sin usar numpy. <b>a = 12</b>, <b>v = [3, 5, 6]</b>
</div>

De una forma más compacta y aplicando buenas prácticas:

<hr style="height: 2px; background-color: #858585;">

Dado un vector **v** y dos números cualesquiera $\alpha$, $\beta \in \mathbb{R}$, se tiene:
* *Propiedad asociativa*: $\alpha$($\beta$**v**)=($\alpha$$\beta$)**v**  
* *Propiedad distributiva*: $\alpha$(**u**+**v**)=$\alpha$**u**+ $\alpha$**v**


### 3.4.4- Producto escalar o interior

El producto escalar de dos vectores se define como la suma de los productos de sus elementos. Geométricamente se entiende, como el módulo de uno de ellos por la proyección del otro sobre él.

<img src="Images/producto_escalar.png" style="width: 300px;"/>

Considerando dos vectores $\overrightarrow{u}$ y $\overrightarrow{v}$, el producto escalar viene definido por:<br><br>

<center>$\overrightarrow{u} \cdot \overrightarrow{v} = \sum_{i \in D}\overrightarrow{u}_{i} \cdot \overrightarrow{v}_{i} = u_{1} \cdot v_{1} + u_{2} \cdot v_{2} + ... u_{n} \cdot v_{n}$</center>

También puede escribirse de la siguiente forma - interesante para poder calcular la similitud entre 2 vectores, lo haremos más adelante! 😃:<br><br>
<center>$\overrightarrow{u} \cdot \overrightarrow{v} = |\overrightarrow{u}||\overrightarrow{v}| \cos \theta $</center>

Lo que genera como resultado un **ESCALAR**

Las **propiedades algebraicas del producto escalar**:  
* **Propiedad conmutativa**: **u** · **v** = **v** · **u**  
* **Homogeneidad**: (α u) · v = α (u · v)  
* **Propiedad distributiva**: (v<sub>1</sub> + v<sub>2</sub>) · **x** = v<sub>1</sub> · **x** + v<sub>2</sub> · **x**  

El producto `escalar` puede ser calculado usando el operador `@`:

<div class="alert alert-block alert-danger">
    <b>⚠️ ATENCIÓN ⚠️</b> El operador <b>@</b> es valido para <b>numpy arrays</b>
</div>

¿Qué sucede si introducimos vectores de distinto tamaño? Echándo un vistazo a la ecuación que define el `producto escalar` podemos determinar el comportamiento que tendrá.

$\overrightarrow{u} \cdot \overrightarrow{v}$ = $\sum_{i \in D}$ **u**[i]$\cdot$**v**[i] = u<sub>1</sub> $\cdot$ v<sub>1</sub> + u<sub>2</sub> $\cdot$ v<sub>2</sub> + ... + u<sub>n</sub> $\cdot$ v<sub>n</sub> 

<div class="alert alert-success">
    <b>Ejercicio:</b> Realiza el producto escalar de dos vectores sin usar numpy. <b>u = [1, 3, 5, 7]</b> <b>v = [2, 4, 6, 8]</b>
</div>

De una forma más compacta:

O incluso mejor aún!!

Otra más...¿Por qué no?

<hr style="height: 2px; background-color: #858585;">

#### Norma

Se llama `norma` (módulo o longitud) del vector $v$ (asociada al producto escalar anterior) al número real no negativo. 

<center>$||v|| =+ \sqrt{v \cdot v} = (\sum_{i=1}^{n}x_{i}^2)^\frac{1}{2}$</center>

¿Por qué es interesante esto? Porque en física y geometría interesa conocer la longitud de dicho vector, por ello se difine la `norma`.

Por ejemplo, si definimos la **distancia** entre dos vectores **u** y **v** como la longitud de la diferencia **u - v**, debemos definir la longitud de un vector. En lugar de usar el término "longitud" para vectores, generalmente usamos el término **norma** y viene denotada por $||v||$

<img src="Images/norma.jpg" style="width: 300px;"/>

La norma de un vector cumple las siguientes propiedades:  
* $\|v\|$ es un número real no negativo.  
* $\|v\|$ = 0 $\leftrightarrow$ **v**=0.   
* Para cualquier escalar $\alpha$, $\|\alpha\cdot v\|$ = $| \alpha | \cdot$ $\|v\|$.  
* $\|u+v\|$ ≤ $\|u\|$ + $\|v\|$.  

¿Cómo la calculamos?

<div class="alert alert-success">
    <b>Ejercicio:</b> ¿Se te ocurre otra forma de calcular la norma del vector <b>u</b>?
</div>

Al final, estamos realizando la raíz cuadrada del producto escalar de dicho vector `u` por él mismo `u`.

<hr style="height: 2px; background-color: #858585;">

#### Vectores Ortogonales

Dos vectores son ortogonales o lo que es lo mismo, perpendiculares, cuando su **producto escalar** es nulo.

Por tanto, los vectores $\overrightarrow{v_{1}}$ y $\overrightarrow{v_{2}}$ son ortogonales.

### 3.4.5- Visualización de vectores

Estamos acostumbrados a visualizar los vectores como flechas que parten desde el origen hacia un punto. Pero...¿cómo podemos hacer eso usando Python?

<img src="./Images/interesting.gif" alt="Drawing" style="width: 300px;"/>

Importamos `matplotlib`

Usamos la función `quiver` que nos proporciona `matplotlib` para visualizar vectores. Simplemente debemos definir el punto de inicio de los vectores y su dirección.

<div class="alert alert-success">
    <b>Ejercicio:</b> 
    <p>Un sensor consta de los siguientes componentes:</p>
    <ul>
        <li>CPU</li>
        <li>Radio</li>
        <li>Sensor de temperatura</li>
        <li>Memoria</li>
        <li>LCD</li>
    </ul>
    <p>Este sensor va a ser colocado en un lugar donde no hay acceso a energía eléctrica, por lo que usará paneles solares para alimentarse. Por ello, necesitamos conocer el consumo de energía que consume todos los componentes.</p>
    <p>Suponiendo que conocemos el consumo eléctrico de cada componente</p><br>
    <center><b>consumo = {memoria: 0.06W, radio: 0.06W, sensor: 0.004W, CPU: 0.0025W, LCD: 0.03W}</b></center>
    
Estos datos fueron tomados experimentalmente y anotamos el tiempo que estuvo trabajando cada componente de forma continuada.<br><br>
    <center><b>duracion = {memoria: 1.0s, radio: 0.2s, sensor: 0.05s, CPU: 1.0s, LCD: 1.2s}</b></center><br>

Debemos calcular el total de energía consumida en Julios:
    <center><b>total_energia = consumo.duración</b></center>
</div>

Primero debemos escribir y extraer de ambos diccionarios, `consumo` y `duracion` los respectivos valores:

In [None]:
consumo = {"memoria": "0.06W", 
           "radio": "0.06W", 
           "sensor": "0.004W", 
           "CPU": "0.0025W",
           "LCD": "0.03W"}

duracion = {"memoria": "1.0s", 
           "radio": "0.2s", 
           "sensor": "0.05s", 
           "CPU": "1.0s",
           "LCD": "1.2s"}

Extraemos los valores de ambos diccionarios usando `values()`

Si nos fijamos bien, los elementos de ambas lista son de tipo `string` y debemos operar con valores numéricos, para ello debemos eliminar sus unidades `W` o `s` y convertirlos a variables de tipo `float`.

Podemos simplifcarlo mucho más:

Ahora mismo ya tenemos dos listas que podemos convertir a `array`. Si pensamos bien en este problema, simplemente nos están pidiendo que sumemos el resultado de calcular el **producto del consumo de cada componente por su duración**, es decir, que calculemos el producto escalar entre ambos vectores y eso ya lo sabemos hacer! :)

<hr style="height: 2px; background-color: #858585;">

### 3.4.6- Similitud entre dos vectores ... Importante y guay 😃

Como hemos comentado anteriormente, los vectores pueden ser usados para representar palabras o incluso frases:

```
casa = [ 0.50451 , 0.68607 , -0.59517 , -0.022801, 0.60046 , -0.13498 , -0.08813 , 0.47377 , -0.61798 , -0.31012 ... 0.78321 , -0.91241 , -1.6106 , -0.64426 , -0.51042 ]
```

Y haciendo uso del `producto escalar`, podemos calcular la similitud entre dos vectores. Por ejemplo, si convertimos nuestras palabras `casa` y `casita` en vectores (usando un determinado algoritmo) y calculamos el `producto escalar`de ambos vectores, el resultado debe ser que dichos vectores son muy similares.

En otros módulos veréis esto en profundidad, aquí lo vamos a analizar desde el punto de vista de la algebra lineal para entender como funciona.

Partiendo de:

<center>$\overrightarrow{u} \cdot \overrightarrow{v} = |\overrightarrow{u}||\overrightarrow{v}| \cos \theta $</center>

Podemos derivar que la ecuación de similaridad viene definida por:<br><br>

<center>$\cos \theta = \frac{\overrightarrow{u} \cdot \overrightarrow{v}}{|\overrightarrow{u}||\overrightarrow{v}|}$</center>

Considerando los siguientes vectores:

La similitud viene definida por el `producto escalar` $\overrightarrow{u} \cdot \overrightarrow{v}$ entre el `producto del modulo` de ambos vectores $|\overrightarrow{u}||\overrightarrow{v}|$

Al ser el vector `u` igual al vector `v` el calculo de la similaridad nos debe decir que son iguales.

¿Qué sucede si un vector es completamente distinto, es decir va en la dirección opuesta?

Son totalmente opuestos

#### Similaridad entre dos frases - Cosine Similarity

Vamos a intentar calcular la similitud entre dos frases usando el producto escalar.

Primero debemos convertir ambas frases a un vector, para ello vamos a hacer uso de la librería `nltk` - típica librería para un data science!😃 y que la conoceréis en profundidad en los siguientes módulos:

In [None]:
sent_1 ="Me encantan los perros"
sent_2 ="Tengo 5 perros porque me encantan"

Como vimos en el módulo pasado, vamos a crear un conjunto único de palabras, para ello usamos `set`

Ahora vamos a crear un vector en base a si la frase contine una palabra del conjunto o no, por ejemplo:

`sent = hola tengo miedo`
`conjunto = {'hola', 'miedo'}`

Por tanto, el vector quedará definido por:

`res = [1, 0, 1]`

Porque tanto `hola` como `miedo` están en el conjunto

Ahora simplemente convertimos ambas listas a `np.array` y calculamos la similaridad con la ecuación anterior.

Por tanto, ambas frases son muy parecidas entre ellas. Esto tiene un problema y es que no consideramos el significado de las frases, por ejemplo, `Tengo miedo` y `No tengo miedo` son frases que resultarán muy parecidas pero significan todo lo contrario.

<div class="alert alert-success">
    <b>Ejercicio:</b> Calcula la similaridad entre las siguientes frases:
    <ul>
            <li><b>Tengo miedo</b></li>
            <li><b>No tengo miedo</b></li>
     <ul>
</div>

Creamos los conjuntos de ambas frases y los unimos

Construimos los vectores para ambas frases

Por último, calculamos la similitud:

Como vemos, son frases muy parecidas, pero realmente significan totalmente lo contrario. Normalmente se suele denominar `cosine similarity` al calcular la similaridad entre dos vectores/frases usando este método.

Hay formas, que veréis en los siguientes módulos de NLP y Deep Learning, para tener en cuenta el contexto que engloba a la palabra y así determinar una similitud más precisa.

### 3.4.7- Producto vectorial

El **producto vectorial** de dos vectores **u** y **v**, a diferencia del producto interno, el cual produce un escalar, tiene como resultado un **vector**. Una de las características de dicho vector es que resulta ser perpendicular al plano generado por los vectores **u** y **v**.
Si ambos vectores son no nulos, la única forma de que **el vector resultante sea nulo** es que tanto **u** como **v** no formen un plano y que por lo tanto sean colineales.

La biblioteca `numpy` cuenta con una función que permite obtener el producto vectorial de manera sencilla. La función `cross(u, v)` devuelve un array con el producto vectorial.

Además, el **módulo del producto vectorial** es igual al área del paralelogramos de lado asociado a ambos vectores.

<img src="Images/producto_vectorial.png" style="width: 300px;"/> 


<center>$|a\times b| = |a| \cdot |b|\cdot sen(a, b)$</center>

En este módulo veremos como se calcula el producto vectorial usando `numpy`. Más adelante veremos en profundidad como numpy lo calcula internamente, ya que hace falta tener conocimientos de determinantes que veremos en detalle en otro módulo.

Definiendo los vectores **u** y **v**

El `producto vectorial` viene definido por:

Cuyo resultante es un vector perpendicular a **u** y **v**, además el módulo del **vector C** es el área del paralelogramos de lado asociado a ambos vectores.

Como hemos mencionado antes, el **producto vectorial** de dos vectores **colineales** es nulo:

El resultado es 0 ya que el segundo vector se obtiene del primero multiplicandolo por -4 y por tanto ambos vectores son colineales.

## 3.5- Numpy Arrays Attributes

Manipular datos en Python es sinónimo de usar `Numpy`, incluso `Pandas` está construido sobre `Numpy`. En este apartado vamos a ver algunos ejemplos de como realizar operaciones como **split**, **reshape** y **join** usando `numpy`. La mayor parte de las operaciones realizadas sobre nuestros datos, se pueden englobar en los siguientes bloques:

* **Attributes of arrays:** `size`, `shape`, `memory consumption` y `data types`
* **Indexing:** Obtener y modificar valores individuales del `array`
* **Slicing:** Obtener subconjuntos que pertenecen a un `array`.
* **Reshaping:** Modificar la forma del `array`
* **Joining and splitting:** Combinar varios `arrays` en uno, o dividir uno en varios.

#### Attributes of arrays

Cada `array` tiene varios atributos:

* `ndim`: El número de dimensiones
* `shape`: El tamaño de cada dimensión
* `size`: El tamaño total del array

Podemos mostrar también el tipo de variables que contiene, usando `ndim`.

O el tamaño en bytes que ocupa dicho `array`

Si os fijáis, el vector `x3` tiene `60 elementos` en total y cada elemento ocupa `4 bytes`. El total de bytes que ocupa dicho array viene dado por: `60 x 4 = 240`

#### Indexing

Es similar a lo que aprendimos en el módulo anterior con el `indexing` para listas en Python. 

<div class="alert alert-block alert-danger">
    <b>⚠️ ATENCIÓN ⚠️</b> Los elementos empiezan en <b>index=0</b>
</div>

Podemos acceder al último elemento usando `-1`

O incluso acceder a elementos desde el final del array usando:

En caso de `arrays` con más de una dimensión

#### Slicing

Podemos extraer `subconjuntos` perteneciente a un `array` usando:

`x[start:stop:step]`

Si alguno de ellos no los definimos, los valores por defecto son: `start=0`, `stop=size of dimension`, `step=1`

Para `arrays` con más de una dimensión

Podemos crear copias de los `arrays` usando:

E incluso modificar sus elementos:

#### Reshaping

Otra de las herramientas más usadas es `reshape`. Por ejemplo si queremos transformar:

<center>$x = [1, 2, 3, 4, 5, 6, 7, 8, 9]$</center>

A una matriz:

<center>$x = \begin{bmatrix}
    1 & 2 & 3\\
    4 & 5 & 6\\
    7 & 8 & 9
\end{bmatrix}
$</center>

#### Joining and Splitting

Para `arrays` con distinta dimensiones, se suele usar `vstack` (vertical stack) o `hstack` (horizontal).

Podemos dividir los `arrays` usando `split`, `hsplit` o `vsplit`: