<a href="https://colab.research.google.com/github/SHU415/CV/blob/master/Distancias.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 8. Distancia y Norma

En clases pasadas hablamos de la magnitud de un vector pero no dimos una forma de poder medirla, esa magnitud la podremos calcular a través de la *norma Euclidiana*:

$$
||x|| = \displaystyle\sqrt{x_{0}^2 + x_{1}^2 + \cdots + x_{n-1}^{2}} = \displaystyle\sqrt(x^Tx)
$$

Hay que notar que $x$ en la expresión anterior es un $n$-vector. 
Pongamos un ejemplo con $x^T = [1,2,3]$

$$
||x|| = \displaystyle\sqrt{1^2 + 2^2 + 3^2} = \sqrt{14} \approx 3.74
$$

Realizaremos otro con $x^T = [2,-1,2]$

$$
||x|| = \displaystyle\sqrt{2^2 + (-1)^2 + 2^2} = \sqrt{9} = 3
$$

## 8.1 Propieades de la norma

Como todas las operaciones con las que trabajamos hasta ahora la norma también cumple una serie de propiedades. Sean $x$, $y$ son $n$-vectores y $\beta$ un escalar cualquiera, tenemos que la norma cumple:
* Homogeneídad no negativa: $||\beta x|| = |\beta|\cdot ||x||$

* Desigualdad del triángulo: $||x+y|| \le ||x|| + ||y||$ 

* No-negatividad: $||x||\ge 0$ y además $||x|| = 0$ si y solamente si $x = \mathbf{0}$

La norma es ampliamente usada, en particular podemos señalar los siguientes ejemplos:

**Valor cuadrático medio.** Algunas veces también es llamado simplemente **RMS** y se define como sigue:

$$
rms(x) = \displaystyle\sqrt{\frac{x_{0}^2 + x_{1}^2 + \cdots + x_{n-1}^{2}}{n}} = \frac{||x||}{\sqrt{n}}
$$

**Norma de una suma.** Si tenemos dos vectores $x$ y $y$ entonces la norma de la suma es

$$
||x+y|| = \displaystyle\sqrt{||x||^{2} + 2x^{T}y + ||y||^{2}}
$$

**Norma de una bloque de vectores.** La norma de bloque de vectores será simplemente la raíz cuadrada de la suma de sus componentes. Si tenemos $d$ un $k$-vector con componentes $d_{i}$ que son $n$-vectores entonces tenemos que:

$$
||d|| = \displaystyle\sqrt{||d_{0}||^{2}+||d_{1}||^{2}+\cdots + ||d_{n-1}||^{2}}
$$

In [None]:
import numpy as np

In [None]:
u = np.array([1,1])

In [None]:
def norma(x):
    return np.sqrt(x@x)

In [None]:
norma(u)

1.4142135623730951

$2*u^T = [2,2]$ entonces la norma será $||2u|| = \displaystyle\sqrt{2^2 + 2^2} = \displaystyle\sqrt{8}$

In [None]:
norma(2*u)

2.8284271247461903

In [None]:
2*norma(u)

2.8284271247461903

In [None]:
v = np.array([-1,1])

In [None]:
print('||u+v|| = ',norma(u+v))

||u+v|| =  2.0


In [None]:
print('||v|| = ',norma(v))

||v|| =  1.4142135623730951


In [None]:
print('¿Es verdad que ||u+v|| menor o igual que ||u||+||v||', norma(u+v) <= norma(v)+norma(u))

¿Es verdad que ||u+v|| menor o igual que ||u||+||v|| True


## 8.1 Distancia entre vectores

Podemos usar la norma pora definir la distancia entre dos vectores $\mathbf{a}$ y $\mathbf{b}$ como la norma de la diferencia de los vectores

$$
dist(\mathbf{a},\mathbf{b}) = ||\mathbf{a} - \mathbf{b}|| = \displaystyle\sqrt{(a_{0}-b_{0})^2 + (a_{1}-b_{1})^2 + \cdots + (a_{n-1}-b_{n-1})^2}
$$

In [None]:
a = np.array([1,1])
b = np.array([-2,3])

In [None]:
c = a - b

In [None]:
norma(a-b)

3.605551275463989

In [None]:
np.linalg.norm(a-b)

3.605551275463989

A esto se el llama _norma Euclidiana_ o *distancia Euclidiana* y tiene ese nombre porque es como se infiere la forma de medir distancias de los [postulados de Euclides](https://es.wikipedia.org/wiki/Postulados_de_Euclides). Ahora, la realidad es que siempre que nuestro espacio admita una $\mathbf{L^p}$-norma entonces podremos generalizar la norma anterior como

$$
||x||_{p} = \left(|x_{0}|^p + |x_{1}|^p + \cdots + |x_{n-1}|^p\right)^{1/p} \qquad con \;\; 1\le p
$$

Por eso es que la norma Euclidiana también es conocida como la *norma $L_{2}$*. Hay otras normas que recibe nombres. Por ejemplo, si $p=1$ tenemos la norma $L_{1}$ y esta es llamada _la métrica del taxista_ o _la métrica de Manhattan_. Si tomamos $p \to \infty$ entonces tenemos $L_{\infty}$ y esta es llamada _la métrica del máximo_. Es muy importante saber qué métrica estamos usando para medir distancias ya que la forma en la que medimos distancias está en total correspondencia en con configuración y la percepción el espacio. Por ejemplo, mientras que en la métrica Euclidiana la distancia corresponde a la más corta entre los dos vectores en el espacio planeo en el caso de la métrica del taxista es la más corta pero no será es segmento más directo sino por _bloques_.

Para poder simplificar las cosas tomemos dos vectores $\mathbf{x}$ y $\mathbf{y}$ en $\mathbb{R}^2$

$$
\mathbf{x} = \begin{bmatrix} 2\\1 \end{bmatrix},\; \qquad \mathbf{y} = \begin{bmatrix} 1\\2 \end{bmatrix}
$$

La distancia en el caso de norma $L_{2}$ tenemos que la distancia entre los vectores es $||\mathbf{x}-\mathbf{y}||_{2} = \displaystyle\sqrt{(2-1)^{2} + (1-2)^{2}} = \displaystyle\sqrt{2}$ mientras que bajo la norma $L_{1}$ obtenemos que $||\mathbf{x}-\mathbf{y}||_{1} = |2-1|+|1-2| = 2$. 

Ahora, si $\mathbf{x}$ y $\mathbf{y}$ son $n$-vectores hay una medida quer después cobrará importancia, *la desviación cuadrática media*

$$
rms_{dev}(\mathbf{x},\mathbf{y}) = \displaystyle\frac{||\mathbf{x}-\mathbf{y}||}{\sqrt{n}}
$$

Algo muy imporante es que a pesar de que medimos distancias no existen propiamente nociones de *cerca* y *lejos*. Si tomamos los siguientes $4$-vectores

$$
\mathbf{u} = \begin{bmatrix}1.8 \\ 2.8 \\ -3.7 \\ 4.7 \end{bmatrix}, \qquad  \mathbf{v} = \begin{bmatrix}0.6 \\ 2.1 \\ 1.9 \\ -1.4 \end{bmatrix}, \qquad \mathbf{w} = \begin{bmatrix}2.0 \\ 1.9 \\ -4.0 \\ 4.6 \end{bmatrix}
$$

Tenemos que las distancia entre los vectores es:

$$
||\mathbf{u}-\mathbf{v}|| = 8.36, \qquad ||\mathbf{u}-\mathbf{w}|| = 0.38, \qquad ||\mathbf{v}-\mathbf{w}|| = 8.63
$$

Entonces así ya tenemos noción de cercanía o lontanaza, de no ser porque comparamos no tendríamos estas nociones. 

**Desigualdad del triángulo.** Debido a que la distancia la definimos a partir de la norma entonces la distancia también está sujeta a cumplir la desigualdad del triángulo. Considemos entonces tres $n$-vectores $\mathbf{a}$,$\mathbf{b}$ y $\mathbf{c}$ entonces tenemos

$$
||\mathbf{a}-\mathbf{c}|| = ||\mathbf{a}-\mathbf{b}+\mathbf{b}-\mathbf{c}|| \le ||\mathbf{a}-\mathbf{b}|| + ||\mathbf{b}-\mathbf{c}||
$$

Vamos a partir de los siguientes $2$-vectores:
$$
\mathbf{a} = \begin{bmatrix} 1\\ 1 \end{bmatrix}, \qquad \mathbf{b} = \begin{bmatrix} 2\\ 3 \end{bmatrix}, \qquad \mathbf{c} = \begin{bmatrix} 4\\ 2 \end{bmatrix}
$$

## 8.3 Una aplicación

**Visita óptima de apartamentos para arrendar.** Supongamos que estamos en búsqueda de alquilar un apartamento. Comenzamos buscando caracacterísticas como cantidad de recámaras, cantidad de baños, estacionamientos, zona y tamaño. Un problema es que algunas veces llegamos a colectar una gran cantidad de anuncios y contactos y organizarnos para ir a las visitas puede parecer prácticamte imposible y puede que dejemos escapar una gran oportunidad. Afortunadamente en este curso vamos a proponer una solución: vamos a partir de nuestro departamento ideal y vamos a representarlo como un vector de caracteristicas, construimos el mismo vector para los apartamentos que ya tengamos localizados y calculamos la distancia entre estos vectores y el vector que representa al departamento ideal. Los ordenamos por de manera ascendente y ya tendríamos una lista ordenada en prioridad de contacto y visita de apartamentos según nuestro apartamento ideal. 

Para esto, supongamos que las características que queremos tomar en cuenta son tamaño del apartamento, número de recámaras, número de baños y número de estacionamientos. Notemos que en el caso de tamaño del apartamento regularmente se nos da en metros cuadrados (área) pero el gran problema es que puede variar mucho y usar estos números *tan grandes* puede introducir una gran cantidad de ruido. Para resolver el problema anterior vamos a catalogar los tamaños de apartametos en categorias:
1. Si el área es menor que 60 metros cuadrados
2. Si el área es mayor o igual que 60 metros cuadrados pero menor que 80 metros cuadrados
3. Si el área es mayor o igual que 80 metros cuadrados pero menor que 110 metros cuadrados
4. Si el área es mayor o igual que 110 metros cuadrados pero menor que 130 metros cuadrados
5. Si el área es mayor o igual que 130 metros cuadrados. 

Supongamos también que el orden de las características en el vector es categoria de tamaño, número de recámaras, número de baños y número estacionamientos. Nuestro apartamento ideal viene dado por el siguiente vector:

$$
\mathbf{I} = \begin{bmatrix} 3\\ 2\\ 2\\1 \end{bmatrix}
$$

Y nostros encontramos los siguientes apartamentos:

$$
\mathbf{A_{1}} = \begin{bmatrix}4 \\3 \\ 3\\3 \end{bmatrix}, \qquad \mathbf{A_{2}} = \begin{bmatrix}3 \\3 \\ 1\\0 \end{bmatrix}, \qquad \mathbf{A_{3}} = \begin{bmatrix}5 \\4 \\ 3\\0 \end{bmatrix}
$$

In [None]:
I = np.array([3,2,2,1])
A_1 = np.array([4,3,3,3])
A_2 = np.array([3,3,2,1])
A_3 = np.array([5,4,3,0])

In [None]:
print('||I-A_1|| =',np.linalg.norm(I-A_1))
print('||I-A_2|| =',np.linalg.norm(I-A_2))
print('||I-A_3|| =',np.linalg.norm(I-A_3))

||I-A_1|| = 2.6457513110645907
||I-A_2|| = 1.0
||I-A_3|| = 3.1622776601683795


Este problema es el problema de encontrar el vector más cercano. Básicamte si tenemos una colección de N $n$-vectores $z_{0},z_{1},\dots,z_{N-1}$ vamos a decir que $z_{i}$ es el vecino más cercano del vector $x$ si 

$$
||x-z_{i}|| \le ||x - z_{j}|| \quad con \; \; j = 0,\dots, N-1
$$