# 12. Inner product o producto interno

<span style="color:orange"> Ejemplo:  Casa en llamas. 

![No se puede mostrar](Images/Casa en llamas.png)

Hay una casa en llamas ubicada en las coordenadas [2, 4].  
Hay una calle cerca de la casa, que empieza en [0,0] y acaba en [6, 2].   
El camión de bomberos tiene una manguera de 3.5 unidades de largo.  
¿Será lo suficientemente larga para llegar hasta la casa?  
Si podemos colocar el camión de bomberos en el punto más cercano a la casa, ¿será la distancia  lo suficientemente pequeña como para salvar la casa?  
Nos enfrentamos a dos preguntas: </style> 
* <span style="color:orange">¿Qué punto a lo largo de la calle está más cerca de la casa?</style>  
* <span style="color:orange">¿A qué distancia estaría de la casa?</style>  

Definimos la **distancia** entre dos vectores **u** y **v** como la longitud de la diferencia **u** - **v**.  

Esto significa que debemos definir la longitud de un vector.
En lugar de usar el término "longitud" para vectores, generalmente usamos el término **norma**. La norma de un vector v se denota por $\|v\|$.  

![No se puede mostrar](Images/4-sel-metodos-iterativos-17-638.jpg).  

La norma de un vector cumple las siguientes propiedades:  
* $\|v\|$ es un número real no negativo.  
* $\|v\|$ = 0 $\leftrightarrow$ **v**=0.   
* Para cualquier escalar $\alpha$, $\|\alpha\cdot v\|$ = $| \alpha | \cdot$ $\|v\|$.  
* $\|u+v\|$ ≤ $\|u\|$ + $\|v\|$.  

Una forma de definir la norma del vector es definir una operación en vectores llamada **producto interno**.  
El producto interno de los vectores u y v se expresa como ⟨u, v⟩.  

IMPORTANTE!!!!! No hay forma de definir el producto interno para GF(2) así que no más GF(2).  

Para los números reales y los números complejos, tenemos cierta flexibilidad para definir el producto interno.  
Esta flexibilidad se usa mucho, por ejemplo, en Machine Learning.  
Una vez que hemos definido un producto interno, la norma de un vector **u** se define por:
> $\|u\|$ = $\sqrt{⟨u, u⟩}$  

Nos vamos a centrar en $\mathbb{R}$.  
La norma en $\mathbb{R}$ se puede ver como la longitud de su "flecha".  
Para vectores sobre $\mathbb{R}$, definimos el producto interno como el producto escalar:  
> ⟨u, v⟩ = u · v  

** Propiedades del producto interno para vectores de $\mathbb{R}$**

* ⟨u+v,w⟩=⟨u,w⟩+⟨v,w⟩   
* ⟨u,v⟩=⟨v,u⟩
* ⟨αu,v⟩=α⟨u,v⟩  

La norma es la longitud geométrica de la flecha.  

<span style="color:orange"> Ejemplo:  
¿Cuál es la longitud del vector u = [u<sub>1</sub>, u<sub>2</sub>]?  
Por el Teorema de Pitágoras:  
para un triángulo rectángulo con longitudes laterales a, b, c, donde c es la longitud de la hipotenusa:</style>   
> <span style="color:orange">a<sup>2</sup> + b<sup>2</sup> = c<sup>2</sup></style>

<span style="color:orange">Podemos usar esta ecuación para calcular la longitud de u:
(longitud de u) <sup>2</sup> = u<sub>1</sub><sup>2</sup>2 + u<sub>2</sub><sup>2</sup>
</style>  

**Teorema de Pitágoras para vectores** 
Si los vectores u y v sobre los reales son ortogonales entonces $\|u+v\|$ <sup>2</sup> = $\|u\|$ <sup>2</sup> + $\|v\|$ <sup>2</sup>  

** Propiedades de la ortogonalidad**  
* Si u es ortogonal a v, entonces u es ortogonal a α v para cada escalar α.  
* Si u y v son ambos ortogonales a w, u + v es ortogonal a w.  

<span style="color:orange"> Ejemplo:  
[1,2]·[2,−1]=0. Luego, [1,2]·[20,−10]=0  </style>  

<span style="color:orange"> Ejemplo:  
[1,2,1]·[1,−1,1] = 0.  
[0,1,1]·[1,−1,1] = 0.  
Luego: ([1,2,1]+[0,1,1])·[1,−1,1] = 0  </style>   

<span style="color:orange"> Ejemplo:  Casa en llamas.  
Volvamos al ejemplo con el que empezamos el tema.  
Sea **b** un vector.  
Sea **a** sea un vector distinto de cero⇒El conjunto {αa: α∈R} es una línea L  
Sea p ser el punto en la línea L tal que **b-p** es ortogonal a **a**.  
Entonces p es el punto en la línea que está más cerca de b.</style>  

**Descomposición de b en componentes paralelos y perpendiculares**  
Para cualquier vector **b** y cualquier vector **a**, podemos definir los vectores b<sup>$\|$a</sup> y b<sup>⊥a</sup> como la proyección de **b** en Gen{**a**} y la proyección de **b** ortogonal a **a** si se cumplen las dos siguientes condiciones:  
* Hay un escalar σ ∈ R tal que b<sup>$\|$a</sup> = σa
* b<sup>⊥a</sup> es ortogonal a a  

σ= $\frac{⟨b,a⟩}{⟨a,a⟩}.$  

¿Cómo lo haríamos en Python?  
Vamos a definir b<sup>$\|$a</sup>.  


In [8]:
def proyeccion_paralela(b, a): 
    return ((b*a)/(a*a))*a

Si **a**=0, ⟨a,a⟩=0, por lo que modificamos un poco el procedimiento.

In [3]:
def proyeccion_paralela(b, a): 
    return ((b*a)/(a*a) if a*a != 0 else 0)*a

Mejor:

In [4]:
def proyeccion_paralela(b, a):
 sigma = (b*a)/(a*a) if a*a != 0 else 0
 return sigma * a

A menudo, el vector a no será realmente un vector cero, pero prácticamente será cero.  
Si las entradas de a son minúsculas, el procedimiento debería tratar a a como un vector cero: sigma debería tener asignado cero.  
Consideraremos que a es un vector cero si su norma al cuadrado no es más que 10<sup>-20</sup>.  


In [5]:
def proyeccion_paralela(b, a):
    sigma = (b*a)/(a*a) if a*a > 10^-20 else 0
    return [sigma * a[i] for i in range(len(a))]

¿Cómo calcularíamos la proyección ortogonal?  

In [6]:
def proyeccion_ortogonal(b, a):
    return b - proyeccion_paralela(b, a)

In [46]:
import numpy as np

def proyeccion_paralela(b, a):
    sigma = np.dot(b,a)/np.dot(a,a) if np.dot(a,a) > 10^-20 else 0
    return [sigma * a[i] for i in range(len(a))]

def proyeccion_ortogonal(b, a):
    return b - proyeccion_paralela(b, a)



In [47]:
a=np.array([6.,3.])
b=np.array([2.,4.])
proyeccion_paralela(b,a)

[3.2, 1.6]

In [48]:
proyeccion_ortogonal(b,a)

array([-1.2,  2.4])

<span style="color:orange"> Ejemplo:  Casa en llamas.  
Volvamos al ejemplo.  
a = [6, 2] y b = [2, 4].  
El punto más cercano en la línea {αa: α ∈ R} es el punto b<sup>$\|$a</sup> = σ a donde σ = $\frac{a \cdot b}{a \cdot a}=\frac{6 \cdot 2 + 2 \cdot 4}{6 \cdot 6 + 2 \cdot 2}=\frac{20}{40}=\frac{1}{2}$.  
Luego el punto más cercano a **b** es $\frac{1}{2} \cdot$ [6,2]=[3,1].  
La distancia a b es $\|$b<sup>⊥a</sup>$\|$=$\|$[2,4]−[3,1]$\|$=$\|$[−1,3]$\|$= $\sqrt{10} <3.5$  
Por lo tanto, la casa se salva.  
</style>   

Esta noción de "la mejor aproximación" aparece una y otra vez:
* En mínimos cuadrados (una técnica fundamental de análisis de datos). 
* En compresión de imagen  
* En el análisis de componentes principales (otra técnica de análisis de datos).  
* En el análisis semántico latente (una técnica de recuperación de información).  

<span style="color:orange"> Ejemplo:  Casa en llamas.  
Intentemos hacerlo con Python
</style>   

In [18]:
import numpy as np
a=np.array([[6,2]])
b=np.array([[2,4]])
proyeccion_paralela(b,a)

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

<span style="color:blue"> Ejercicio 14:  
Modificar lo necesario en los algoritmos para que funcionen y calculen el problema de la casa en llamas.</style>