# Similitud de Coseno

## ¿Qué es la similitud de coseno?
La **similitud de coseno** es una medida de la similitud entre dos vectores. Mide el coseno del ángulo entre los vectores y nos da un valor entre -1 y 1.

- Si la similitud de coseno es 1, significa que los vectores son paralelos y apuntan en la **misma dirección** (muy similares).
- Si la similitud de coseno es 0, significa que los vectores son **ortogonales** (no tienen ninguna similitud).
- Si la similitud de coseno es -1, significa que los vectores son paralelos pero apuntan en **direcciones opuestas** (completamente opuestos).

La fórmula para calcular la similitud de coseno entre dos vectores $ a $ y $ b $ es:

$$
\cos(\theta) = \frac{a \cdot b}{||a|| \cdot ||b||}
$$

Donde:
- $ a \cdot b $ es el producto interno de los vectores $ a $ y $ b $.
- $ ||a|| $ y $ ||b|| $ son las normas de los vectores $ a $ y $ b $, respectivamente.

La similitud de coseno es muy útil en machine learning y procesamiento de texto para medir la similitud entre documentos o características.

### Ejemplo 1: Uso de la similitud del coseno en modelos de recomendación
En aprendizaje automático, la similitud del coseno se utiliza para calcular de manera más precisa la similitud entre vectores. En este caso vamos a utilizarla para sistemas de recomendación. Si un vector representa los intereses de un usuario y otro vector representa las características de un producto, la similitud del coseno nos indica cuánto podría interesarle el producto al usuario con valores entre -1, 0, 1.

Por ejemplo, si tenemos:

- $ usuario = [1, 1, 3] $ (representando el interés del usuario en tres categorías, por ejemplo ropa, electrodomésticos, tecnología)
- $ producto = [0, 2, 1] $ (representando la relación del producto con esas mismas categorías, por ejemplo, un lavavajillas que es electrodoméstico y tiene parte de tecnología)

Calculamos la similitud del producto para determinar si el producto es adecuado para el usuario.

In [12]:
import numpy as np
usuario = np.array([1, 1, 3])
producto = np.array([0, 2, 1])
producto_escalar = np.dot(usuario, producto)
norma_usuario = np.linalg.norm(usuario)
norma_producto = np.linalg.norm(producto)
recomendacion = producto_escalar / (norma_usuario * norma_producto)
print("La afinidad del usuario por el producto es:", recomendacion)

La afinidad del usuario por el producto es: 0.674199862463242
