# Similitud de Coseno

## ¿Qué es la similitud de coseno?
La **similitud de coseno** es una medida de la similitud entre dos vectores. Mide el coseno del ángulo entre los vectores y nos da un valor entre -1 y 1.

- Si la similitud de coseno es 1, significa que los vectores son paralelos y apuntan en la **misma dirección** (muy similares).
- Si la similitud de coseno es 0, significa que los vectores son **ortogonales** (no tienen ninguna similitud).
- Si la similitud de coseno es -1, significa que los vectores son paralelos pero apuntan en **direcciones opuestas** (completamente opuestos).

La fórmula para calcular la similitud de coseno entre dos vectores $ a $ y $ b $ es:

$$
\cos(\theta) = \frac{a \cdot b}{||a|| \cdot ||b||}
$$

Donde:
- $ a \cdot b $ es el producto interno de los vectores $ a $ y $ b $.
- $ ||a|| $ y $ ||b|| $ son las normas de los vectores $ a $ y $ b $, respectivamente.

La similitud de coseno es muy útil en aprendizaje automático y procesamiento de texto para medir la similitud entre documentos o características.

## Ejemplo 1: Evaluación de las preferencias de un usuario al elegir una película, usando vectores

Este ejemplo muestra cómo usar límites y vectores en sistemas de recomendación de películas. Representaremos las preferencias del usuario y las características de una película mediante vectores, calcularemos la similitud entre ambos usando la **similitud del coseno** y analizaremos cómo los límites ayudan a resolver indeterminaciones:

$$
\text{Similitud}(u, p) = \frac{\vec{u} \cdot \vec{p}}{\|\vec{u}\| \|\vec{p}\|}
$$

#### ¿Qué son los pesos de los vectores?

En sistemas de recomendación, los **pesos** de los vectores representan la importancia relativa de diferentes características. Por ejemplo:
- Para un usuario, los pesos ($ \vec{u} $) indican cuánto le gusta cada género cinematográfico (acción, comedia, drama, etc.).
- Para una película, los pesos ($ \vec{p} $) indican qué proporción de esos géneros están presentes en la película.

**Ejemplo**:
- Un usuario tiene los gustos $ \vec{u} = [1, 0.5, 0.2] $, lo que significa que:
  - Acción: 1 (le gusta mucho).
  - Comedia: 0.5 (le gusta algo).
  - Drama: 0.2 (le gusta poco).
- Una película tiene $ \vec{p} = [0.8, 0.6, 0.1] $, lo que significa que:
  - Acción: 0.8 (es mayoritariamente de acción).
  - Comedia: 0.6 (contiene algo de comedia).
  - Drama: 0.1 (apenas tiene drama).

Estos vectores son las representaciones numéricas que convierten las preferencias del usario y las características de una película en algo que un ordenador puede entender.

In [23]:
import numpy as np  # Importamos NumPy

# Definimos los vectores de gustos del usuario y características de la película
usuario = np.array([1, 0.5, 0.2])
pelicula = np.array([0.8, 0.6, 0.1])

# Calculamos la similitud del coseno
similitud = np.dot(usuario, pelicula) / (np.linalg.norm(usuario) * np.linalg.norm(pelicula))

# Mostramos el resultado
print("Similitud del coseno entre usuario y película:", similitud)

Similitud del coseno entre usuario y película: 0.9812111634618578


## Ejemplo 2: Uso de la similitud del coseno en modelos de recomendación de productos
En aprendizaje automático, la similitud del coseno se utiliza para calcular de manera más precisa la similitud entre vectores. En este caso vamos a utilizarla para sistemas de recomendación. Si un vector representa los intereses de un usuario y otro vector representa las características de un producto, la similitud del coseno nos indica cuánto podría interesarle un producto a un usuario con valores entre -1, 0, 1.

Por ejemplo, si tenemos:

- $ usuario = [1, 1, 3] $ : representando el interés del usuario en tres categorías, por ejemplo $[ropa:1, electrodomésticos:1, tecnología:1]$.
- $ producto = [0, 2, 1] $ : representando la relación del producto con esas mismas categorías, por ejemplo, un lavavajillas que no tiene nada que ver con ropa (0), es electrodoméstico (2) y tiene parte de tecnología (1), es decir $[ropa:0, electrodomésticos:2, tecnología:1]$. 

Calculamos la similitud del producto para determinar si el producto puede resultar interesante para ese usuario:

In [5]:
import numpy as np  # Importa NumPy

usuario = np.array([1, 1, 3])  # Vector de características del usuario
producto = np.array([0, 2, 1])  # Vector de características del producto

# Calcula el producto escalar entre usuario y producto
producto_escalar = np.dot(usuario, producto)

# Calcula la norma de cada vector
norma_usuario = np.linalg.norm(usuario)
norma_producto = np.linalg.norm(producto)

# Calcula la similitud del coseno entre usuario y producto
recomendacion = producto_escalar / (norma_usuario * norma_producto)

print("La afinidad del usuario por el producto es:", recomendacion)


La afinidad del usuario por el producto es: 0.674199862463242
