# 🤖 Actividad: El Recomendador de IA - ¿Coincidencia Perfecta o Mejor Aproximación?

**Curso:** Álgebra Lineal

**Tema:** Vectorización, Sistemas de Ecuaciones y Similitud del Coseno en IA

**Tiempo estimado:** 2 horas

## Problema de Ingeniería

Estás trabajando en un sistema de recomendación de películas. La IA tiene un "cerebro" formado por 3 perfiles de opinión base, que definen su conocimiento sobre los gustos de la gente. Cada perfil es un vector basado en las palabras clave `["Acción", "Comedia", "Drama"]`.

Los 3 **perfiles base** del sistema son:
- **Perfil 1 (`p1`):** Fan de la acción pura. Vector: `[7, 1, 2]`
- **Perfil 2 (`p2`):** Fan de la comedia. Vector: `[1, 8, 1]`
- **Perfil 3 (`p3`):** Fan del drama intenso. Vector: `[2, 2, 7]`

Estos tres vectores forman las columnas de la **matriz de conocimiento** `A` de la IA.

### El Desafío

Llega un nuevo usuario con una opinión sobre su película favorita. Tu **primera tarea** será convertir su opinión en un vector. Luego, usarás ese vector para determinar si su opinión encaja perfectamente con el conocimiento de la IA o si, por el contrario, necesitas encontrar el perfil más parecido.

> **Preguntas a resolver:**
> 1. ¿Cuál es el vector que representa la opinión del nuevo usuario?
> 2. ¿Son los perfiles base del sistema un buen fundamento (son **linealmente independientes**)?
> 3. ¿Puede la opinión del usuario ser representada **exactamente** por el sistema? (¿Tiene solución el sistema `Ax = b`?).
> 4. Si no hay una solución exacta, ¿cuál de los tres perfiles base es el **más similar** a la opinión del usuario?

---

## Procedimiento

Sigue los pasos en orden para llegar a la recomendación final.

### Paso 1: Convierte la Opinión del Usuario en un Vector (¡Tu Turno!)

El computador no entiende palabras, solo números. Usamos un método simple llamado **"Bolsa de Palabras con Pesos"**. Primero, definimos un vocabulario y le asignamos puntos a cada palabra clave.

**1. Vocabulario y Pesos:**
El sistema usa la siguiente tabla para puntuar las opiniones:

| Categoría | Palabras Clave y Sinónimos | Puntos por cada aparición |
| :--- | :--- | :--- |
| **Acción** | `acción`, `peleas`, `explosiones` | 5 puntos |
| **Comedia** | `comedia`, `chistes`, `divertida` | 4 puntos |
| **Drama** | `drama`, `trama`, `personajes`, `emotiva`| 4 puntos |
| **Intensificador** | `mucho`, `increíble`, `gran` | +1 punto a su categoría |

**2. La Opinión a Vectorizar:**
Esta es la opinión del nuevo usuario:
 > *"¡Fue una película con mucha **acción**! La **trama** fue **increíble** y también muy **divertida**."`

**3. Tu Tarea: Calcula los Puntos y Construye el Vector**
Lee la opinión y usa la tabla de pesos para llenar los espacios en blanco a continuación. Suma los puntos para cada categoría.

- **Puntos de Acción:**
  - Palabra 'acción' = 5 puntos
  - Palabra 'mucha' (intensificador de acción) = 1 punto
  - **Total Acción = ___ puntos**

- **Puntos de Comedia:**
  - Palabra 'divertida' = 4 puntos
  - **Total Comedia = ___ puntos**

- **Puntos de Drama:**
  - Palabra 'trama' = 4 puntos
  - Palabra 'increíble' (intensificador de trama) = 1 punto
  - **Total Drama = ___ puntos**

**El vector `b` del usuario es `[Total Acción, Total Comedia, Total Drama]`. Escríbelo aquí:**

`b = [ __ , __ , __ ]`

**¡Usa este vector `b` que acabas de crear para el resto de la actividad!**

---

### Herramientas de Código
Ahora que tienes el vector del usuario, usa estas herramientas para analizarlo. **No necesitas programar**, solo modificar los parámetros según sea necesario.

#### Código 1: Análisis de la Matriz Base (Rango y Determinante)
Nos dice si los vectores base son linealmente independientes.

In [None]:
import numpy as np
A = np.array([
    [7, 1, 2],
    [1, 8, 1],
    [2, 2, 7]
])
print(f"Rango: {np.linalg.matrix_rank(A)}")
print(f"Determinante: {np.linalg.det(A):.2f}")

#### Código 2: Solucionador de Sistemas 
Nos dice si el sistema `Ax = b` tiene solución al analizar la matriz aumentada `[A|b]`.

In [None]:
import sympy as sp
# MODIFICA LA ÚLTIMA COLUMNA CON TU VECTOR b
M = sp.Matrix([
    [7, 1, 2, 6],
    [1, 8, 1, 4],
    [2, 2, 7, 5]
])
M_rref, pivotes = M.rref()
print("Forma escalonada de la matriz aumentada:")
sp.pprint(M_rref)

#### Código 3: Calculadora de Similitud del Coseno
Mide el parecido entre dos vectores. Un valor cercano a 1 es muy similar.

In [None]:
import numpy as np
# MODIFICA EL VECTOR 'a' CON TU VECTOR b
a = np.array([6, 4, 5]) # Vector del usuario
b = np.array([7, 1, 2]) # Vector de un perfil
similitud = np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
print(f"La similitud es: {similitud:.4f}")

---

### Paso 2: Verificar la Calidad de la IA

Asegúrate de que los 3 perfiles base no son redundantes.

1.  Usa el **Código 1** con la matriz `A` formada por los perfiles `p1`, `p2` y `p3`.
2.  **Interpreta el resultado:** Si el **determinante no es cero** y el **rango es 3**, la base es buena.

In [None]:
import numpy as np

# Matriz A con p1, p2, p3 como columnas
A = np.array([
    [7, 1, 2],
    [1, 8, 1],
    [2, 2, 7]
])

print(f"Analizando la matriz de conocimiento A:\n{A}")
print(f"\nRango: {np.linalg.matrix_rank(A)}")
print(f"Determinante: {np.linalg.det(A):.2f}")

### Paso 3: Intentar la "Coincidencia Perfecta"

Ahora, veamos si el vector `b` que calculaste está en el espacio columna de `A`.

1.  En el **Código 2**, reemplaza la última columna con los valores de tu vector `b`.
2.  Ejecuta el código para calcular la RREF.
3.  **Interpreta la RREF:** Si ves una fila de la forma `[0, 0, 0, 1]`, el sistema es **inconsistente** y no tiene solución.

### Paso 4: Calcular la "Mejor Aproximación"

Si no hubo una coincidencia perfecta, la IA recurre al plan B. Debemos encontrar qué perfil se parece más al del usuario.

1.  En la celda de abajo, **asegúrate de que el vector `usuario` sea el vector `b` que tú creaste**.
2.  El código comparará tu vector con los tres perfiles base.
3.  **Interpreta los resultados:** El valor de similitud más cercano a 1 indica el perfil más parecido.

In [None]:
import numpy as np

# MODIFICA ESTA LÍNEA con el vector que calculaste en el Paso 1
usuario = np.array([6, 4, 5])

# Perfiles base
p1_accion = np.array([7, 1, 2])
p2_comedia = np.array([1, 8, 1])
p3_drama = np.array([2, 2, 7])

# --- No es necesario modificar debajo de esta línea ---
sim_accion = np.dot(usuario, p1_accion) / (np.linalg.norm(usuario) * np.linalg.norm(p1_accion))
sim_comedia = np.dot(usuario, p2_comedia) / (np.linalg.norm(usuario) * np.linalg.norm(p2_comedia))
sim_drama = np.dot(usuario, p3_drama) / (np.linalg.norm(usuario) * np.linalg.norm(p3_drama))

print(f"Similitud con Acción: {sim_accion:.4f}")
print(f"Similitud con Comedia: {sim_comedia:.4f}")
print(f"Similitud con Drama: {sim_drama:.4f}")

---

## ✅ Reporte Final

Reúne tus resultados para dar una conclusión.

**1. ¿Cuál es el vector `b` que representa la opinión del usuario?**
   `Respuesta:`

**2. ¿Son los perfiles base linealmente independientes? ¿Cómo lo sabes?**

   `Respuesta:`

**3. ¿Por qué el sistema no pudo encontrar una "coincidencia perfecta" para la opinión del usuario? (Justifica con la RREF)**

   `Respuesta:`

**4. ¿Cuál es el perfil más similar a la opinión del usuario y qué género le recomendarías?**

   `Respuesta:`