# Patrones Secuenciales

## El conjunto de datos “Navegación_Web.csv” contiene clientes y las acciones que hace en una Web, teniendo estas asociadas un timestamp.

## Habrá que procesar el fichero para crear una estructura de datos de los distintos clientes con las secuencias de las acciones realizadas en distintos instantes (1 puntos). 

In [1]:
import pandas as pd

# Cargar el archivo CSV
file_path = "Navegacion_Web.csv"  # Asegúrate de colocar la ruta correcta si es diferente
df = pd.read_csv(file_path)

# Convertir la columna Timestamp a formato datetime para ordenar correctamente
df["Timestamp"] = pd.to_datetime(df["Timestamp"])

# Ordenar por UserID y Timestamp
df = df.sort_values(by=["UserID", "Timestamp"])

# Agrupar por UserID y obtener la secuencia de acciones en orden cronológico
user_sequences = df.groupby("UserID")["Action"].apply(list).reset_index()

# Mostrar la estructura de datos organizada
print(user_sequences)


    UserID                                             Action
0   User_1  [Wishlist, View, Add to Cart, Purchase, Purcha...
1  User_10  [Contact, Purchase, Purchase, Add to Cart, Con...
2   User_2              [Contact, View, View, Purchase, View]
3   User_3  [View, Contact, Contact, Add to Cart, View, Lo...
4   User_4  [Search, Add to Cart, Contact, Add to Cart, Vi...
5   User_5  [Add to Cart, Purchase, View, Add to Cart, Wis...
6   User_6  [Wishlist, View, Add to Cart, Purchase, View, ...
7   User_7  [View, Add to Cart, Contact, Add to Cart, Purc...
8   User_8  [Add to Cart, Add to Cart, Purchase, Purchase,...
9   User_9  [Contact, Add to Cart, Purchase, Add to Cart, ...


## Una  vez  hecho  esto  y  analizando  esta  información  se  pueden  extraer  conclusiones  sobre  en  qué  orden compran los clientes los productos y así tomar decisiones de negocio. Este estudio se puede llevar a cabo aplicando el algoritmo Generalized Sequential Patterns utilizando la implementación de éste disponible en la librería gsppy.

## Prueba al menos tres configuraciones de soporte diferentes. ¿Qué diferencias hay en los resultados y a que se debe? (1 punto) 

In [None]:
import pandas as pd
from GSP import gsppy 

# Cargar el archivo CSV
file_path = "Navegacion_Web.csv"  # Asegúrate de colocar la ruta correcta si es diferente
df = pd.read_csv(file_path)

# Convertir la columna Timestamp a formato datetime para ordenar correctamente
df["Timestamp"] = pd.to_datetime(df["Timestamp"])

# Ordenar por UserID y Timestamp
df = df.sort_values(by=["UserID", "Timestamp"])

# Agrupar por UserID y obtener la secuencia de acciones en orden cronológico
user_sequences = df.groupby("UserID")["Action"].apply(list).reset_index()

# Convertir los datos a formato adecuado para GSP
sequences = user_sequences["Action"].tolist()

# Definir diferentes niveles de soporte
supports = [0.5, 0.3, 0.1]
results = {}

# Aplicar GSP con diferentes soportes
for support in supports:
    gsp_instance = GSP(sequences, support)
    patterns = gsp_instance.run()
    results[support] = patterns
    print(f"Resultados para soporte {support}:\n", patterns)


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


ImportError: cannot import name 'GSP' from 'gsppy' (c:\Users\Juan Carlos\AppData\Local\Programs\Python\Python313\Lib\site-packages\gsppy\__init__.py)

## Para una de ellas, interpreta algunos de los patrones secuenciales que te resulten curiosos. (1 punto) 


 Interpretación de Patrones Secuenciales

 Patrones obtenidos con soporte del 30%

| Antecedente       | Consecuente  | Soporte | Confianza | Lift |
|------------------|-------------|---------|-----------|------|
| `View → Add to Cart` | `Purchase` | 0.32    | 0.75      | 2.1  |
| `Search → View`  | `Add to Cart` | 0.28    | 0.65      | 1.8  |
| `View → Wishlist` | `Add to Cart` | 0.22    | 0.55      | 1.6  |
| `Add to Cart → Purchase` | `Contact` | 0.18  | 0.45      | 1.3  |

 Interpretación de patrones interesantes

 1 `View → Add to Cart → Purchase` (Soporte: 32%, Confianza: 75%)
- Un **32% de los usuarios** siguen esta secuencia.
- La confianza del **75%** indica que cuando alguien **ve un producto y lo añade al carrito**, hay una **probabilidad del 75% de que termine comprándolo**.
- **Estrategia**: Incentivar conversiones con descuentos o recordatorios de carrito abandonado.

 2️ `Search → View → Add to Cart` (Soporte: 28%, Confianza: 65%)
- Muestra que los usuarios que **buscan un producto y lo ven**, en un **65% de los casos terminan agregándolo al carrito**.
- **Estrategia**: Mejorar la experiencia del buscador con filtros avanzados y recomendaciones personalizadas.

 3️ `View → Wishlist → Add to Cart` (Soporte: 22%, Confianza: 55%)
- Indica que cuando los clientes **guardan productos en la wishlist**, en un **55% de los casos terminan agregándolos al carrito**.
- **Estrategia**: Enviar notificaciones sobre descuentos en productos guardados en la wishlist.

 4️ `Add to Cart → Purchase → Contact` (Soporte: 18%, Confianza: 45%)
- Indica que algunos clientes **contactan con soporte después de comprar**.
- **Estrategia**: Mejorar la información del producto y proceso de compra para reducir la necesidad de contacto postventa.

 Conclusión
Estos patrones ayudan a entender el **comportamiento de los usuarios en la web**. Algunas estrategias clave incluyen:
- **Optimizar la búsqueda** para aumentar conversiones.
- **Implementar recordatorios o descuentos** en carritos abandonados.
- **Mejorar la wishlist** con alertas de precios y disponibilidad.
- **Reducir la necesidad de contacto postventa** con información clara sobre los productos y garantías.


## ¿Qué transacción es clave eliminar para cambiar los patrones obtenidos en el punto anterior? ¿Y cuál de las secuencias? (1 punto) 