Predicción de compra de un producto en línea
Ejercicio: Predicción de Compra de un Producto en Línea 🛒💻

Contexto:

Eres parte del equipo de análisis de datos en una tienda en línea. Tu objetivo es predecir si un usuario hará una compra o no basándote en su comportamiento en el sitio web. La tienda recopila datos sobre el comportamiento de los usuarios en el sitio, como el número de páginas que visitan y el tiempo que pasan en la página. Te piden que desarrolles un sistema que utilice estos datos para predecir la probabilidad de que un usuario compre un producto.

Objetivo:

Tu tarea es desarrollar un sistema que, a partir de la información sobre el comportamiento de los usuarios, prediga si comprarán o no un producto. Debes crear varias funciones que permitan:

Generar un conjunto de datos sintéticos sobre el comportamiento de los usuarios en el sitio.

Entrenar un modelo de predicción basado en el comportamiento de los usuarios.

Realizar predicciones sobre si un nuevo usuario comprará o no el producto en función de su actividad en el sitio web.

Funciones que debes implementar:

Función generar_datos_compras(num_muestras):

Descripción: Esta función debe generar un conjunto de datos sintéticos que representen el comportamiento de los usuarios en el sitio web.

Entrada: Un parámetro num_muestras que indica el número de registros de usuarios que quieres generar.

Proceso:

Cada usuario tendrá dos características:

num_paginas_vistas: Un valor entero entre 1 y 20, que representa el número de páginas que un usuario ha visitado en el sitio.

tiempo_en_sitio: Un valor decimal entre 0 y 30 minutos, que representa el tiempo total que el usuario pasó en el sitio.

La variable objetivo (etiqueta) se asigna como:

1 si el número de páginas vistas es mayor a 5 y el tiempo en el sitio es mayor a 10 minutos.

0 si el número de páginas vistas es 5 o menos o si el tiempo en el sitio es 10 minutos o menos.

Salida: Un par de arrays:

Un array con las características de cada usuario (número de páginas vistas y tiempo en el sitio).

Un array con las etiquetas de compra (1 o 0).

Función entrenar_modelo(datos):

Descripción: Esta función debe entrenar un modelo de Machine Learning para predecir la compra del usuario basado en las características generadas.

Entrada: El conjunto de datos generado por la función anterior. Debe contener las características (num_paginas_vistas, tiempo_en_sitio) y las etiquetas (0 o 1).

Proceso:

Divide el conjunto de datos en dos partes: un conjunto de entrenamiento y un conjunto de prueba (usualmente 70% entrenamiento, 30% prueba).

Utiliza un algoritmo de clasificación (como la regresión logística) para entrenar el modelo.

Entrena el modelo utilizando las características (num_paginas_vistas y tiempo_en_sitio) y las etiquetas (compra o no compra).

Salida: El modelo entrenado.

Función predecir_compra(modelo, num_paginas_vistas, tiempo_en_sitio):

Descripción: Esta función debe predecir si un usuario comprará o no el producto basándose en sus características (número de páginas vistas y tiempo en el sitio).

Entrada: El modelo entrenado y las características de un nuevo usuario:

num_paginas_vistas: El número de páginas que un nuevo usuario ha visitado en el sitio.

tiempo_en_sitio: El tiempo que el nuevo usuario ha pasado en el sitio, en minutos.

Salida: Devuelve la predicción de la compra, que puede ser 1 (comprará) o 0 (no comprará).

Función evaluar_modelo(modelo, datos):

Descripción: Esta función debe evaluar el rendimiento del modelo entrenado.

Entrada: El modelo entrenado y el conjunto de datos original (conjunto de características y etiquetas).

Proceso:

Divide el conjunto de datos en un conjunto de entrenamiento y uno de prueba.

Realiza las predicciones sobre el conjunto de prueba.

Calcula y muestra la precisión del modelo, es decir, la proporción de predicciones correctas (puedes usar la métrica de precisión o exactitud).

Salida: Muestra la precisión del modelo y devuelve el valor numérico de precisión.

Ejemplo de Flujo:

Genera un conjunto de datos de usuarios usando generar_datos_compras(100).

Entrena el modelo con el conjunto de datos generado usando entrenar_modelo(datos).

Evalúa la precisión del modelo usando evaluar_modelo(modelo, datos).

Realiza predicciones sobre nuevos usuarios usando predecir_compra(modelo, 8, 12) para predecir si un usuario que vio 8 páginas y pasó 12 minutos en el sitio hará una compra.





In [1]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Paso 1: Generación de Datos Sintéticos de Compras
def generar_datos_compras(num_muestras):
    """
    Genera un conjunto de datos sintéticos con el comportamiento de los usuarios en un sitio web.
    Cada usuario tiene dos características: número de páginas vistas y tiempo en el sitio.
    La etiqueta indica si el usuario comprará o no el producto (1 o 0).
    """
    X = []  # Características: num_paginas_vistas, tiempo_en_sitio
    y = []  # Etiqueta: 1 (compra), 0 (no compra)
    
    for _ in range(num_muestras):
        num_paginas_vistas = np.random.randint(1, 21)  # Número de páginas entre 1 y 20
        tiempo_en_sitio = np.random.uniform(0, 30)     # Tiempo entre 0 y 30 minutos
        
        # Etiqueta: 1 si num_paginas_vistas > 5 y tiempo_en_sitio > 10, 0 en caso contrario
        if num_paginas_vistas > 5 and tiempo_en_sitio > 10:
            compra = 1
        else:
            compra = 0
        
        X.append([num_paginas_vistas, tiempo_en_sitio])
        y.append(compra)
    
    return np.array(X), np.array(y)

# Paso 2: Entrenamiento del Modelo
def entrenar_modelo(X, y):
    """
    Entrena un modelo de Machine Learning para predecir la compra de un producto.
    Utiliza un modelo de regresión logística para clasificación.
    """
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
    
    modelo = LogisticRegression()
    modelo.fit(X_train, y_train)
    
    # Evaluar el modelo en el conjunto de prueba
    y_pred = modelo.predict(X_test)
    precision = accuracy_score(y_test, y_pred)
    
    print(f"Precisión del modelo: {precision:.2f}")
    
    # Devolvemos solo el modelo entrenado
    return modelo

# Paso 3: Predicción de Compra
def predecir_compra(modelo, num_paginas_vistas, tiempo_en_sitio):
    """
    Predice si un usuario comprará el producto basado en el número de páginas vistas y el tiempo en el sitio.
    """
    prediccion = modelo.predict([[num_paginas_vistas, tiempo_en_sitio]])
    
    # Convertir la predicción en un mensaje textual
    if prediccion[0] == 1:
        return 'El usuario comprará el producto.'
    else:
        return 'El usuario no comprará el producto.'

# Ejemplo de Ejecución:

# 1. Generar datos sintéticos de usuarios
X, y = generar_datos_compras(100)

# 2. Entrenar el modelo
modelo = entrenar_modelo(X, y)

# 3. Realizar una predicción para un nuevo usuario
num_paginas_vistas = 8  # El usuario vio 8 páginas
tiempo_en_sitio = 12  # El usuario estuvo en el sitio por 12 minutos
prediccion = predecir_compra(modelo, num_paginas_vistas, tiempo_en_sitio)

# Imprimir el mensaje final de la predicción
print(prediccion)


Precisión del modelo: 0.83
El usuario no comprará el producto.
