- Sequential: Para crear un modelo secuencial de Keras.
- LSTM: La capa de red neuronal recurrente utilizada para capturar dependencias en secuencias de datos.
- Dense: La capa totalmente conectada usada al final del modelo.
- Embedding: La capa de embeddings para convertir entradas categóricas en vectores densos.
- numpy: Librería para manejar arrays de datos y realizar operaciones numéricas.

In [None]:
from keras.models import Sequential
from keras.layers import LSTM, Dense, Embedding
import numpy as np

sequences: Una lista de secuencias de números que representan productos, acciones u otros eventos discretos.

In [None]:
# Datos simulados
sequences = [
    [1, 2, 3],
    [4, 2, 5],
    [1, 2],
    [1, 2, 4, 5],
    # más secuencias...
]

* max_sequence_len: La longitud máxima de las secuencias después del relleno (padding).
* embedding_dim: La dimensión de los vectores de embeddings.
* num_products: El número total de productos únicos en las secuencias.

In [None]:
# Parametros
max_sequence_len = 4
embedding_dim = 10
num_products = 6  # número total de productos

#### Generación de Entradas y Salidas:

X: Se generan sub-secuencias desde el inicio de cada secuencia hasta el ítem anterior al actual.

y: La salida es el siguiente ítem en la secuencia.

#### Relleno de Secuencias:

Se usa np.pad para rellenar las secuencias a una longitud fija (max_sequence_len).

#### Conversión a Arrays de numpy:

Se convierten X e y a arrays de numpy para ser utilizados en el modelo.

In [None]:
# Preprocesamiento de datos
X = []
y = []

for seq in sequences:
    for i in range(1, len(seq)):
        X.append(seq[:i])
        y.append(seq[i])

X = np.array([np.pad(x, (0, max_sequence_len-len(x)), 'constant') for x in X])
y = np.array(y)

Capa de Embeddings: Convierte los índices de los productos en vectores densos.

Capa LSTM: Captura las dependencias temporales en las secuencias.

Capa Densa: Produce una distribución de probabilidad sobre los productos para predecir el próximo ítem.

Compilación del Modelo: Utiliza sparse_categorical_crossentropy como la función de pérdida y adam como el optimizador.

In [None]:
# Construcción del modelo LSTM
model = Sequential()
model.add(Embedding(input_dim=num_products, output_dim=embedding_dim, input_length=max_sequence_len))
model.add(LSTM(50))
model.add(Dense(num_products, activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

Se entrena el modelo con las entradas X y las salidas y durante 50 épocas.

In [None]:
# Entrenamiento del modelo
model.fit(X, y, epochs=50, verbose=2)

Epoch 1/50
1/1 - 4s - loss: 1.7925 - accuracy: 0.0000e+00 - 4s/epoch - 4s/step
Epoch 2/50
1/1 - 0s - loss: 1.7882 - accuracy: 0.6250 - 10ms/epoch - 10ms/step
Epoch 3/50
1/1 - 0s - loss: 1.7838 - accuracy: 0.5000 - 9ms/epoch - 9ms/step
Epoch 4/50
1/1 - 0s - loss: 1.7795 - accuracy: 0.5000 - 16ms/epoch - 16ms/step
Epoch 5/50
1/1 - 0s - loss: 1.7750 - accuracy: 0.5000 - 11ms/epoch - 11ms/step
Epoch 6/50
1/1 - 0s - loss: 1.7705 - accuracy: 0.5000 - 12ms/epoch - 12ms/step
Epoch 7/50
1/1 - 0s - loss: 1.7659 - accuracy: 0.5000 - 11ms/epoch - 11ms/step
Epoch 8/50
1/1 - 0s - loss: 1.7612 - accuracy: 0.5000 - 12ms/epoch - 12ms/step
Epoch 9/50
1/1 - 0s - loss: 1.7563 - accuracy: 0.5000 - 10ms/epoch - 10ms/step
Epoch 10/50
1/1 - 0s - loss: 1.7513 - accuracy: 0.5000 - 11ms/epoch - 11ms/step
Epoch 11/50
1/1 - 0s - loss: 1.7461 - accuracy: 0.5000 - 12ms/epoch - 12ms/step
Epoch 12/50
1/1 - 0s - loss: 1.7406 - accuracy: 0.5000 - 19ms/epoch - 19ms/step
Epoch 13/50
1/1 - 0s - loss: 1.7349 - accuracy: 0.5

<keras.src.callbacks.History at 0x7ad3f0297d00>

**Nueva Secuencia para Predicción:**

new_sequence: Una nueva secuencia para la cual queremos predecir el próximo ítem.

new_sequence_padded: Se rellena la secuencia para que tenga la misma longitud que las secuencias de entrenamiento y se remodela para que coincida con la entrada esperada por el modelo.

**Predicción:**

model.predict: Se utiliza el modelo para predecir la probabilidad del próximo producto.

np.argmax: Se obtiene el índice del producto con la probabilidad más alta.

**Salida de la Predicción:**

Se imprime el próximo producto predicho.

In [None]:
# Predicción
new_sequence = [1, 2]
new_sequence_padded = np.pad(new_sequence, (0, max_sequence_len-len(new_sequence)), 'constant').reshape(1, -1)
predicted_next_product = np.argmax(model.predict(new_sequence_padded), axis=-1)

print(f"El próximo producto predicho es: {predicted_next_product}")

El próximo producto predicho es: [2]


Este código muestra cómo preparar datos de secuencias, construir y entrenar un modelo LSTM para la predicción de secuencias, y luego utilizar el modelo entrenado para hacer predicciones sobre nuevas secuencias.

### Interpretación y Aplicación
El modelo entrenado puede utilizarse para predecir el próximo producto que un cliente probablemente comprará. Esta predicción puede integrarse en el sistema de recomendación del sitio web, mostrando productos sugeridos basados en las predicciones del modelo. Además, estas recomendaciones pueden personalizarse en tiempo real, mejorando la experiencia del usuario y potenciando las ventas.

Este ejemplo ilustra cómo la predicción de secuencias en minería de datos se puede aplicar para anticipar las necesidades de los clientes en un contexto de comercio electrónico, proporcionando recomendaciones precisas y mejorando la satisfacción del cliente.