## RED NEURONAL RECURRENTE - RNN

Este es un ejemplo sencillo de una RNN que va a permitir llevar a cabo la predicción de caracteres usando un conjunto de datos (cadena de texto).

Importamos las librerías necesarias

In [3]:
import warnings
import numpy as np
import tensorflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import SimpleRNN, Dense
from tensorflow.keras.optimizers import Adam


Desactivamos los WARNINGS

In [4]:
warnings.filterwarnings("ignore")

### Definición del conjunto de datos y creación del vocabulario

Generamos el conjunto de datos a partir de una frase sencilla y, seguidamente, creamos un vocabulario ordenando el conjunto de carácteres que componen la frase.
Después se crea un diccionario mapeando los caracteres del vocabulario con índices para, a continuación, transformar la secuencia de caracteres que conforman la frase en una secuencia de indices.

In [5]:
# Definimos el conjunto de datos (secuencia de texto)
text = "hello world"
# Crear un vocabulario de caracteres
vocab = sorted(set(text))
vocab_size = len(vocab)

In [6]:
# Crear un diccionario de mapeo de caracteres a índices
char_to_idx = {char: idx for idx, char in enumerate(vocab)}
idx_to_char = np.array(vocab)

# Convertir la secuencia de texto a una secuencia de índices
text_as_int = np.array([char_to_idx[c] for c in text])

### PREPARACIÓN DE DATOS

In [ ]:
# Preparar los datos de entrenamiento (pares de secuencia de entrada y salida)
seq_length = 4
examples_per_epoch = len(text) - seq_length

In [7]:
# Crear las secuencias de entrada y salida
inputs = np.array([text_as_int[i:i+seq_length] for i in range(examples_per_epoch)])
targets = np.array([text_as_int[i+seq_length] for i in range(examples_per_epoch)])

# Reshape para cumplir con el formato esperado por la RNN
inputs = np.reshape(inputs, (examples_per_epoch, seq_length, 1))

# Usar tf.data.Dataset para manejar los datos
dataset = tf.data.Dataset.from_tensor_slices((inputs, targets))
dataset = dataset.batch(1, drop_remainder=True)


### DISEÑO DE LA ARQUITECTURA DE LA RNN

In [8]:
# Crear el modelo RNN
model = Sequential([
    SimpleRNN(50, input_shape=(seq_length, 1), return_sequences=False),
    Dense(vocab_size, activation='softmax')
])
# Compilar el modelo
model.compile(optimizer=Adam(), loss='sparse_categorical_crossentropy')

### ENTRENAMIENTO

In [9]:
# Entrenar el modelo
model.fit(dataset, epochs=100)


Epoch 1/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 2.0116
Epoch 2/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.7081
Epoch 3/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.5987
Epoch 4/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.5218
Epoch 5/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.4601
Epoch 6/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.4053
Epoch 7/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.3539
Epoch 8/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.3054
Epoch 9/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.2595
Epoch 10/100
[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 1.2152
Epoch 11/100
[1m7/

<keras.src.callbacks.history.History at 0x129329e10>

### PREDICCIÓN

In [11]:
# Función para predecir el siguiente carácter en una secuencia dada
def predict_next_char(model, input_text):
    input_eval = np.array([char_to_idx[c] for c in input_text])
    input_eval = np.reshape(input_eval, (1, len(input_eval), 1))
    prediction = model.predict(input_eval)
    predicted_idx = np.argmax(prediction)
    return idx_to_char[predicted_idx]

# Probar el modelo
input_text = "wor"
predicted_char = predict_next_char(model, input_text)
print(f"Entrada: '{input_text}' -> Siguiente carácter predicho: '{predicted_char}'")

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 127ms/step
Entrada: 'wor' -> Siguiente carácter predicho: 'l'
