# Reconocimiento de Caracteres
#### Entrenamiento de un modelo con tensorflow y keras para reconocer caracteres escritos.

In [26]:
import tensorflow as tf
from tensorflow import keras
from keras import layers
import numpy as np
import pickle
import tensorflow_datasets as tfds

### Cargar los datos

In [27]:
def load_data():
    # Cargar los datos de entrenamiento y prueba del conjunto de datos emnist usando tensorflow_datasets
    ds_train, ds_test = tfds.load(
        'emnist/balanced',  # Nombre del conjunto de datos
        split=['train', 'test'],  # Dividir los datos en entrenamiento y prueba
        as_supervised=True,  # Cargar los datos como pares (input, label)
        batch_size=-1  # Cargar todos los datos en un solo lote
    )
    
    # Convertir los datos de entrenamiento a formato numpy
    (X_train, y_train) = tfds.as_numpy(ds_train)
    
    # Convertir los datos de prueba a formato numpy
    (X_test, y_test) = tfds.as_numpy(ds_test)

    # Rotar imágenes para corregir la orientación
    X_train = np.rot90(X_train, k=3, axes=(1, 2))
    X_test = np.rot90(X_test, k=3, axes=(1, 2))
    
    # Convertir los datos de entrenamiento a tipo float32 y normalizarlos dividiendo por 255
    X_train = X_train.astype("float32") / 255
    
    # Convertir los datos de prueba a tipo float32 y normalizarlos dividiendo por 255
    X_test = X_test.astype("float32") / 255
    
    # Devolver los datos de entrenamiento y prueba
    return X_train, y_train, X_test, y_test

### Entrenar el modelo

In [28]:
def train_model():
    # Cargar los datos de entrenamiento y prueba utilizando la función load_data
    X_train, y_train, X_test, y_test = load_data()

    # Crear un modelo secuencial de Keras
    model = keras.models.Sequential([ #Inicia la red neuronal
        # Añadir una capa de entrada que aplana las imágenes de 2D a 1D
        layers.Flatten(input_shape=(28, 28)),
        # Añadir una capa densa con 256 neuronas y función de activación relu
        layers.Dense(256, activation='relu'),
        # Añadir una capa de Dropout para reducir el sobreajuste
        layers.Dropout(0.3),
        # Añadir una capa densa con 128 neuronas y función de activación relu
        layers.Dense(128, activation='relu'),
        layers.Dropout(0.3),
        # Añadir una capa densa con 47 neuronas (una por cada clase) y función de activación softmax
        layers.Dense(47, activation='softmax')
    ])
    
    # Compilar el modelo con el optimizador, función de pérdida y métrica
    model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
    
    # Entrenar el modelo con los datos de entrenamiento durante 5 épocas y validar con los datos de prueba
    model.fit(X_train, y_train, epochs=30, validation_data=(X_test, y_test))
    
    # Devolver el modelo entrenado
    return model

### Guardar el modelo

In [29]:
model = train_model()
model.save("model.h5")

Epoch 1/30
[1m3525/3525[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 4ms/step - accuracy: 0.5086 - loss: 1.7443 - val_accuracy: 0.7773 - val_loss: 0.7080
Epoch 2/30
[1m3525/3525[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 3ms/step - accuracy: 0.7267 - loss: 0.8651 - val_accuracy: 0.7997 - val_loss: 0.6028
Epoch 3/30
[1m3525/3525[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 4ms/step - accuracy: 0.7564 - loss: 0.7609 - val_accuracy: 0.8157 - val_loss: 0.5718
Epoch 4/30
[1m3525/3525[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 3ms/step - accuracy: 0.7742 - loss: 0.6966 - val_accuracy: 0.8194 - val_loss: 0.5433
Epoch 5/30
[1m3525/3525[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 3ms/step - accuracy: 0.7773 - loss: 0.6755 - val_accuracy: 0.8241 - val_loss: 0.5338
Epoch 6/30
[1m3525/3525[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 4ms/step - accuracy: 0.7819 - loss: 0.6528 - val_accuracy: 0.8317 - val_loss: 0.5113
Epoch 7/30

