In [1]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Flatten, Dense
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler

(x, y), _ = tf.keras.datasets.mnist.load_data()
x_reshaped = x.reshape(-1, 28 * 28)
scaler = MinMaxScaler()
x_scaled = scaler.fit_transform(x_reshaped)
x_scaled = x_scaled.reshape(-1, 28, 28)

x_train, x_test, y_train, y_test = train_test_split(x_scaled, y, test_size=0.3, random_state=42)

model = Sequential([
    Input(shape=(28, 28)),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5, batch_size=32, validation_split=0.1)

test_loss, test_accuracy = model.evaluate(x_test, y_test)
print(f'\nPrecisión en prueba: {test_accuracy:.4f}')

y_pred = model.predict(x_test)
y_pred_classes = tf.argmax(y_pred, axis=1).numpy()

print("\nReporte de clasificación:")
print(classification_report(y_test, y_pred_classes, digits=4))


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Epoch 1/5
[1m1182/1182[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 6ms/step - accuracy: 0.8511 - loss: 0.5185 - val_accuracy: 0.9500 - val_loss: 0.1607
Epoch 2/5
[1m1182/1182[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 5ms/step - accuracy: 0.9605 - loss: 0.1339 - val_accuracy: 0.9595 - val_loss: 0.1313
Epoch 3/5
[1m1182/1182[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 5ms/step - accuracy: 0.9736 - loss: 0.0821 - val_accuracy: 0.9643 - val_loss: 0.1031
Epoch 4/5
[1m1182/1182[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 4ms/step - accuracy: 0.9807 - loss: 0.0618 - val_accuracy: 0.9676 - val_loss: 0.1019
Epoch 5/5
[1m1182/1182[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 5ms/step - accuracy: 0.9856 - loss: 0.0474 - val_accuracy: 0.9681 - val_loss: 0.1039
[1m563/

Para este ejercicio decidi ir con el mnist de keras que incluye imagenes de numeros y sus etiquetas, al ser un ejemplo sencillo. La eleccion de el numero de capaz y funciones de activacion y error fueron segun lo que encontre es lo estandar para este caso, un problema de clasificaicon, primero la primer neurona recibe la imagen de 28*28 pixeles que es aplanada en un vector de 784 variables, cada pixel siendo una. De aqui se pasa  ala primer capa, con 128 neuronas, la eleccion de este numero se debe a 2 razones, la primera, las GPU tienden a estar mejor optimizadas cuando se usa un numero de neuronas multiplo, de , y 128 funciona como un buen punto medio inicial, menos neuronas haria que no se pueda captar dettales mas complejos, mientras que mas podria provocar overfitting. En cuanto a la funcion se fue con relu, funcion que simplemente cambia a 0 cualquier valor negativo , al no tener un rango definido como la sigmoide, esta introduce no linealidad y permite en analisisde caracteristicas mas complejas.   La segunda capa es igual a la primera, pero con la mitad de la primera, se acostumbra a reducir las neuronas en subsecuentes capaz para enfocarse en detalles mas relevantes.   Por ultimo la capade salidas posee 10 neuronas y usa la funcion softmax, esta funcion esta especializada en calcular las probabilidades de que el dato de entrada pertenesca a una clase, de modod que todas sumen 1, cada neurona corresponde a una clase. Para la funcion de error se uso otra especializada en casos de clasificacion, en cuanto a por que se uso 2 capas ocultas, simplemente este es el numero que dio mejores reusltados sin causar overfitting