#  Configuración inicial
En esta sección:
- Se cargan los datos MNIST.
- Se normalizan las imágenes.
- Se preparan las etiquetas en formato one-hot.
- Se importa TensorFlow 2.12+ y las librerías necesarias.


In [4]:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.utils import to_categorical
import matplotlib.pyplot as plt
import time

print("Versión de TensorFlow:", tf.__version__)

# Cargar dataset MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Normalizar imágenes
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0

# One-hot encoding
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

print("Datos listos para el entrenamiento.")

Versión de TensorFlow: 2.20.0-rc0
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 0us/step
Datos listos para el entrenamiento.


# Ejercicio 1 – Modificación del ancho de la red
En este ejercicio:
- Se entrena una red neuronal simple variando el tamaño de la capa oculta (50, 100, 200, 300, 500 neuronas).
- Se mide la precisión de validación y el tiempo de entrenamiento.


In [5]:
hidden_sizes = [50, 100, 200, 300, 500]
results_ex1 = []

for size in hidden_sizes:
    model = Sequential([
        Flatten(input_shape=(28, 28)),
        Dense(size, activation='relu'),
        Dense(10, activation='softmax')
    ])
    
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    
    start = time.time()
    history = model.fit(x_train, y_train, epochs=5, batch_size=32, validation_data=(x_test, y_test), verbose=0)
    end = time.time()
    
    val_acc = history.history['val_accuracy'][-1]
    results_ex1.append((size, val_acc, end - start))

print("Resultados ejercicio 1:")
for r in results_ex1:
    print(f"Neuronas: {r[0]}, Precisión: {r[1]:.4f}, Tiempo: {r[2]:.2f} seg")


  super().__init__(**kwargs)


KeyboardInterrupt: 

# Ejercicio 2 – Modificación de la profundidad de la red
En este ejercicio:
- Se agrega una segunda capa oculta al modelo.
- Se compara la precisión de validación y el tiempo de entrenamiento con el modelo original.


In [None]:
model = Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(200, activation='relu'),
    Dense(100, activation='relu'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

start = time.time()
history_ex2 = model.fit(x_train, y_train, epochs=5, batch_size=32, validation_data=(x_test, y_test), verbose=1)
end = time.time()

print("Precisión de validación:", history_ex2.history['val_accuracy'][-1])
print("Tiempo de entrenamiento:", end - start, "segundos")


# Ejercicio 3 – Redes profundas
En este ejercicio:
- Se entrena la red con hasta 5 capas ocultas.
- Se ajustan los tamaños de capa y se observa la precisión y el tiempo de entrenamiento.


In [None]:
depth_configurations = [
    [200, 100],
    [200, 150, 100],
    [256, 128, 64, 32],
    [256, 200, 150, 100, 50]
]

results_ex3 = []

for config in depth_configurations:
    model = Sequential()
    model.add(Flatten(input_shape=(28, 28)))
    
    for units in config:
        model.add(Dense(units, activation='relu'))
    
    model.add(Dense(10, activation='softmax'))
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    
    start = time.time()
    history = model.fit(x_train, y_train, epochs=5, batch_size=32, validation_data=(x_test, y_test), verbose=0)
    end = time.time()
    
    results_ex3.append((config, history.history['val_accuracy'][-1], end - start))

print("Resultados ejercicio 3:")
for r in results_ex3:
    print(f"Capas: {r[0]}, Precisión: {r[1]:.4f}, Tiempo: {r[2]:.2f} seg")


# Ejercicio 4 – Funciones de activación I (Sigmoidal)
En este ejercicio:
- Se cambia la función de activación de todas las capas ocultas a `sigmoid`.
- Se compara su precisión y tiempo de entrenamiento con el modelo original.


In [None]:
model = Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(200, activation='sigmoid'),
    Dense(100, activation='sigmoid'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
history_ex4 = model.fit(x_train, y_train, epochs=5, batch_size=32, validation_data=(x_test, y_test), verbose=1)

print("Precisión de validación:", history_ex4.history['val_accuracy'][-1])


# Ejercicio 5 – Funciones de activación II (ReLU y tanh)
En este ejercicio:
- Se utiliza `ReLU` en la primera capa y `tanh` en la segunda.
- Se comparan los resultados con configuraciones anteriores.

In [None]:
model = Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(200, activation='relu'),
    Dense(100, activation='tanh'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
history_ex5 = model.fit(x_train, y_train, epochs=5, batch_size=32, validation_data=(x_test, y_test), verbose=1)

print("Precisión de validación:", history_ex5.history['val_accuracy'][-1])


# Ejercicio 6 – Tamaño de batch grande
En este ejercicio:
- Se incrementa el tamaño de batch a 10,000.
- Se analiza el impacto en el tiempo de entrenamiento y la precisión.


In [None]:
model = Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(200, activation='relu'),
    Dense(100, activation='relu'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

start = time.time()
history_ex6 = model.fit(x_train, y_train, epochs=5, batch_size=10000, validation_data=(x_test, y_test), verbose=1)
end = time.time()

print("Precisión de validación:", history_ex6.history['val_accuracy'][-1])
print("Tiempo de entrenamiento:", end - start, "segundos")
