In [17]:
import numpy as np
import tensorflow as tf

# 1. Cargar el dataset MNIST desde TensorFlow
# El dataset de MNIST contiene imágenes de 28x28 píxeles y etiquetas que corresponden a los dígitos 0-9
(X_train, Y_train), (X_test, Y_test) = tf.keras.datasets.mnist.load_data()

# Normalizamos las imágenes a valores entre 0 y 1
X_train = X_train / 255.0
X_test = X_test / 255.0

# Redimensionamos las imágenes de 28x28 a un vector de 784 elementos (28 * 28)
X_train = X_train.reshape(-1, 784)
X_test = X_test.reshape(-1, 784)

# Convertimos las etiquetas a formato one-hot (10 clases: 0-9)
Y_train = np.eye(10)[Y_train]
Y_test = np.eye(10)[Y_test]

# 2. Inicialización de los pesos y sesgos
# Capa 1: de 784 (entrada) a 128 neuronas (capa oculta)
W1 = np.random.randn(784, 128) * 0.01  # Peso de la capa de entrada a la capa oculta
b1 = np.zeros((1, 128))  # Sesgo de la capa oculta

# Capa 2: de 128 neuronas (capa oculta) a 10 neuronas (capa de salida)
W2 = np.random.randn(128, 10) * 0.01  # Peso de la capa oculta a la capa de salida
b2 = np.zeros((1, 10))  # Sesgo de la capa de salida

# 3. Definir funciones de activación

def relu(x):
    return np.maximum(0, x)  # ReLU

def softmax(x):
    e_x = np.exp(x - np.max(x, axis=1, keepdims=True))  # Estabilidad numérica
    return e_x / np.sum(e_x, axis=1, keepdims=True)  # Softmax

# 4. Función de entropía cruzada para calcular la pérdida
def cross_entropy_loss(y_true, y_pred):
    m = y_true.shape[0]  # Número de ejemplos
    loss = -np.sum(y_true * np.log(y_pred)) / m  # Fórmula de entropía cruzada
    return loss

# 5. Función para entrenamiento
def train(X_train, Y_train, epochs=10, learning_rate=0.01):
    global W1, b1, W2, b2
    for epoch in range(epochs):
        # Propagación hacia adelante
        z1 = np.dot(X_train, W1) + b1  # Capa oculta: Z = X * W + b
        a1 = relu(z1)  # Activación ReLU

        z2 = np.dot(a1, W2) + b2  # Capa de salida: Z = A1 * W + b
        a2 = softmax(z2)  # Activación Softmax

        # Calcular la pérdida
        loss = cross_entropy_loss(Y_train, a2)

        # Retropropagación
        dz2 = a2 - Y_train  # Derivada de la entropía cruzada con respecto a la activación de la capa de salida
        dW2 = np.dot(a1.T, dz2) / X_train.shape[0]  # Gradiente de los pesos de la capa de salida
        db2 = np.sum(dz2, axis=0, keepdims=True) / X_train.shape[0]  # Gradiente de los sesgos de la capa de salida

        dz1 = np.dot(dz2, W2.T) * (z1 > 0)  # Derivada de ReLU
        dW1 = np.dot(X_train.T, dz1) / X_train.shape[0]  # Gradiente de los pesos de la capa oculta
        db1 = np.sum(dz1, axis=0, keepdims=True) / X_train.shape[0]  # Gradiente de los sesgos de la capa oculta

        # Actualización de pesos y sesgos
        W1 -= learning_rate * dW1  # Actualización de W1
        b1 -= learning_rate * db1  # Actualización de b1

        W2 -= learning_rate * dW2  # Actualización de W2
        b2 -= learning_rate * db2  # Actualización de b2

        # Mostrar el progreso cada 100 épocas
        #if epoch % 100 == 0:
        print(f"Epoch {epoch}/{epochs}, Pérdida: {loss:.4f}")

# 6. Entrenar la red
train(X_train, Y_train, epochs=200, learning_rate=0.1)

# 7. Evaluar el modelo
# Propagación hacia adelante para las imágenes de prueba
z1_test = np.dot(X_test, W1) + b1
a1_test = relu(z1_test)

z2_test = np.dot(a1_test, W2) + b2
a2_test = softmax(z2_test)

# Predecir las clases
predictions = np.argmax(a2_test, axis=1)

# Comparar con las etiquetas verdaderas
accuracy = np.mean(np.argmax(Y_test, axis=1) == predictions)
print(f"Precisión en el conjunto de prueba: {accuracy * 100:.2f}%")



Epoch 0/200, Pérdida: 2.3025
Epoch 1/200, Pérdida: 2.3014
Epoch 2/200, Pérdida: 2.3003
Epoch 3/200, Pérdida: 2.2991
Epoch 4/200, Pérdida: 2.2979
Epoch 5/200, Pérdida: 2.2967
Epoch 6/200, Pérdida: 2.2954
Epoch 7/200, Pérdida: 2.2940
Epoch 8/200, Pérdida: 2.2926
Epoch 9/200, Pérdida: 2.2911
Epoch 10/200, Pérdida: 2.2895
Epoch 11/200, Pérdida: 2.2877
Epoch 12/200, Pérdida: 2.2859
Epoch 13/200, Pérdida: 2.2839
Epoch 14/200, Pérdida: 2.2818
Epoch 15/200, Pérdida: 2.2795
Epoch 16/200, Pérdida: 2.2770
Epoch 17/200, Pérdida: 2.2743
Epoch 18/200, Pérdida: 2.2714
Epoch 19/200, Pérdida: 2.2683
Epoch 20/200, Pérdida: 2.2649
Epoch 21/200, Pérdida: 2.2612
Epoch 22/200, Pérdida: 2.2573
Epoch 23/200, Pérdida: 2.2530
Epoch 24/200, Pérdida: 2.2485
Epoch 25/200, Pérdida: 2.2435
Epoch 26/200, Pérdida: 2.2382
Epoch 27/200, Pérdida: 2.2324
Epoch 28/200, Pérdida: 2.2263
Epoch 29/200, Pérdida: 2.2197
Epoch 30/200, Pérdida: 2.2126
Epoch 31/200, Pérdida: 2.2050
Epoch 32/200, Pérdida: 2.1969
Epoch 33/200, Pérdid