<a href="https://colab.research.google.com/github/huugod06/mlp-simple/blob/main/notebooks/mlp_simple.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# === Cabecera del experimento ===
# Nombre y apellidos: HUGO DE DIOS BASANTA
# Fecha: (se establece automáticamente abajo)
# Propósito: Entrenar un perceptrón multicapa (MLP) para clasificar dígitos manuscritos (MNIST) y evaluar su rendimiento.

import time
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

# Configuración y reproducibilidad
np.random.seed(42)
tf.random.set_seed(42)

# Metadatos
NOMBRE = "HUGO DE DIOS BASANTA"
FECHA = "2006-03-05"
PROPOSITO = "Entrenar un MLP simple sobre MNIST, medir accuracy y guardar el modelo."

print("Información del entorno")
print("-" * 30)
print("Nombre y apellidos:", NOMBRE)
print("Fecha:", FECHA)
print("Propósito:", PROPOSITO)
print("TensorFlow:", tf.__version__)

# ===== Carga y preprocesado de datos =====
(X_train, y_train), (X_test, y_test) = keras.datasets.mnist.load_data()

# (Opcional) Submuestreo para entrenamientos rápidos en Colab
X_train, y_train = X_train[:10000], y_train[:10000]
X_test, y_test   = X_test[:2000],  y_test[:2000]

# Normalización a [0,1] y aplanado (28x28 -> 784)
X_train = X_train.astype("float32") / 255.0
X_test  = X_test.astype("float32")  / 255.0
X_train = X_train.reshape((-1, 28 * 28))
X_test  = X_test.reshape((-1, 28 * 28))

print("Shapes -> X_train:", X_train.shape, "y_train:", y_train.shape,
      "| X_test:", X_test.shape, "y_test:", y_test.shape)

# ===== Definición del modelo =====
model = keras.Sequential([
    layers.Input(shape=(784,)),
    layers.Dense(64, activation="relu"),
    layers.Dense(10, activation="softmax")
])

model.summary()

# ===== Compilación =====
model.compile(
    optimizer="adam",
    loss="sparse_categorical_crossentropy",
    metrics=["accuracy"]
)

# ===== Entrenamiento =====
history = model.fit(
    X_train, y_train,
    validation_split=0.1,
    epochs=5,
    batch_size=128,
    verbose=1
)

# ===== Evaluación =====
test_loss, test_acc = model.evaluate(X_test, y_test, verbose=0)
print(f"Test loss: {test_loss:.4f} | Test accuracy: {test_acc:.4f}")

# ===== Guardado del modelo (Paso 12) =====
save_path = "/content/mlp_model.h5"
model.save(save_path)
print("Modelo guardado en:", save_path)


Información del entorno
------------------------------
Nombre y apellidos: HUGO DE DIOS BASANTA
Fecha: 2006-03-05
Propósito: Entrenar un MLP simple sobre MNIST, medir accuracy y guardar el modelo.
TensorFlow: 2.19.0
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Shapes -> X_train: (10000, 784) y_train: (10000,) | X_test: (2000, 784) y_test: (2000,)


Epoch 1/5
[1m71/71[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 6ms/step - accuracy: 0.5724 - loss: 1.4814 - val_accuracy: 0.8920 - val_loss: 0.4532
Epoch 2/5
[1m71/71[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.8851 - loss: 0.4328 - val_accuracy: 0.9170 - val_loss: 0.3354
Epoch 3/5
[1m71/71[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.9114 - loss: 0.3197 - val_accuracy: 0.9200 - val_loss: 0.2960
Epoch 4/5
[1m71/71[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.9269 - loss: 0.2682 - val_accuracy: 0.9230 - val_loss: 0.2729
Epoch 5/5
[1m71/71[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.9353 - loss: 0.2337 - val_accuracy: 0.9240 - val_loss: 0.2555




Test loss: 0.3395 | Test accuracy: 0.9015
Modelo guardado en: /content/mlp_model.h5


In [None]:
# === Generar informe Markdown ===
import time

# Capturar el summary del modelo
summary_lines = []
model.summary(print_fn=lambda x: summary_lines.append(x))
summary_text = "\n".join(summary_lines)

# Datos del informe
autor = "HUGO DE DIOS BASANTA"
fecha_str = time.strftime("%Y-%m-%d %H:%M:%S")

report = f"""# Informe del experimento MLP
**Autor:** {autor}

## Arquitectura

## Métricas finales
- Test loss: {test_loss:.4f}
- Test accuracy: {test_acc:.4f}

## Fecha
{fecha_str}
"""

# Guardar el archivo en /content
with open("/content/report.md", "w") as f:
    f.write(report)

print("Informe creado en /content/report.md")


Informe creado en /content/report.md


In [11]:
import hashlib, csv, time, os, json

def sha256(path):
    h = hashlib.sha256()
    with open(path, "rb") as f:
        for chunk in iter(lambda: f.read(1024*1024), b""):
            h.update(chunk)
    return h.hexdigest()

# Guarda una copia del notebook actual para hashearlo
from google.colab import runtime
# En Colab, descarga manualmente el .ipynb o usa:
# Archivo -> Descargar .ipynb y súbelo como /content/mlp_simple.ipynb si quieres el hash exacto del repo.
# Para seguir, creamos un marcador vacío si no lo tienes:
if not os.path.exists("/content/mlp_simple.ipynb"):
    with open("/content/mlp_simple.ipynb","w") as f: f.write("{}")

hash_notebook = sha256("/content/mlp_simple.ipynb")
hash_model    = sha256("/content/mlp_model.h5")
hash_report   = sha256("/content/report.md")

print("SHA-256 notebook:", hash_notebook)
print("SHA-256 modelo  :", hash_model)
print("SHA-256 reporte :", hash_report)

with open("/content/ledger.csv", "w", newline="") as f:
    w = csv.writer(f)
    w.writerow(["archivo","hash","timestamp"])
    w.writerow(["notebooks/mlp_simple.ipynb", hash_notebook, int(time.time())])
    w.writerow(["model/mlp_model.h5",        hash_model,    int(time.time())])
    w.writerow(["docs/report.md",            hash_report,   int(time.time())])

print("Ledger: /content/ledger.csv")


SHA-256 notebook: 7d13938dc4970a0d7aed11034d7c74b49932df161f08326c2c5453d58fb446f9
SHA-256 modelo  : eafdd7a923d1ea8ae8807afdd12bc02b3b9389b97d1c999e3a4965b5f3a8a0ba
SHA-256 reporte : 7dd3a6dcc7139844307e36d17043a6486ea30bc01b425d68f08b475e7034410d
Ledger: /content/ledger.csv


# Reflexión final

**Autor:** HUGO DE DIOS BASANTA  
**Fecha:** {{pon aquí la fecha de hoy}}

## ¿Qué he entendido del MLP?
Un MLP (Perceptrón Multicapa) es una red neuronal feed-forward compuesta por capas: una de entrada, una o más **capas ocultas** con neuronas densas (p. ej., ReLU) y una **capa de salida** (p. ej., softmax para clasificación).  
Aprende ajustando pesos mediante **backpropagation** y **descenso de gradiente** (optimizer Adam en este experimento).  
En MNIST, aplanamos imágenes 28×28 → 784 características y el MLP aprende **representaciones no lineales** que separan las clases (dígitos 0–9). Aunque no explota la estructura espacial como una CNN, con un preprocesado simple puede alcanzar buenas **accuracies** en poco tiempo.

## ¿Qué significa reproducibilidad?
Reproducibilidad es poder **obtener los mismos resultados (o muy cercanos)** si alguien ejecuta el mismo código, con la misma configuración y datos.  
Implica:
- **Control de versiones** del código y de los artefactos (repo limpio).  
- **Semillas** fijas (np/tf) y registros de hiperparámetros.  
- Guardar dependencias/entorno (p. ej., versión de TensorFlow).  
- **Trazabilidad** de los resultados (logs, métricas, informes).

## ¿Qué aporta registrar hashes?
Registrar **hashes SHA-256** de los archivos clave (notebook, modelo, informe) garantiza:
- **Integridad**: si el archivo cambia, el hash ya no coincide.  
- **Trazabilidad y auditoría**: podemos demostrar qué versión exacta generó ciertos resultados.  
- **Reproducibilidad práctica**: comparar el archivo descargado desde GitHub con el `ledger.csv` confirma que trabajamos con la **misma** versión que se usó en el experimento.
