AF 7: Redes Neuronales Artificiales



In [16]:
# AF7: Redes Neuronales Artificiales

# IMC	2003759	Nicolás Israel García Aldana  N4
# IMC	2177765	Aldrin Emmanuel Naranjo Hernández N4
# IMC	2063766	Alan Javier Peña Puente N4
# IMC	2065133	Brian Alexis Medrano Franco N4
# IMC	1992270	Iván Alejandro Alvarado Segovia N5

1.-Cargamos las librerías

In [10]:
# Importar librerías necesarias
import numpy as np
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.utils import to_categorical

# Fijar semilla para reproducibilidad (opcional)
np.random.seed(42)
tf.random.set_seed(42)

2.-Cargamos y procesamos el conjunto de datos (que contiene las imágenes con números del 0 al 9)

In [11]:
# Cargar el conjunto de datos MNIST (divide en entrenamiento y prueba)
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# 1. Normalización de las imágenes: convertir a flotantes y escalar de 0 a 1
# Las imágenes son 28x28 píxeles con valores de 0 a 255.
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255

# 2. Codificación one-hot de las etiquetas: esencial para 'categorical_crossentropy'
# Convierte un dígito (ej: 5) en un vector binario (ej: [0,0,0,0,0,1,0,0,0,0])
train_labels_one_hot = to_categorical(train_labels, num_classes=10)
test_labels_one_hot = to_categorical(test_labels, num_classes=10)

print(f"Imágenes de entrenamiento: {train_images.shape}")
print(f"Etiquetas one-hot de prueba: {test_labels_one_hot.shape}")

Imágenes de entrenamiento: (60000, 28, 28)
Etiquetas one-hot de prueba: (10000, 10)


3.-Definimos y compilamos el modelo

In [12]:
# Definición de la estructura de la Red Neuronal Prealimentada (FFNN)
model = Sequential([
    # Capa 1: Flatten. Aplanar la imagen de 28x28 a un vector de 784
    Flatten(input_shape=(28, 28)),

    # Capa 2 (Oculta): Capa Densa (Fully Connected)
    Dense(128, activation='relu'),

    # Capa 3 (Salida): 10 unidades (una por clase), con activación Softmax
    Dense(10, activation='softmax')
])

# Compilación del modelo
# Función de pérdida: 'categorical_crossentropy' para clasificación multi-clase con one-hot
# Optimizador: 'adam'
# Métrica: 'accuracy' (exactitud)
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

print("Estructura del modelo:")
model.summary()

Estructura del modelo:


4.-Entrenamiento del modelo

In [13]:
print("Iniciando el entrenamiento...")

# Entrenamiento del modelo
history = model.fit(train_images,
                    train_labels_one_hot,
                    epochs=10,        # Número de épocas
                    batch_size=32,    # Tamaño del lote
                    verbose=1)

print("Entrenamiento finalizado.")

Iniciando el entrenamiento...
Epoch 1/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 6ms/step - accuracy: 0.8773 - loss: 0.4288
Epoch 2/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 5ms/step - accuracy: 0.9638 - loss: 0.1251
Epoch 3/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 6ms/step - accuracy: 0.9770 - loss: 0.0807
Epoch 4/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 7ms/step - accuracy: 0.9832 - loss: 0.0580
Epoch 5/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 6ms/step - accuracy: 0.9874 - loss: 0.0425
Epoch 6/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 6ms/step - accuracy: 0.9909 - loss: 0.0314
Epoch 7/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 6ms/step - accuracy: 0.9936 - loss: 0.0230
Epoch 8/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 5ms/step - accuracy: 0.9950 -

5.-Evaluamos el modelo

In [14]:
print("Evaluando el modelo con el conjunto de prueba...")

# Uso de la función 'evaluate'
# Devuelve la pérdida (loss) y las métricas (accuracy)
loss, accuracy = model.evaluate(test_images, test_labels_one_hot, verbose=0)

print(f'\n================================================')
print(f'| Exactitud (Accuracy) en datos de prueba: {accuracy*100:.2f}% |')
print(f'================================================')

Evaluando el modelo con el conjunto de prueba...

| Exactitud (Accuracy) en datos de prueba: 97.74% |


6.-Hacemos las 5 predicciones

In [15]:
print("Realizando 5 predicciones al azar...")

# Seleccionamos 5 índices aleatorios del conjunto de prueba
indices = np.random.choice(len(test_images), 5, replace=False)

print("\n| Índice de Prueba | Predicción | Valor Real | Confianza (%) |")
print("|------------------|------------|------------|---------------|")

for i in indices:
    # 1. Obtenemos la imagen y reformarla para 'predict'
    img_to_predict = test_images[i:i+1]

    # 2. Predecir (obtiene un array de probabilidades)
    predictions = model.predict(img_to_predict, verbose=0)

    # 3. La clase predicha es el índice con la mayor probabilidad
    predicted_label = np.argmax(predictions[0])

    # 4. Obtenemos el valor real (etiqueta original sin one-hot)
    true_label = test_labels[i]

    # 5. Obtenemos la confianza (probabilidad más alta)
    confidence = np.max(predictions[0]) * 100

    # Mostrar el resultado
    print(f"| {i:<16} | {predicted_label:<10} | {true_label:<10} | {confidence:.2f} % |")

Realizando 5 predicciones al azar...

| Índice de Prueba | Predicción | Valor Real | Confianza (%) |
|------------------|------------|------------|---------------|
| 6252             | 6          | 6          | 100.00 % |
| 4684             | 2          | 2          | 100.00 % |
| 1731             | 3          | 3          | 100.00 % |
| 4742             | 7          | 7          | 100.00 % |
| 4521             | 2          | 2          | 100.00 % |
