<a href="https://colab.research.google.com/github/DANCAR1969/programacion/blob/master/CLASIFICACION_PASO_PASO.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

 Es un ejemplo clásico de aprendizaje supervisado de clasificación ya que este código entrena una red neuronal para reconocer dígitos escritos a mano (del 0 al 9), usando el conjunto de datos MNIST.

 Primero carga y normaliza las imágenes, luego construye un modelo con capas densas, lo entrena con datos etiquetados, y finalmente evalúa su precisión. También muestra ejemplos visuales con la etiqueta real y la predicción realizada por el modelo.

Paso 1: Importar librerías

In [None]:
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np

tensorflow: Biblioteca de Machine Learning que permite crear, entrenar y evaluar modelos.

matplotlib.pyplot: Para visualizar imágenes de los dígitos.

numpy: Para operaciones numéricas, especialmente matrices y vectores.

Paso 2: Cargar el dataset de MNIST

In [None]:
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

Se importa el dataset MNIST directamente desde tensorflow.keras.datasets.

Este dataset contiene:

x_train: 60,000 imágenes (28x28 píxeles) para entrenar.

y_train: Etiquetas (números del 0 al 9) para esas imágenes.

x_test: 10,000 imágenes nuevas para evaluar el modelo.

y_test: Etiquetas verdaderas para comparar contra la predicción.

Paso 3: Normalizar las imágenes

In [None]:
x_train, x_test = x_train / 255.0, x_test / 255.0

Cada pixel tiene un valor entre 0 y 255. Lo dividimos por 255 para que esté entre 0 y 1.

Esto mejora la velocidad y precisión del entrenamiento (mejor comportamiento del gradiente descendente).

Paso 4: Crear el modelo

In [None]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(10, activation='softmax')
])

Sequential: Es una pila lineal de capas (input → hidden → output).

Flatten: Convierte la imagen 28x28 (matriz) en un vector de 784 elementos.

Dense(128, activation='relu'): Capa totalmente conectada con 128 neuronas y función ReLU (activa solo valores positivos).

Dropout(0.2): Apaga aleatoriamente el 20% de las neuronas durante cada paso de entrenamiento, para evitar sobreajuste.

Dense(10, activation='softmax'): Capa de salida con 10 neuronas (una por dígito). softmax convierte la salida en probabilidades que suman 1.

Paso 5: Compilar el modelo

In [None]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])


optimizer='adam': Algoritmo eficiente de ajuste de pesos (aprendizaje).

loss='sparse_categorical_crossentropy': Función de pérdida para clasificación multiclase con etiquetas enteras (0 al 9).

metrics=['accuracy']: Se mide la precisión como métrica de evaluación.



Paso 6: Entrenar el modelo

In [None]:
model.fit(x_train, y_train, epochs=5)


El modelo ajusta sus pesos para aprender a predecir correctamente.

Se entrena durante 5 épocas (vueltas completas al conjunto de entrenamiento).

Internamente realiza miles de iteraciones (batches) para mejorar.

Paso 7: Evaluar el modelo

In [None]:
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print('\nPrecisión en el conjunto de prueba:', test_acc)


Se evalúa el modelo con datos que nunca ha visto.

test_loss: Muestra qué tan lejos están las predicciones del valor real.

test_acc: Precisión final del modelo en el conjunto de prueba.

Paso 8: Mostrar predicciones con imágenes

In [None]:
predictions = model.predict(x_test)


El modelo predice probabilidades para cada clase (0 al 9).

Se obtiene un array de 10 probabilidades por imagen.

In [None]:
for i in range(5): # LINE1
    plt.figure() #LINE2
    plt.imshow(x_test[i], cmap=plt.cm.binary) #LINE3
    plt.title(f"Etiqueta Real: {y_test[i]} - Predicción: {np.argmax(predictions[i])}") #LINE 4
    plt.show() # LINE 5


LINE1: Esta línea crea un bucle for que se ejecutará 5 veces, con i tomando los valores del 0 al 4. Para mostrar las primeras 5 imágenes del conjunto de prueba (x_test) junto con:

Su etiqueta real (y_test[i])
Su predicción del modelo (predictions[i])

LINE2: Esta línea crea una nueva figura de Matplotlib.
Es necesaria para que cada imagen se muestre en una ventana/gráfico diferente, evitando que se sobrepongan.

LINE3: x_test[i]: Es una imagen en formato de matriz (por ejemplo, 28x28 píxeles si es MNIST).

imshow(): Función que muestra una imagen en escala de grises o colores.

cmap=plt.cm.binary: Se usa un colormap binario, que renderiza la imagen en blanco y negro (útil para imágenes de dígitos).

LINE4:Agrega un título encima de la imagen, con información de:

Etiqueta real: y_test[i] (por ejemplo, el dígito correcto que debería ser).

Predicción del modelo: np.argmax(predictions[i])

predictions[i] contiene las probabilidades de cada clase (ejemplo: [0.1, 0.05, 0.8, ...]).

np.argmax() devuelve el índice de la clase con mayor probabilidad, es decir, la predicción final del modelo.

LINE5: Muestra la figura en pantalla.
Esta línea es necesaria en Google Colab y otros notebooks para que el gráfico aparezca correctamente.

