Fashion-MNIST es un conjunto de datos utilizado comúnmente en el campo del aprendizaje automático y la visión por computadora. Es una variante del conjunto de datos MNIST (Modified National Institute of Standards and Technology) original, que es ampliamente utilizado para ejemplos y pruebas en el campo del aprendizaje automático. Mientras que el MNIST original contiene imágenes de dígitos escritos a mano (0 a 9), Fashion-MNIST se compone de imágenes de artículos de moda.

Características principales de Fashion-MNIST:

Imágenes: Contiene 70,000 imágenes en escala de grises. Cada imagen tiene una resolución de 28x28 píxeles.

Categorías: Hay 10 categorías de ropa y accesorios, como camisetas/tops, pantalones, abrigos, vestidos, zapatillas, etc.

Conjunto de datos dividido: Se divide típicamente en un conjunto de entrenamiento de 60,000 imágenes y un conjunto de prueba de 10,000 imágenes.

Propósito: Fue creado como un reemplazo más desafiante para el conjunto de datos MNIST original. Las categorías de ropa presentan una complejidad mayor en comparación con los dígitos escritos a mano del MNIST.

Uso en TensorFlow: En TensorFlow, se utiliza comúnmente para demostrar algoritmos de clasificación y redes neuronales. Se puede cargar fácilmente utilizando las API de TensorFlow.

Fashion-MNIST es especialmente útil para aquellos que comienzan en el campo del aprendizaje automático, ya que proporciona un conjunto de datos más interesante y desafiante que el MNIST original, pero sigue siendo lo suficientemente pequeño y manejable para experimentos y pruebas rápidas.







In [None]:
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Conv2D, Flatten, Dropout, MaxPooling2D

In [None]:
#cargar datos
(train_images, train_labels), (test_images, test_labels)=fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [None]:
#normalizar los datos
# este código normaliza los datos de las imágenes de entrenamiento y prueba
# dividiéndolos por 255. Esto transforma los valores de los píxeles de un rango
# de 0-255 a un rango de 0-1, facilitando el proceso de aprendizaje del modelo.
#Estas imágenes suelen estar en formato de píxeles, donde cada píxel tiene un
#valor de 0 a 255, representando la intensidad de la luz o el color.
train_images=train_images/255.0
test_images=test_images/255.0

In [None]:
#resimensionar imagenes para el modelo

# Este código se utiliza para cambiar el formato de dos arrays de imágenes,
# train_images y test_images, a un formato compatible con una red neuronal
# convolucional (CNN).

# Formato original:

# Tanto train_images como test_images se almacenan inicialmente en un formato
# que no es adecuado para el procesamiento por una CNN. Cada imagen es una matriz
# de píxeles gris de 28x28, lo que resulta en un array de 28x28x1. Esto significa
# que cada imagen se representa por un array aplanado de 784 píxeles.

# Formato redimensionado:

# La función reshape() se utiliza para cambiar la forma de cada array de imagen a
# un formato compatible con una CNN. La nueva forma es (-1, 28, 28, 1). El -1 en
# la primera dimensión significa que esta dimensión debe calcularse dinámicamente
# en función del número de imágenes en el array. Las dimensiones
# restantes (28, 28, 1) representan el ancho, la altura y el número de canales de
# cada imagen.

#-1, 28, 28, 1) especifica la nueva forma que queremos para el conjunto de datos.
# El -1 es un comodín que le dice a Python que ajuste automáticamente esta
# dimensión en base a las otras dimensiones y al tamaño total del conjunto de
# datos. Esto es útil cuando no sabemos cuántas imágenes hay en train_images,
# pero queremos que todas tengan la misma forma.
# 28, 28 significa que cada imagen será reajustada para tener 28 píxeles de ancho
# por 28 píxeles de alto.
# El 1 al final indica que las imágenes son en escala de grises (un solo canal).
# Si las imágenes fueran a color (RGB), este número sería 3, representando los
#canales rojo, verde y azul.

train_images=train_images.reshape((-1, 28, 28, 1))
test_images=test_images.reshape((-1, 28, 28, 1))

In [None]:
#construir el modelo
# El código model define un modelo de red
# neuronal convolucional (CNN) para la tarea de reconocimiento de dígitos escritos
# a mano MNIST. Se construye utilizando la API secuencial de Keras, que permite
# apilar capas de forma secuencial.

# Explicación de las capas:

# Conv2D: Esta capa realiza la convolución, la operación fundamental en las CNN.
# Toma 32 filtros de tamaño 3x3, aplica una función de activación ReLU (unidad
# lineal rectificada) para introducir no linealidad, y especifica la forma de
# entrada de los datos (imágenes en escala de grises de 28x28).

# MaxPooling2D: Esta capa reduce las dimensiones espaciales de los mapas de
# características mediante la realización de una agrupación máxima sobre regiones
# de 2x2. Esto ayuda a reducir la complejidad computacional y el sobreajuste.

# Dropout: Esta capa elimina aleatoriamente el 25% de las neuronas durante el
# entrenamiento, evitando el sobreajuste al hacer que el modelo sea menos sensible
# a las neuronas individuales.

# Conv2D: Otra capa convolucional con 64 filtros de tamaño 3x3 y activación ReLU.

# MaxPooling2D: Otra capa de agrupación máxima para reducir dimensiones.

# Dropout: Otra capa de abandono con una tasa de abandono del 25%.

# Flatten: Esta capa convierte los mapas de características 2D en un vector 1D,
# preparando los datos para las capas totalmente conectadas. Los mapas de
# características en redes neuronales profundas son representaciones intermedias
# generadas al aplicar filtros a la entrada o a los mapas de características de
# capas anteriores. Estos mapas son esenciales para que la red extraiga y aprenda
# características progresivamente más complejas y útiles de los datos de entrada.
#Los mapas de características en redes neuronales, especialmente en las redes
# neuronales convolucionales (CNNs), se pueden entender como matrices. Sin embargo,
# es importante tener en cuenta que son matrices tridimensionales. Te explicaré
# esto con más detalle:
#los mapas de características en CNNs empiezan como matrices bidimensionales
# para imágenes en escala de grises, pero rápidamente se convierten en estructuras
# tridimensionales a medida que se aplican múltiples filtros, especialmente en el
# procesamiento de imágenes a color y en las capas sucesivas de la red.


# Dense: Esta capa realiza operaciones completamente conectadas (FC), conectando
# esencialmente todas las neuronas de la capa anterior con todas las neuronas de
# esta capa. Tiene 128 neuronas y una función de activación ReLU.

# Dense: La capa final es otra capa FC con 10 neuronas, que representan los 10
# posibles prendas de ropa (0-9). Utiliza una función de activación
# softmax, que aplasta la salida en probabilidades, indicando la probabilidad
# de cada clase.

# En resumen, este modelo CNN utiliza capas convolucionales (Conv2D) para la extracción
# de características, capas de agrupación(MaxPooling2D) para la reducción de la dimensionalidad,
# capas de abandono (Dropout) para evitar el sobreajuste, Las capas "Flatten" en una red
# neuronal convolucional (CNN) tienen un propósito muy específico y crucial. Estas
# capas se utilizan para convertir los mapas de características tridimensionales
# obtenidos de las capas convolucionales y de agrupamiento (MaxPooling2D) en un vector
# unidimensional y capas (Dense) totalmente conectadas para
# la clasificación. Es un modelo bien estructurado adecuado para la tarea MNIST,
# logrando una alta precisión en el reconocimiento de prendas de ropa.

model=Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),
    MaxPooling2D(2,2),
    Dropout(0.25),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D(2,2),
    Dropout(0.25),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

In [None]:
#compilar el modelo
#El compile es un método que configura el modelo para el entrenamiento. En esta
#etapa, se definen varios parámetros clave que controlan cómo el modelo aprenderá
#de los datos.
#Antes de que el modelo pueda ser entrenado, necesita ser compilado.
#En resumen, este código está preparando un modelo de aprendizaje automático
# para el entrenamiento. Selecciona 'Adam' como el método de optimización, usa la
# 'sparse categorical crossentropy' como la función de pérdida para un problema de
# clasificación multiclase, y seguirá la 'precisión' o 'accuracy' como métrica
# para evaluar el rendimiento del modelo.

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
#entrenar el modelo
#train_images, train_labels:

# train_images contiene las imágenes de entrenamiento. Estas son los datos que el
# modelo usará para aprender.
# train_labels contiene las etiquetas correspondientes a train_images. Estas e
# tiquetas son la "respuesta correcta" o el resultado que el modelo intentará
# predecir. En un escenario de clasificación, por ejemplo, cada imagen tendría una
# etiqueta que indica su categoría.

# epochs=3:
# Un 'epoch' es una iteración completa sobre todo el conjunto de datos de entrenamiento.
# epochs=3 significa que el conjunto completo de datos de entrenamiento se pasará
# por el modelo un total de tres veces. Cada epoch permite que el modelo aprenda
# más sobre los datos, pero más epochs también pueden llevar a un sobreajuste,
# donde el modelo se ajusta demasiado a los datos de entrenamiento y no generaliza
# bien a nuevos datos.

# validation_split=0.2:
# Esta opción divide los datos de entrenamiento en dos partes: una para el
# entrenamiento real y otra para la validación.
# 0.2 significa que el 20% de los datos de entrenamiento se separan para la
# validación. Esto no se utiliza para entrenar el modelo, sino para evaluar su
# rendimiento en datos que no ha visto durante el entrenamiento. Es una buena
# práctica para comprobar si hay sobreajuste.

model.fit(train_images, train_labels, epochs=3, validation_split=0.2)

Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.src.callbacks.History at 0x7a3fc0538df0>

In [None]:
#evaluar el modelo
#model.evaluate(...):

# model es tu modelo de aprendizaje automático, que ya ha sido entrenado con datos
# de entrenamiento.
# .evaluate() es un método que se utiliza para evaluar el rendimiento del modelo
# en un conjunto de datos separado, en este caso, los datos de prueba.
# test_images, test_labels:

# test_images contiene las imágenes de prueba. Estas son datos nuevos que el modelo
# no ha visto durante su entrenamiento y se utilizan para evaluar qué tan bien el
# modelo generaliza a datos no vistos.
# test_labels contiene las etiquetas correspondientes a test_images. Estas etiquetas
# son la "respuesta correcta" para cada imagen de prueba.
# test_loss, test_acc = model.evaluate(...):

# Cuando ejecutas model.evaluate(), devuelve dos valores: la pérdida de prueba
#  (test_loss) y la precisión de prueba (test_acc).
# test_loss es el valor de la función de pérdida del modelo en el conjunto de datos
# de prueba, que mide cuánto se equivoca el modelo en promedio.
# test_acc es la precisión del modelo en el conjunto de datos de prueba, que indica
# el porcentaje de etiquetas que el modelo predijo correctamente.

test_loss, test_acc=model.evaluate(test_images, test_labels)
print('\nTest accuracy:', test_acc)


Test accuracy: 0.8939999938011169
