In [None]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Conv2D, MaxPool2D, Flatten, Dense
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
import time

# Descarga de los datos

In [None]:
# Descargamos base de datos CIFAR10, al descargarla la encontramos en 2 particiones
cifar = tf.keras.datasets.cifar10
(X_train, y_train), (X_val_test, y_val_test) = cifar.load_data()

In [None]:
# Visualizamos las imágenes disponibles en la base de datos

classes = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog',
           'horse', "ship", "truck"]

plt.figure(figsize=(10, 10))
# Mostramos 9 imágenes aleatorias con su etiqueta correspondiente
for i in range(9):
  plt.subplot(3, 3, i+1)
  # Seleccionamos imagen aleatoria
  j = np.random.randint(0, X_train.shape[0])
  plt.imshow(X_train[j])
  # Mostramos clase asociada a la imagen
  plt.title(f'{classes[int(y_train[j])]}')

# Preparación de los datos

In [None]:
# Diferenciamos entre validación y test
X_val, X_test, y_val, y_test = train_test_split(X_val_test, y_val_test, test_size=0.5, random_state=123)

# En este punto ya tenemos las 3 particiones de interés.
# Vemos que tamaño tiene cada matriz que hemos generado
print('Tamaño datos entrenamiento: ', X_train.shape)
print('Tamaño datos validación: ', X_val.shape)
print('Tamaño datos test: ', X_test.shape)

print('Tamaño etiquetas entrenamiento: ', y_train.shape)
print('Tamaño etiquetas validación: ', y_val.shape)
print('Tamaño etiquetas test: ', y_test.shape)

In [None]:
# Mostramos rango de intensidad de la imagen
print('Rango original imágenes: ', X_train.min(), '-', X_train.max())

In [None]:
# Vemos que las imágenes están en un rango [0-255], para incorporarlas a la red debemos de cambiar su rango a [0-1]
X_train = X_train.astype('float32') / 255
X_val = X_val.astype('float32') / 255
X_test = X_test.astype('float32') / 255

print('Nuevo rango valores intensidad: ', X_train.min(), '-', X_train.max())

# Definición del modelo (arquitectura)

In [None]:
# Definimos arquitectura modelo
model = Sequential()
model.add(Input(shape=X_train.shape[1:]))
model.add(Conv2D(filters=24, kernel_size=(3,3), activation='relu'))
model.add(MaxPool2D(pool_size=(2,2)))
model.add(Conv2D(filters=36, kernel_size=(3,3), activation='relu'))
model.add(MaxPool2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(10, activation='softmax'))

model.summary()

NameError: ignored

In [None]:
# Compilamos el modelo
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# Entrenamiento

In [None]:
# Calculamos tiempo de ejecuc
ini = time.time()
# Entrenamos el modelo
history = model.fit(X_train, y_train, batch_size=32, epochs=5,
                    validation_data=(X_val, y_val),
                    verbose=1)
end = time.time()

print('Tiempo ejecución (s): ', end-ini)

In [None]:
# Vemos si estamos haciendo uso de la GPU
tf.config.list_physical_devices('GPU')

[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]