# Modelo en Tensor Flow
Se carga las librerias necesarias para la creacion del modelo

In [7]:
import tensorflow as tf
from tensorflow.keras import layers, models, optimizers
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.utils import to_categorical

Se cargan los datos del modelo y se normalizan

In [2]:
# 1. Cargar y preprocesar el dataset CIFAR-10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# Normalizar las imágenes (de 0 a 1)
x_train = x_train.astype("float32") / 255.0
x_test = x_test.astype("float32") / 255.0

# Convertir las etiquetas a formato one-hot
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

## Creacion del modelo
Se tarta de crear un modelo similar al de Pytorch y al visto en clase, con pequenas modificaciones para el correcto funcionamiento y normalizaciones de los pesos. Agregue tambien dropouts para no hacer un overfitting de los datos de entrenamiento

In [5]:
#. Creamos el modelo
model = models.Sequential()
model.add(layers.Conv2D(96, 3, strides=1, padding='same', input_shape=(32, 32, 3)))
model.add(layers.Lambda(tf.nn.local_response_normalization))
model.add(layers.Activation('relu'))
model.add(layers.MaxPooling2D(2, strides=2))
model.add(layers.Conv2D(192, 3, strides=1, padding='same'))
model.add(layers.Lambda(tf.nn.local_response_normalization))
model.add(layers.Activation('relu'))
model.add(layers.MaxPooling2D(2, strides=2))
model.add(layers.Conv2D(384, 3, strides=1, padding='same'))
model.add(layers.Activation('relu'))
model.add(layers.Conv2D(256, 3, strides=1, padding='same'))
model.add(layers.Activation('relu'))
model.add(layers.Conv2D(256, 3, strides=1, padding='same'))
model.add(layers.Activation('relu'))
model.add(layers.MaxPooling2D(3, strides=2))
model.add(layers.GloblaAvergaePooling2D())
model.add(layers.Flatten())
model.add(layers.Dense(4096, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(4096, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(10, activation='softmax'))
model.summary()

## Entrenamiento 
Entrenamos el modelo con 4 epocas y un batch size de 256, tardando alrededor de 20 minutos en completarse el entrenamiento, se escogieron 4 epocas solamente ya que no me fue posible usar la tarejeta grafica para este modelo, con un poco mas de tiempo la hubiera dejado a la par que su contraparte de Pytorch, es decir 20 epocas.

Vemos que con tan solo 4 epocas tiene un accuracy del 55%, un poco bastante malo a decir verdad, pero hay que tomar en cuenta la baja cantidad de epocas comparada con otros modelos.

In [None]:
# 3. Compilar el modelo
model.compile(optimizer=optimizers.SGD( learning_rate=0.001,momentum=0.9),
              loss='categorical_crossentropy',
              metrics=['accuracy'])
# 4. Entrenar el modelo
history = model.fit(x_train, y_train, batch_size=256, epochs=4)

# 5. Evaluar el modelo en el conjunto de prueba
test_loss, test_acc = model.evaluate(x_test, y_test)
print("Test accuracy:", test_acc)

Epoch 1/4


2025-03-07 12:30:41.543370: W external/local_xla/xla/tsl/framework/cpu_allocator_impl.cc:83] Allocation of 614400000 exceeds 10% of free system memory.


[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m328s[0m 2s/step - accuracy: 0.1284 - loss: 2.2778
Epoch 2/4
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m310s[0m 2s/step - accuracy: 0.2681 - loss: 1.9423
Epoch 3/4
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m309s[0m 2s/step - accuracy: 0.3948 - loss: 1.6424
Epoch 4/4
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m302s[0m 2s/step - accuracy: 0.4735 - loss: 1.4386
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m17s[0m 54ms/step - accuracy: 0.5542 - loss: 1.2465
Test accuracy: 0.5507000088691711


# Modelo preentrenado
Puesto que  no hay un mocelo preentrenado de AlexNet en Tensor Flow, use el modleo VGG16 que se puede encontrar ya preentrenad en keras.

In [43]:
from keras.applications import vgg16 as vgg
from keras.layers import Dropout, Dense, GlobalAveragePooling2D,BatchNormalization
from keras import Model

Cargamos el modelo con la forma deseada de CIFAR10 y sin la ultima capa

In [39]:
base_model = vgg.VGG16(weights='imagenet', 
                       include_top=False, 
                       input_shape=(32, 32, 3))

## Enntrenamiento
Se modifica la ultima capa para entrenar los pesos de esta capa. 
Se entrena con un batch size de 256 y 6 epocas, se siguen realizando los calculos en el CPU pero ya son muchos menos que con el mdoelo desde cero, es por esto que solo se tardo 5 minutos en procesar.

In [41]:
last = base_model.get_layer('block3_pool').output
# Add classification layers on top of it
x = GlobalAveragePooling2D()(last)
x= BatchNormalization()(x)
x = Dense(256, activation='relu')(x)
x = Dense(256, activation='relu')(x)
x = Dropout(0.6)(x)
pred = Dense(10, activation='softmax')(x)
model = Model(base_model.input, pred)
for layer in base_model.layers:
     layer.trainable = False
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.Adam(learning_rate=0.01),
              metrics=['accuracy'])
history = model.fit(x_train, y_train, batch_size=256, epochs=6)

Epoch 1/6


2025-03-07 13:35:25.321220: W external/local_xla/xla/tsl/framework/cpu_allocator_impl.cc:83] Allocation of 614400000 exceeds 10% of free system memory.


[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m54s[0m 264ms/step - accuracy: 0.4883 - loss: 0.2567
Epoch 2/6
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m53s[0m 271ms/step - accuracy: 0.6629 - loss: 0.1660
Epoch 3/6
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m53s[0m 268ms/step - accuracy: 0.6968 - loss: 0.1519
Epoch 4/6
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m54s[0m 277ms/step - accuracy: 0.7133 - loss: 0.1433
Epoch 5/6
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m54s[0m 278ms/step - accuracy: 0.7301 - loss: 0.1364
Epoch 6/6
[1m196/196[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m51s[0m 260ms/step - accuracy: 0.7357 - loss: 0.1335


Como era de esperar  el modelo preentreando tardo mucho mennos y ademas tuvo una precision mucho mayor a la creada desde cero, un accuracy de alrdedor de 71%

In [42]:
test_loss, test_acc = model.evaluate(x_test, y_test)
print("Test accuracy:", test_acc)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 36ms/step - accuracy: 0.7140 - loss: 0.1460
Test accuracy: 0.7129999995231628


## Comparacion de los modelos en Tensor Flow 
Sabemos que debe de ser mejor el modelo preentrenado pero realmente nuestro modleo no se quedo taan lejos de porder ser igual, yo creo que con dos epocas mas de entrenamiento de nuestro modelo se podria haber llegado a el accuracy de 71%. Tambien si logro poder usar la tarjeta rafica con este programa se podria mejorar exponensialmente el modelo y llegar hasta las 20 epocas como se hizo con Pytorch a pesar de no tener una GPU con grandes prestaciones.