<a href="https://colab.research.google.com/github/SilvanaJ90/usergioarboleda-bootcamp_IA/blob/main/Semana_2_Clase_viernes_Mejoramiento_de_red_neuronal_profunda.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Redes profundas.

# 1. Introducción. 🏳

La semana pasada nos dedicamos a introducir redes neuronales y fracasamos en la
clasificación de imágenes del set datos CIFAR10. La verdad es que esto fue principalmente porque la red neuronal estaba extraordinariamente sencilla, no era lo suficientemente profunda, no tenían ni las suficientes capas, ni las suficientes neuronas.


Lo que vamos a estar haciendo es corregir los errores que cometimos con CIFAR10 con una Red Neuronal Profunda, aunque nos vamos a encontrar con 3 problemas principales que tenemos que aprender a resolver. El primer problema consiste en la desaparición de los gradientes a través de las diferentes capas. También se presenta la lentitud a la hora del entrenamiento debido al aumento de información. Así mismo, está el constante problema del sobreajuste.


*   Como objetivos del capítulo se establece arreglar la red neuronal para la clasificación
imágenes de CIFAR10 y aprender las herramientas necesarias para entender publicaciones
sobre las investigaciones de redes neuronales.




# 2. Mejorando red neuronal profunda para CIFAR10.

Vamos a comenzar armando el modelo que más o menos hicimos la vez pasada, le vamos a estar colgando diferentes inicializaciones, diferentes funciones de activación, batch normalización y muchas otras cosas. Comencemos importando las librerías que necesitamos.

# 2.1 Importando librerias relevantes.

In [1]:
import tensorflow as tf
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from tensorflow import keras
import os

# 3. Extrayendo los datos del CIFAR-10.

In [None]:
(X_entrena_completo, y_entrena_completo), (X_test,y_test) = keras.datasets.cifar10.load_data()
# Imagenes entrenamiento, etiquetas de imagenes de entrenamiento - imagenes validación, etiquetas de imagenes de validación

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz


# 4. Creando nuestra semilla (Seed) para conservar concordancia en la aleatoriedad.

In [None]:
tf.random.set_seed(42)
np.random.seed(42)

# 5. Modelo secuencial.

# 5.1 Creando el modelo.

Se aplican la sespecificaciones indicadas al inicio. 20 capas intermedias con 100 neuronas cada capa intermedia, una capa de entrada y una de salida con 10 nodos o neuronas.

In [None]:
model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32,32,3]))
for _ in range(20):
  model.add(keras.layers.Dense(100,activation="relu"))
model.add(keras.layers.Dense(10,activation="softmax"))

# 5.2 Resumen del modelo recien definido.

In [None]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 3072)              0         
                                                                 
 dense (Dense)               (None, 100)               307300    
                                                                 
 dense_1 (Dense)             (None, 100)               10100     
                                                                 
 dense_2 (Dense)             (None, 100)               10100     
                                                                 
 dense_3 (Dense)             (None, 100)               10100     
                                                                 
 dense_4 (Dense)             (None, 100)               10100     
                                                                 
 dense_5 (Dense)             (None, 100)               1

# 5.3 Compilando el modelo.

In [None]:
model.compile(loss="sparse_categorical_crossentropy", optimizer="sgd", metrics=["accuracy"])

# 6.0 Early stopping

Para evitar el sobre entrenamiento de una red neuronal profunda, donde se llegue a un punto entre las transiciones de las epocas de la misma en que ya la precisión no mejora y el error no disminuye, se estableceran unos 'puntos de guardado' o 'puntos de validación'. Para ello debemos modificar la cantidad los elementos de nuestro set de datos de entrenamiento y de valdación. Tambien, se deben estructurar los callbacks que nos permitiran la aplicación del early stopping.

In [None]:
X_train = X_entrena_completo[5000:]
y_train = y_entrena_completo[5000:]
# Datos desde el indice 5000 hasta el ultimo

X_valid = X_entrena_completo[:5000]
y_valid = y_entrena_completo[:5000]
# Datos desde el inicio hasta el 4999.

In [None]:
#Callback a 20 puntos, guardadndo en modelocifar10.h5
early_stopping_cb = keras.callbacks.EarlyStopping(patience = 20)
model_checkpoint_cb = keras.callbacks.ModelCheckpoint("modelocifar10.h5", save_best_only=True)
callbacks=[early_stopping_cb,model_checkpoint_cb]

# 7. Entrenamiento del modelo usando early stopping. 😓 🚦

In [None]:
history = model.fit(X_train,y_train, epochs = 30, validation_data=(X_valid, y_valid))

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


# 7.1 Evaluación de nuestro modelo recien entrenado. 🧪

In [None]:
model.evaluate(X_test,y_test)



[1.7759257555007935, 0.4090999960899353]



---



# 8. Limpiando la sesion anterior de entrenamiento.

In [None]:
keras.backend.clear_session()

# 9. Definiendo nuevamente nuestra semilla.

In [None]:
tf.random.set_seed(42)
np.random.seed(42)

*Se notara la diferencia a partir de este punto, donde se aplicaran los conceptos vistos en el material guia en la plataforma*

# 10. Definiendo el modelo con unos cambios.

In [None]:
model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32,32,3]))
for _ in range(20):
  model.add(keras.layers.Dense(100,activation="elu", kernel_initializer="he_normal"))
model.add(keras.layers.Dense(10,activation="softmax"))

# 10.1 Resumen del nuevo modelo aplicando la inicialización he_normal en las capas intermedias.

In [None]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 3072)              0         
                                                                 
 dense (Dense)               (None, 100)               307300    
                                                                 
 dense_1 (Dense)             (None, 100)               10100     
                                                                 
 dense_2 (Dense)             (None, 100)               10100     
                                                                 
 dense_3 (Dense)             (None, 100)               10100     
                                                                 
 dense_4 (Dense)             (None, 100)               10100     
                                                                 
 dense_5 (Dense)             (None, 100)               1

# 10.1 Compilar el modelo (no se usa el early stopping).


In [None]:
model.compile(loss="sparse_categorical_crossentropy", optimizer="sgd", metrics=["accuracy"])

# 10.2 Iniciando el entrenamiento del nuevo modelo.

In [None]:
history.model.fit(X_train,y_train, epochs=30,validation_data=(X_valid,y_valid))

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


<keras.src.callbacks.History at 0x79e2200fe440>

# 10.3 Evaluando el entrenamiento de nuestro nuevo modelo.

In [None]:
model.evaluate(X_test,y_test)



[231.62062072753906, 0.10010000318288803]



---



# 11. Ajustando el modelo sobreajustado.

# 11.1 Limpiando la sesion anterior.

In [None]:
keras.backend.clear_session()

# 11.2 Definiendo las semillas

In [None]:
tf.random.set_seed(42)
np.random.seed(42)

# 11.3 Armando el nuevo modelo (por tercera vez) 😆.

In [None]:
model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32,32,3]))
for _ in range(20):
 model.add(keras.layers.Dense(100, activation = "elu", kernel_initializer="he_normal"))
model.add(keras.layers.Dense(10, activation= "softmax"))

# 11.4 Cambiando el optimizador usado.

In [None]:
optimizer = keras.optimizers.Nadam(learning_rate=5e-5,beta_1=0.9, beta_2=0.999)


# 11.5 Compilando el modelo

In [None]:
# NOTESE LA DIFERENCIA ACA.
model.compile(loss="sparse_categorical_crossentropy",optimizer=optimizer, metrics=["accuracy"])


# 11.6 apicando early stopping

In [None]:
early_stopping_cb = keras.callbacks.EarlyStopping(patience = 20)
model_checkpoint_cb = keras.callbacks.ModelCheckpoint("modelocifar10.h5", save_best_only=True)
callbacks=[early_stopping_cb,model_checkpoint_cb]

# 11.7 Empezamos el entrenamiento con optimizador Nadam.

In [None]:
model.fit(X_train,y_train,epochs=100,validation_data=(X_valid,y_valid),callbacks=callbacks)

Epoch 1/100
Epoch 2/100
   6/1407 [..............................] - ETA: 15s - loss: 2.2370 - accuracy: 0.2083

  saving_api.save_model(


Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100


<keras.src.callbacks.History at 0x79e1bd7122c0>

# 11.8 Verificar el modelo luego del entrenamiento con el optimizador Nadam.

In [None]:
model = keras.models.load_model("modelocifar10.h5")
model.evaluate(X_valid,y_valid)



[1.4988383054733276, 0.47940000891685486]

# 12. Creando el nuevo modelo aplciando normalización batch y capa de actuivación relu en cada capa intermedia.

In [None]:
model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[32,32,3]))
model.add(keras.layers.BatchNormalization())
for _ in range(20):
 model.add(keras.layers.Dense(100, activation = "elu", kernel_initializer="he_normal"))
 model.add(keras.layers.BatchNormalization())
 model.add(keras.layers.Activation("elu"))
model.add(keras.layers.Dense(10, activation= "softmax"))


In [None]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 3072)              0         
                                                                 
 batch_normalization (Batch  (None, 3072)              12288     
 Normalization)                                                  
                                                                 
 dense (Dense)               (None, 100)               307300    
                                                                 
 batch_normalization_1 (Bat  (None, 100)               400       
 chNormalization)                                                
                                                                 
 activation (Activation)     (None, 100)               0         
                                                                 
 dense_1 (Dense)             (None, 100)               1

# 13. Optimización y compilación del nuevo modelo.

In [None]:
optimizer = keras.optimizers.Nadam(learning_rate=5e-4, beta_1=.9, beta_2=.999)
model.compile(loss="sparse_categorical_crossentropy",  optimizer=optimizer, metrics=["accuracy"])

# 14. Aplicando el early stopping

In [None]:
early_stopping_cb = keras.callbacks.EarlyStopping(patience = 20)
model_checkpoint_cb = keras.callbacks.ModelCheckpoint("modelocifar10.h5",save_best_only=True)
callbacks=[early_stopping_cb,model_checkpoint_cb]


# 15. Empezando el entrenamiento del modelo aplicando batch normalization, early stopping y capa de activacion elu en las capas intermedias de la red neuronal profunda.

In [None]:

model.fit(X_train, y_train, epochs=100, validation_data=(X_valid, y_valid), callbacks=callbacks)


Epoch 1/100

  saving_api.save_model(


Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100


<keras.src.callbacks.History at 0x79e1bde9ead0>

# 16. Evaluando el modelo.

In [None]:
model = keras.models.load_model("modelocifar10.h5")
model.evaluate(X_valid,y_valid)



[1.326931118965149, 0.5297999978065491]