<a href="https://colab.research.google.com/github/AotinianoZ/hello-world/blob/main/Clasficaci%C3%B3n_Flores_Transfer_Learning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Clasificación de Flores con Transfer Learning

# Importar


Algunas librerias para importar que hemos visto anteriormente lo único nuevo es **tensorflow_hub** del cual Colab hace mucho uso.

In [None]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

import tensorflow_hub as hub
import tensorflow_datasets as tfds

from tensorflow.keras import layers

In [None]:
import logging
logger = tf.get_logger()
logger.setLevel(logging.ERROR)

# Inicio: Descargar la dataset de flores usando Tensorflow Datasets

En la celda siguiente descargaremso el dataset Flores usando TensorFlow Dataset como anteriormente lo realizamos. Si nosotros miramos la [TensorFlow Datasets documentation](https://www.tensorflow.org/datasets/datasets#tf_flowers) vermos que el nombre del dataset de Flores es `tf_flowers`. Podemos además ver que el dataset esta solo dividido en set Entrenamiento. Deberemos usar `tfds.splits` para separar en un set de `training_set` y `validation_set`. Elegiremos separación `[70, 30]` en el cual 70% corresponde al `training_set` y 30% al `validation_set`. Luego cargaremos dataset `tf_flowers` usando `tfds.load`. Debemos asegurar que la función `tfds.load` usa todos los parámetros necesarios, y además verificar el retorno de la data en la información, así podremos entender el dataset completo.


In [None]:
(training_set, validation_set), dataset_info =  tfds.load(
    "tf_flowers",
    split = ["train[:70%]", "train[70%:]"],
    with_info=True,
    as_supervised=True
)

[1mDownloading and preparing dataset tf_flowers/3.0.1 (download: 218.21 MiB, generated: 221.83 MiB, total: 440.05 MiB) to /root/tensorflow_datasets/tf_flowers/3.0.1...[0m


local data directory. If you'd instead prefer to read directly from our public
GCS bucket (recommended if you're running on GCP), you can instead pass
`try_gcs=True` to `tfds.load` or set `data_dir=gs://tfds-data/datasets`.



HBox(children=(FloatProgress(value=0.0, description='Dl Completed...', max=5.0, style=ProgressStyle(descriptio…



[1mDataset tf_flowers downloaded and prepared to /root/tensorflow_datasets/tf_flowers/3.0.1. Subsequent calls will reuse this data.[0m


# Imprimir Información acerca del dataset Flores

Ahora que ya hemos descargado el dataset, usaremos la información para imprimir el número de clases del dataset, y además escribir un poco de código para contar cuantas imagenes existen en los sets de entrenamiento y validación.

In [None]:
num_classes = dataset_info.features['label'].num_classes

num_training_examples = 0
num_validation_examples = 0

for example in training_set:
  num_training_examples += 1

for example in validation_set:
  num_validation_examples += 1

print('Total Number of Classes: {}'.format(num_classes))
print('Total Number of Training Images: {}'.format(num_training_examples))
print('Total Number of Validation Images: {} \n'.format(num_validation_examples))

Total Number of Classes: 5
Total Number of Training Images: 2569
Total Number of Validation Images: 1101 



Las images en el dataset Flores **no son del mismo tamaño**.

In [None]:
for i, example in enumerate(training_set.take(5)):
  print('Image {} shape: {} label: {}'.format(i+1, example[0].shape, example[1]))

Image 1 shape: (333, 500, 3) label: 2
Image 2 shape: (212, 320, 3) label: 3
Image 3 shape: (240, 320, 3) label: 3
Image 4 shape: (240, 320, 3) label: 4
Image 5 shape: (317, 500, 3) label: 3


# Reformatear imagenes y crear batches

En la celda siguiente crearemos una función que reformatea todas las imagenes a resolución espera de **MobileNet** (*usaremos este objeto para realizar el transfer learning :)*) (224, 224) y lo normalizaremos. La función deberá tomar una `image` y una `label` como argumento y deberá retornar la nueva `image` y la correspondiente `label`. Luego crearemos batches de entrenamiento y validación de tamaño *32*.


In [None]:
IMAGE_RES = 244

def format_image(image, label):
  image = tf.image.resize(image, (IMAGE_RES, IMAGE_RES))/255.0
  return image, label

BATCH_SIZE = 32

train_batches = training_set.shuffle(num_training_examples//4).map(format_image).batch(BATCH_SIZE).prefetch(1) 

validation_batches = validation_set.map(format_image).batch(BATCH_SIZE).prefetch(1)

# Realizando Simple Transfer Learning con TensorFlow Hub

Ahora usaremos *TensorFlow Hub* para hacer el **Transfer Learning**. Recordar, que en el transfer learning usamos parte de un **modelo ya entrenado** Y cambiamos la *capa final*, o muchas capas del modelo, luego reentrenaremos estas capas como nuestro propio dataset :).

### Crearemos un extractor de caracteristicas

En la celda siguiente crearemos un `feature_extractor` usando *MobileNet v2*. Recordar que el modelo parcial desde TensorFlow Hub (sin la capa de clasificación) es denominado un **vector de caracteristicas**. Ir a [TensorFlow Hub documentation](https://tfhub.dev/s?module-type=image-feature-vector&q=tf2) para ver la lista disponible de vectores de características. Hacemos click en `tf2-preview/mobilenet_v2/feature_vector`. Antes de realizar este trabajo se reviso el URL indicado. Finalmente, se creo `feature_extractor` usando `hub.KerasLayer` con el correcto parámetro de `input_shape`.



In [None]:
URL = "https://tfhub.dev/google/tf2-preview/mobilenet_v2/feature_vector/4"
feature_extractor = hub.KerasLayer(URL,
                                   input_shape=(IMAGE_RES, IMAGE_RES, 3))

### Congelando el Modelo Pre-entrenado

En la celda siguiente se 'congelo' las variables en la capa de *feature extractor*, así que el entrenamiento solo modifica la capa final de clasificación.


In [None]:
feature_extractor.trainable = False

### Agregar el cabezal de clasificación

En la celda siguiente creamos un modelo `tf.keras.Sequential`, y agregamos un modelo pre-entrenado y la nueva capa de clasificación. La capa de clasificación debe ser el **mismo número de clase** de nuestro dataset Flores. Finalmente imprimimos el sumario del modelo Sequencial.


In [None]:
model = tf.keras.Sequential([
  feature_extractor,
  tf.keras.layers.Dense(num_classes)
])

model.summary()



### Entrenando el Modelo

En la celda siguiente entrenamos el modelo como cualquier otro, primero usaremos `compile` y luego `fit`. Debemos asegurarnos que usamos parámetros propios cuando aplicamos ambos métodos. El entrenamiento para 10 epochs.


In [None]:
model.compile(
    optimizer = "adam",
    loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    metrics = ["accuracy"]
)
EPOCHS = 10

history = model.fit(train_batches,
                    epochs=EPOCHS,
                    validation_data=validation_batches)

Podemos ver que conseguimos *accuracy* validación **~88%** con solo 10 epochs de entrenamiento, esto considero **asombroso**. Este es una *enorme* mejora del modelo creado anteriormente, donde conseguirmos aproximadamente **~78%** de *accuracy* con 100 epochs (se usó data augmentation y variedad de técnicas para mejorar el modelo de predicción). La razón de esta diferencia es que MobilNet v2 fue cuidadosamente diseñado en el tiempo por **expertos**, luego de entrenar dataset masivos (ImageNet).



# Ploteo de Gráficos de Entrenamiento y Validación

En la celda siguiente, plotea el entramiento y validación con los gráficos de accuracy/loss.

In [None]:
acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

loss = history.history['loss']
val_loss = history.history['val_loss']

epochs_range = range(EPOCHS)

plt.figure(figsize=(8, 8))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()


Es resaltante que la validación performa es mejor que el entrenamiento performa, correcto desde el inicio al final de la ejecución.

Una de las razones es performa es medida al final de los epochs, pero el entrenamiento performa es el promedio de los valores a través de epochs.

La mayor razón es pensada porque reusamos una larga parte de *MobileNet* el cuale está entrenado con images de Flores.


# Revisar Predicciones:

En la celda siguiente conseguiremos los nombre de las etiquetas desde la información del dataset y lo converterimes en un Numpy array. Imprimiremos el arreglo para asegurarnos los nombre de etiquetas son correctos.


In [None]:
class_names = np.array(dataset_info.features['label'].names)

print(class_names)


### Crear una Batch de Imagen y hacer predicciones

En la celda siguiente, usamos la función `next()` para crear una `image_batch` y su correspondiente `label_batch`. Convertiremos ambos `image_batch` y `label_batch` ha arreglos numpy usando el método `.numpy()`. Luego usaremos el método `.predict()` para ejecutar el batch de imagen a través del modelo y hacer predicciones. Después, usaremos la función `np.argmax()` para conseguir los índices de las mejores predicciones para cada imagen. Finalmente, convertiremos los indices de mejor predicción en clases de nombre.


In [None]:
image_batch, label_batch = next(iter(train_batches))


image_batch = image_batch.numpy()
label_batch = label_batch.numpy()

predicted_batch = model.predict(image_batch)
predicted_batch = tf.squeeze(predicted_batch).numpy()

predicted_ids = np.argmax(predicted_batch, axis=-1)
predicted_class_names = class_names[predicted_ids]

print(predicted_class_names)


### Imprimiendo True Labels y Predicted Indices

En la celda siguiente, imprimiremos las etiquetas verdadero y el indice de etiquetas predecido.

In [None]:
print("Labels:           ", label_batch)
print("Predicted labels: ", predicted_ids)

# Plotear Predicciones del Modelo

In [None]:
plt.figure(figsize=(10,9))
for n in range(30):
  plt.subplot(6,5,n+1)
  plt.subplots_adjust(hspace = 0.3)
  plt.imshow(image_batch[n])
  color = "blue" if predicted_ids[n] == label_batch[n] else "red"
  plt.title(predicted_class_names[n].title(), color=color)
  plt.axis('off')
_ = plt.suptitle("Model predictions (blue: correct, red: incorrect)")

# Mejorar el Transfer Learning con el Inception Model

Por úttimo se me ocurrió mejorar esto con el Inception Model ir a [TensorFlow Hub documentation](https://tfhub.dev/s?module-type=image-feature-vector&q=tf2) y click en `tf2-preview/inception_v3/feature_vector`. Este vector corresponde al modelo **Inception v3 model**. En la celda siguiente, usaremos transfer learning para crear una CNN que usa el Inception v3 como el modelo preentrenado para clasificar imagenes desde el dataset de Flores. La entrada de inception es *299x299* pixeles. Compararemos las precisiones entre :

**Inception v3 ** Vs. **MobileNet v2**.

In [None]:
IMAGE_RES = 299

(training_set, validation_set), dataset_info = tfds.load(
    'tf_flowers', 
    with_info=True, 
    as_supervised=True, 
    split=['train[:70%]', 'train[70%:]'],
)
train_batches = training_set.shuffle(num_training_examples//4).map(format_image).batch(BATCH_SIZE).prefetch(1)
validation_batches = validation_set.map(format_image).batch(BATCH_SIZE).prefetch(1)

URL = "https://tfhub.dev/google/tf2-preview/inception_v3/feature_vector/4"
feature_extractor = hub.KerasLayer(URL,
  input_shape=(IMAGE_RES, IMAGE_RES, 3),
  trainable=False)

model_inception = tf.keras.Sequential([
  feature_extractor,
  tf.keras.layers.Dense(num_classes)
])

model_inception.summary()

In [None]:
model_inception.compile(
  optimizer='adam', 
  loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
  metrics=['accuracy'])

EPOCHS = 6

history = model_inception.fit(train_batches,
                    epochs=EPOCHS,
                    validation_data=validation_batches)

# Conclusiones

* Usar los **transfer learning** mejoran mucho la velocidad de procesamiento y la precisión con una cantidad mucho menor de batches, además nos permiten ahorrar mucho tiempo al momento de un análisis preliminar.

* La mejora del uso de transfer learning mejoró la **accuracy** de ~78% hasta ~87%.

* Al comparar modelos de **transfer learning** (Inception v3 y MobilNet v2) nos dio mejores resultados en ....

* La idea de probar y comparar nuevos modelos y cambios en la estructura de la neurona puede proporcionar mejoras significativas.

# Recomendaciones

* No todos los tipos de data se adecuan a los modelos de transfer learning.

* Se requiere trabajos de muchos expertos y validados en el tiempo para usar el transfer learning (alguien que haya trabajado previamente), por lo cual se hace escaso para otros tipos de trabajos como el de Ingeniería Geológica (en mi caso.