[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/juanchess98/Notebooks-Deep-Learning/blob/transfer_learning/transfer_learning.ipynb)

# Transfer Learning

Aprender una tarea nueva puede ser un proceso que lleve una considerable cantidad de tiempo. Sin embargo, los seres humanos tienen la capacidad de asociar nuevas tareas con otras que ya sabe como ejecutar y aplicar este conocimiento para reducir el tiempo y costo de aprendizaje. Por ejemplo, si una persona sabe como manejar una bicicleta, para esa persona será mucho más fácil aprender a manejar una motocicleta. Asimismo, una persona que domine el idioma español tendrá mucha más facilidad para aprender otro idioma similar, como el portugués, que una persona de origen alemán o japonés.

Este mismo concepto se puede aplicar a las máquinas inteligentes y se le conoce como *Transfer Learning* o Aprendizaje por transferencia. En este caso, un modelo desarrollado para una resolver una tarea puede usarse como punto de partida para resolver otra tarea similar.



## Transfer Learning en Keras

La metodología de *Transfer Learning* en Keras suele tener el siguiente flujo de trabajo:

1. Tomar las capas de un modelo previamente entrenado
2. Congelarlas para no perder la información que contienen en futuros entrenamientos
3. Añadir nuevas capas para entrenar sobre las capas congeladas
4. Entrenar las capas nuevas con los datos de interés.

Un último paso, opcional, es realizar *fine tuning* o sintonización fina. Esto consiste en descongelar todo, o una parte del modelo obtenido en los pasos anteriores y entrenarlo con los nuevos datos a una tasa de aprendizaje muy baja.

#### Congelamiento de capas con el atributo *trainable*

En Keras las capas y los modelos tienen tres atributos:

1. **weights:** lista de todos los pesos de la capa
2. **trainable_weights:** lista de todos los pesos que serán actualizados por el optimizador (gradiente descendente, etc) para minimizar la función de costo durante el entrenamiento
3. **non_trainable_weights:** lista de todos los pesos no entrenables

Para establecer si un peso es entrenable o no, las capas y los modelos tienen otro atributo: **trainable**. El atributo **trainable** es de tipo booleano y llevarle un valor de **False** hace que todos los pesos en esa capa sean no-entrenables, es decir, se *congelan* los pesos de dicha capa. Por ejemplo:

    layer = keras.layers.Dense(3)  # Se crea la capa
    layer.build((None, 4))         # Se crean los pesos
    layer.trainable = False        # Se congela la capa
    
Con esto se asegura que los pesos de esta capa no sean actualizados durante el entrenamiento.

In [1]:
import numpy as np
import tensorflow as tf
from tensorflow import keras

Se carga el modelo de la arquitectura VGG16 entrenado con la base de datos ImageNet la cual contiene 1000 clases. El tamaño de las imágenes de entrada de este modelo es de 224x224

In [2]:
tf.keras.applications.VGG16(
    include_top=True,  # Incluir las tres capas convolucionales del tope de la red.
    weights="imagenet",  # Cargar pesos pre-entrenados en ImageNet.
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
)

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg16/vgg16_weights_tf_dim_ordering_tf_kernels.h5


<tensorflow.python.keras.engine.functional.Functional at 0x7f9233f92d50>