# Deep Learning
# **Capstone Transfer Learning**



El aprendizaje por transferencia (**Transfer Learning**) es un método de aprendizaje automático en el que un modelo desarrollado para una tarea se reutiliza como punto de partida para un modelo en una segunda tarea.

Es un enfoque popular en el aprendizaje profundo en el que los modelos previamente entrenados se utilizan como punto de partida para resolver problemas de visión computacional y tareas de procesamiento del lenguaje natural, dados los vastos recursos informáticos y de tiempo necesarios para desarrollar modelos de redes neuronales para estos problemas.

## Importancia de Transfer Learning

Transfer Learning permite aprovechar la experiencia de la comunidad de usuarios de Deep Learning. Modelos populares previamente entrenados ofrecen una arquitectura sólida y evitan la necesidad de empezar desde cero. Transfer Learning es una técnica común de aprendizaje supervisado, ya que:

* Permite entrenar modelos con menos datos etiquetados reutilizando modelos populares ya entrenados con conjuntos de datos de gran tamaño.

* Ayuda a reducir el tiempo de entrenamiento y los recursos informáticos. Con Transfer Learning, los pesos de la red neuronal no se aprenden desde cero, dado que el modelo previamente entrenado ya los ha aprendido con los aprendizajes anteriores.

* Puede utilizar arquitecturas de modelos desarrolladas por la comunidad de investigadores de Deep Learning, incluidas arquitecturas populares tales como GoogLeNet y YOLO.

<img src='https://drive.google.com/uc?export=view&id=1TQIIbYrc6Lha6052_piYwDg10eYOu2_S' width="600" align="center" style="margin-right: 20px">

## ¿Qué es Transfer Learning?

La transferencia de aprendizaje y la adaptación de dominio se refieren a la
situación en la que lo que se ha aprendido en un entorno ... posteriormente se explota para mejorar la generalización en otro entorno.

1. Bengio, Y., Goodfellow, I., & Courville, A. (2017). Deep learning (Vol. 1). Massachusetts, USA:: MIT press.

El aprendizaje por transferencia es la mejora del aprendizaje en una nueva tarea mediante la transferencia de conocimientos de una tarea relacionada que ya se ha aprendido.

2. Olivas, E. S., Guerrero, J. D. M., Martinez-Sober, M., Magdalena-Benedito, J. R., & Serrano, L. (Eds.). (2009). Handbook of research on machine learning applications and trends: Algorithms, methods, and techniques: Algorithms, methods, and techniques. IGI Global.

El aprendizaje por transferencia está relacionado con problemas como el aprendizaje multitarea y la deriva de conceptos y no es exclusivamente un área de estudio para el aprendizaje profundo.

Sin embargo, el aprendizaje por transferencia es popular en el aprendizaje profundo dados los enormes recursos necesarios para entrenar modelos de aprendizaje profundo o los grandes y desafiantes conjuntos de datos en los que se entrenan los modelos de aprendizaje profundo.



El aprendizaje por transferencia solo funciona en el aprendizaje profundo si las características del modelo aprendidas en la primera tarea son generales.

<img src='https://drive.google.com/uc?export=view&id=1qUfvP-YW5KoW48548ywZzhpBF4-uUuFy' width="600" align="center" style="margin-right: 20px">







### ¿Entrenamiento Desde Cero o Transfer Learning?

Para crear un modelo de Deep Learning, puede entrenar el modelo desde cero o realizar Transfer Learning con un modelo previamente entrenado.

Desarrollar y entrenar un modelo desde cero funciona mejor para tareas muy específicas donde no se puedan utilizar modelos preexistentes. La desventaja de este enfoque es que generalmente requiere una gran cantidad de datos para obtener resultados precisos. Crear un modelo desde cero también funciona bien en casos donde redes más pequeñas pueden lograr la precisión deseada. Por ejemplo, las redes neuronales recurrentes (RNN) y las redes de memoria a corto-largo plazo (LSTM) son particularmente efectivas con datos secuenciales que varían en longitud, y resuelven problemas tales como clasificación de señales y predicción de series temporales.

Transfer Learning es útil en tareas para las que existen diversos modelos previamente entrenados. Por ejemplo, muchas redes neuronales convolucionales (CNN) populares se entrenan previamente con el conjunto de datos ImageNet, que contiene más de 14 millones de imágenes y miles de clases de imágenes. Si necesita clasificar imágenes de flores (o cualquier imagen no incluida en el conjunto de datos ImageNet) y tiene un número limitado de imágenes de flores, puede transferir las capas y pesos de una red SqueezeNet, reemplazar las capas finales y volver a entrenar el modelo con las imágenes que tiene.

Este enfoque de Transfer Learning ayuda a lograr mayor precisión en menos tiempo.



El objetivo de la transferencia de aprendizaje es mejorar el aprendizaje en la tarea objetivo aprovechando el conocimiento de la tarea de origen.

Hay tres medidas comunes mediante las cuales la transferencia puede mejorar el aprendizaje:

1. El rendimiento inicial alcanzable en la tarea objetivo utilizando solo el conocimiento transferido.
2. Cantidad de tiempo que se necesita para aprender completamente la tarea objetivo dado el conocimiento transferido en comparación con la cantidad de  tiempo en aprenderlo desde cero.
3. Nivel de rendimiento final alcanzable en la tarea objetivo al nivel final sin traspaso.

<img src='https://drive.google.com/uc?export=view&id=1zsA9JaTsW_PRdFmzO7OSEwYzN1NXv8C5' width="600" align="center" style="margin-right: 20px">

La forma de aprendizaje por transferencia que se utiliza en el aprendizaje profundo se denomina transferencia inductiva. Aquí es donde el alcance de los posibles modelos se reduce de una manera beneficiosa mediante el uso de un modelo que se ajusta a una tarea diferente pero relacionada. Otra área importante está en el contexto del aprendizaje por refuerzo e implica la extensión de algoritmos como Q-learning y búsqueda de políticas.

En una tarea de aprendizaje inductivo, el objetivo es inducir un modelo predictivo a partir de un conjunto de ejemplos de entrenamiento. (Mitchell, 1997). A menudo, el objetivo es la clasificación, es decir, asignar etiquetas de clase a los ejemplos. Ejemplos de Los sistemas de clasificación son redes neuronales artificiales y aprendices de reglas simbólicas.

Mitchell, T. (1997). Machine learning. New York: McGraw-Hill.

Metodología

1. Seleccione el modelo de origen. Se elige un modelo de origen entrenado previamente entre los modelos disponibles. Muchas instituciones de investigación publican modelos en conjuntos de datos grandes y desafiantes que pueden incluirse en el grupo de modelos candidatos entre los que elegir.

2. Modelo de reutilización. El modelo previamente entrenado se puede utilizar como punto de partida para un modelo en la segunda tarea de interés. Esto puede implicar el uso total o parcial del modelo, según la técnica de modelado utilizada.

3. Sintonizar modelo. Opcionalmente, el modelo puede necesitar ser adaptado o refinado en los datos del par de entrada-salida disponibles para la tarea de interés.

#<font color='green'>**Capstone Deep Learning**</font>

Este capstone consiste en entrenar un modelo para clasificar imágenes de perros y gatos. Para ello deberá utilizar transfer learning y fine tuning (ajuste fino)para construir su clasificador. Para crear su modelo de deep learning, deberá seguir los siguientes pasos:

1. **Seleccione el modelo de origen**. Debe elegir un modelo de origen entrenado previamente entre los modelos disponibles. Muchas instituciones de investigación publican modelos en conjuntos de datos grandes y desafiantes que pueden incluirse en el grupo de modelos candidatos entre los que elegir.

2. **Modelo de reutilización**. El modelo elegido (que ha sido previamente entrenado para una tarea de propósito general) se puede utilizar como punto de partida para un modelo en la segunda tarea de interés, en este caso para construir el clasificador de perros y gatos. Esto puede implicar el uso total o parcial del modelo, según la técnica de modelado utilizada.

3. **Sintonizar modelo**. Opcionalmente, el modelo puede necesitar ser adaptado o refinado en los datos del par de entrada-salida disponibles para la tarea de interés.

Utilizando el dataset de entrenamiento compartido en el link siguiente y un modelo preentrenado como por ejemplo **inceptionv3** o **resnet**, resuelva el problema de clasificacione de imagenes de perros y gatos.

Conjunto de entrenamiento:
 * https://drive.google.com/drive/folders/1ggWZk2Ywpg4oFgux-s32rOuWg6LLG2_M?usp=sharing

Posteriormente verifiquelo con el siguiente conjunto de datos.

Conjunto de prueba:
* https://drive.google.com/drive/folders/1QgDd4-MpVPkZJIHqoeoU2J1BjL2UHVaC?usp=sharing

Se sugiere utilizar dos aproximaciones:

1. **Transfer Learning**: tome una ConvNet que haya sido previamente entrenada en ImageNet por ejemplo, elimine la última capa fully connected y luego trate el resto de ConvNet como un extractor de características para el nuevo conjunto de datos. Una vez que extraiga las características de todas las imágenes, entrene un clasificador para el nuevo conjunto de datos.

Este metodo se puede mejorar utilizando

2. **Ajuste fino**: reemplace y reentrene el clasificador en la parte superior de ConvNet, y también ajuste los pesos de la red preentrenada mediante retropropagación.

Una vez construido su clasificador, entregue las métricas de performance de su modelo. En este caso, matriz de confusión, accuracy, precisión y recall. Recuerde que el resultado de su modelo debe ser evaluado sobre el conjunto de prueba. Además deberá graficar las curvas asociadas al proceso de entrenamiento del modelo.

Evalúe y analice los resultados obtenidos.