# Armando un data set personalizado y haciendo transfer learning
En este cuaderno vamos a ver uno de los conceptos mas importantes en deep learning que da enormes posibilidades de desarrollo para proyectos personalizados para cualquier aplicación.
Por otro lado, vamos a ver una forma rápida de armar un data set personalizado.

## Definición de Transfer Learning

> “El Transfer Learning, o aprendizaje transferido en español, se refiere al conjunto de métodos que permiten transferir conocimientos adquiridos gracias a la resolución de problemas para resolver otros problemas.”

El Transfer Learning ha tenido un gran éxito con el crecimiento del Deep Learning. Frecuentemente, los modelos utilizados en este campo necesitan grandes tiempos de cálculo y muchos recursos. Sin embargo, utilizando como punto de partida modelos pre-entrenados, el Transfer Learning permite desarrollar rápidamente modelos eficaces y resolver problemas complejos de Computer Vision o Natural Language Processing, NLP.

En la siguiente figura se aprecia el enfoque tradicional (izquierda) vs el enfoque de Transfer Learning

<figure>
 <img align="center", src="./Imagenes/05.png", style="width:90%;" >
</figure>

Como vemos, el Transfer Learning se inspira en el proceso natural de aprendizaje.

Tomemos el ejemplo de alguien que toca la guitarra y quiere aprender a tocar el piano. Esta persona puede capitalizar sus conocimientos sobre música para aprender a tocar un nuevo instrumento. De la misma manera, un modelo de reconocimiento de automóviles puede ser adaptado para reconocer camiones.

## ¿Sobre cuáles estrategias se apoyan las técnicas de Transfer Learning?

El Transfer Learning se basa en una idea simple, la de re explotar los conocimientos adquiridos por otras configuraciones (fuentes), para resolver un problema en particular (objetivos). En este contexto, podemos distinguir diferentes abordajes según lo que se quiere transferir, y cuando y como se realiza la transferencia. En términos generales, podemos distinguir 3 tipos de Transfer Learning:


### 1. Aprendizaje por transferencia inductiva o “inductive transfer learning”

En este enfoque, el campo de la fuente y el objetivo es el mismo (mismos datos), pero las tareas de fuente y objetivo son diferentes aunque parecidas. La idea consiste entonces en usar los modelos existentes para reducir de manera ventajosa el campo de aplicación de los modelos posibles (sesgo del modelo), como lo ilustra la figura siguiente:

<figure>
 <img align="center", src="./Imagenes/06.png", style="width:90%;" >
</figure>

Por ejemplo, es posible utilizar un modelo entrenado para la detección de animales en imágenes para construir un modelo capaz de identificar perros.

### 2. Aprendizaje por transferencia no supervisada, o “Unsupervised Transfer Learning”
Como en el caso del aprendizaje por transferencia inductiva, los campos de la fuente y el objetivo son similares, aunque las tareas son diferentes. Sin embargo, los datos en ambos campos no están etiquetados.

Generalmente es más fácil obtener grandes cantidades de datos no etiquetados, a partir de bases de datos y fuentes en la web por ejemplo, que datos etiquetados. Es por esto que la idea de usar el aprendizaje no supervisado combinado con el Transfer Learning ha generado mucho interés.

Por ejemplo, el Self-taught clustering es un método que permite realizar el clustering de pequeñas colecciones de datos objetivo no etiquetados, con la ayuda de una gran cantidad de datos fuente no etiquetados. Este método ha demostrado ser más efectivo que los métodos de punta tradicionalmente utilizados, en los que los datos objetivo no son etiquetados de forma pertinente.

### 3. Aprendizaje por transferencia transductiva o “Transductive Transfer Learning”:
En este método, las tareas fuente y objetivo son similares pero sus campos correspondientes son diferentes en términos de datos o de distribuciones de probabilidad marginales.

Por ejemplo, los modelos de NLP, como los que se utiliza para el etiquetado morfosintáctico de palabras, Part-Of-Speech Tagger (POS Tagger) en inglés, son generalmente entrenados y testeados con datos de actualidad como los del Wall Street Journal. Pueden ser adaptados a datos extraídos de redes sociales, cuyo contenido es diferente pero se asemeja al de los periódicos.

## ¿Cómo se aplica concretamente el Transfer Learning para la resolución de problemas de Deep Learning?

Ahora que hemos definido el Transfer Learning, podemos enfocarnos en problemas de Deep Learning, que está teniendo un gran éxito últimamente.

La utilización de métodos de Transfer Learning en Deep Learning consiste principalmente en explotar redes neuronales pre-entrenadas.

Generalmente, estos modelos corresponden a algoritmos de alto rendimiento que han sido desarrollados y entrenados sobre grandes bases de datos y que son hoy de libre acceso.

En este contexto, se pueden distinguir 2 tipos de estrategias :

### 1. Utilización de modelos pre-entrenados como extractores de features :

La arquitectura de estos modelos de Deep Learning se presenta frecuentemente bajo la forma de un compilado de capas de neuronas. Estas capas adquieren diferentes características en función del nivel en el que se sitúan. La última capa (generalmente una capa enteramente conectada, en el caso del aprendizaje supervisado), es utilizada para obtener el resultado final. La siguiente figura ilustra la arquitectura de un modelo de Deep Learning utilizado para la detección de gatos y perros. Mientras más profunda se sitúa la capa, más permite extraer features específicas.

<figure>
 <img align="center", src="./Imagenes/07.png", style="width:90%;" >
</figure>


La idea es reutilizar una red pre-entrenada sin capa final. Esta nueva red funciona como un extractor de features fijas para realizar otras tareas.

Para ilustrar esta estrategia, tomemos el caso en el que se desea crear un modelo capaz de identificar la especie de una flor a partir de su imagen. Para esto, será posible utilizar las primeras capas de un modelo de red neuronal convolutivo AlexNet, que fue inicialmente entrenado sobre la base de imágenes ImageNet para clasificar imágenes.

### 2. Ajustes de modelos pre-entrenados

Se trata de una técnica más compleja, en la que no solamente la última capa es reemplazada para realizar la clasificación o regresión, sino que también otras capas son re-entrenadas de manera selectiva. Las redes neuronales profundas son arquitecturas altamente configurables con diversos hiper-parámetros. Además, mientras que las primeras capas captaron características generales, las últimas capas se concentran principalmente en la tarea específica a cumplir, como lo muestra la siguiente figura:

<figure>
 <img align="center", src="./Imagenes/08.png", style="width:90%;" >
</figure>

La idea es *congelar*, es decir fijar el peso de ciertas capas durante el entrenamiento y afinar el resto para responder al problema.

Esta estrategia permite reutilizar los conocimientos en términos de arquitectura global de la red y explotar sus estados como punto de partida para el entrenamiento. Permite obtener mejores resultados en un tiempo de entrenamiento más corto.

## Modelos mas utilizados

Una de las exigencias fundamentales del aprendizaje por transferencia es la presencia de modelos que funcionen bien para las tareas fuente. Por suerte, existen varias arquitecturas de Deep Learning de punta que son hoy de libre acceso. Estas se extienden sobre diferentes campos como la visión por computadora o Computer Vision, y el Tratamiento Natural del Lenguaje o NLP, dos campos muy populares en Deep Learning.

Entre los modelos más utilizados están:

- Computer Vision : VGG-16, VGG-19, ResNet-50
- NLP : Word2Vec, GloVe

## ¡Como podemos armar nuestro propio Data Set?

1. Vamos a descargar una aplicación de Google que nos permite descargar todas las imágenes que tenemos en la página que estamos viendo: https://chrome.google.com/webstore/detail/download-all-images/ifipmflagepipjokmbdecpmjbibjnakm

2. Vamos al buscardor de imágenes y buscamos todas aquellas imágenes que necesitemos para el proyecto.

3. Presionamos en "zip", que es la extensión que se instaló en la parte superior derecha.

4. En el explorador de windows, descomprimir los .zip y armar una carpeta por cada clase a clasificar. Hay que eliminar las imágenes que no sirvan, que no sean representativas de lo que queremos clasificar y todos aquellos archivos que no sean formato de imágen.

5. Zipiar clas fotos (no la carpeta) y reservar para mas adelante

6. Desde Colab, continuar con el siguiente código

In [None]:
#Crear las carpetas para subir las imagenes
!mkdir cuchillos
!mkdir cucharas
!mkdir tenedores

In [None]:
# Subir los zip en cada una de las carpetas, luego
#Entrar en cada carpeta y descomprimir el archivo zip
%cd /content/cuchillos
!unzip cuchillos.zip
%cd ..

%cd /content/tenedores
!unzip tenedores.zip
%cd ..

%cd /content/cucharas
!unzip cucharas.zip
%cd ..

In [None]:
#Borrar los archivo ZIP
!rm -rf /content/cucharas/cucharas.zip
!rm -rf /content/cuchillos/cuchillos.zip
!rm -rf /content/tenedores/tenedores.zip

In [None]:
#Mostrar cuantas imagenes tengo de cada categoria
!ls /content/cucharas | wc -l 
!ls /content/cuchillos | wc -l 
!ls /content/tenedores | wc -l 

In [None]:
#Mostrar algunas imagenes con pyplot
import os
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

plt.figure(figsize=(15,15))

carpeta = '/content/cuchillos'
imagenes = os.listdir(carpeta)

for i, nombreimg in enumerate(imagenes[:25]):
  plt.subplot(5,5,i+1)
  imagen = mpimg.imread(carpeta + '/' + nombreimg)
  plt.imshow(imagen)

In [None]:
#Crear carpetas para hacer el set de datos

!mkdir dataset
!mkdir dataset/cuchillo
!mkdir dataset/tenedor
!mkdir dataset/cuchara

In [None]:
#Copiar imagenes que subimos a carpetas del dataset
#Limitar para que todos tengan la misma cantidad de imagenes
#maximo 103 (el num. menor de imagenes que subi)

import shutil
carpeta_fuente = '/content/cuchillos'
carpeta_destino = '/content/dataset/cuchillo'

imagenes = os.listdir(carpeta_fuente)

for i, nombreimg in enumerate(imagenes):
  if i < 103:
    #Copia de la carpeta fuente a la destino
    shutil.copy(carpeta_fuente + '/' + nombreimg, carpeta_destino + '/' + nombreimg)

In [None]:
carpeta_fuente = '/content/tenedores'
carpeta_destino = '/content/dataset/tenedor'

imagenes = os.listdir(carpeta_fuente)

for i, nombreimg in enumerate(imagenes):
  if i < 103:
    #Copia de la carpeta fuente a la destino
    shutil.copy(carpeta_fuente + '/' + nombreimg, carpeta_destino + '/' + nombreimg)

In [None]:
carpeta_fuente = '/content/cucharas'
carpeta_destino = '/content/dataset/cuchara'

imagenes = os.listdir(carpeta_fuente)

for i, nombreimg in enumerate(imagenes):
  if i < 103:
    #Copia de la carpeta fuente a la destino
    shutil.copy(carpeta_fuente + '/' + nombreimg, carpeta_destino + '/' + nombreimg)

In [None]:
#Mostrar cuantas imagenes tengo de cada categoria en el dataset
!ls /content/dataset/cuchara | wc -l
!ls /content/dataset/cuchillo | wc -l
!ls /content/dataset/tenedor | wc -l

In [None]:
#Aumento de datos con ImageDataGenerator
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import numpy as np

#Crear el dataset generador
datagen = ImageDataGenerator(
    rescale=1. / 255,
    rotation_range = 30,
    width_shift_range = 0.25,
    height_shift_range = 0.25,
    shear_range = 15,
    zoom_range = [0.5, 1.5],
    validation_split=0.2 #20% para pruebas
)

#Generadores para sets de entrenamiento y pruebas
data_gen_entrenamiento = datagen.flow_from_directory('/content/dataset', 
                                                     target_size=(224,224),
                                                     batch_size=32, 
                                                     shuffle=True, 
                                                     subset='training')
data_gen_pruebas = datagen.flow_from_directory('/content/dataset', 
                                               target_size=(224,224),
                                               batch_size=32, 
                                               shuffle=True, 
                                               subset='validation')

#Imprimir 10 imagenes del generador de entrenamiento
for imagen, etiqueta in data_gen_entrenamiento:
  for i in range(10):
    plt.subplot(2,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.imshow(imagen[i])
  break
plt.show()


In [None]:
import tensorflow as tf
import tensorflow_hub as hub

# Traemos un modelo pre entrenado sin la ultima capa
url = "https://tfhub.dev/google/tf2-preview/mobilenet_v2/feature_vector/4"
mobilenetv2 = hub.KerasLayer(url, input_shape=(224,224,3))

In [None]:
#Congelar el modelo descargado para que no reentrene estas capas
mobilenetv2.trainable = False

In [None]:
# Reemplazamos la capa de salida por nuestra capa de salida
modelo = tf.keras.Sequential([
    mobilenetv2,
    tf.keras.layers.Dense(3, activation='softmax')])

In [None]:
# vemos la arquitectura de nuestro modelo
modelo.summary()

In [None]:
#Compilar como siempre
modelo.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy'])

In [None]:
#Entrenar el modelo
EPOCAS = 50

historial = modelo.fit(
    data_gen_entrenamiento, epochs=EPOCAS, batch_size=32,
    validation_data=data_gen_pruebas)

In [None]:
#Graficas de precisión
acc = historial.history['accuracy']
val_acc = historial.history['val_accuracy']

loss = historial.history['loss']
val_loss = historial.history['val_loss']

rango_epocas = range(50)

plt.figure(figsize=(8,8))
plt.subplot(1,2,1)
plt.plot(rango_epocas, acc, label='Precisión Entrenamiento')
plt.plot(rango_epocas, val_acc, label='Precisión Pruebas')
plt.legend(loc='lower right')
plt.title('Precisión de entrenamiento y pruebas')

plt.subplot(1,2,2)
plt.plot(rango_epocas, loss, label='Pérdida de entrenamiento')
plt.plot(rango_epocas, val_loss, label='Pérdida de pruebas')
plt.legend(loc='upper right')
plt.title('Pérdida de entrenamiento y pruebas')
plt.show()

In [None]:
#Categorizar una imagen de internet
from PIL import Image
import requests
from io import BytesIO
import cv2

def categorizar(url):
  respuesta = requests.get(url)
  img = Image.open(BytesIO(respuesta.content))
  img = np.array(img).astype(float)/255

  img = cv2.resize(img, (224,224))
  prediccion = modelo.predict(img.reshape(-1, 224, 224, 3))
  return np.argmax(prediccion[0], axis=-1)


In [None]:
#0 = cuchara, 1 = cuchillo, 2 = tenedor
url = 'https://github.com/IngCarlaPezzone/Clase-Machine-Learning/blob/main/Clase%2016/cuchara.jpg?raw=true' #debe ser 0
prediccion = categorizar (url)
print(prediccion)

In [None]:
url = 'https://github.com/IngCarlaPezzone/Clase-Machine-Learning/blob/main/Clase%2016/cuchillo.jpg?raw=true' #debe ser 1
prediccion = categorizar (url)
print(prediccion)

In [None]:
url = 'https://github.com/IngCarlaPezzone/Clase-Machine-Learning/blob/main/Clase%2016/tenedor.jpg?raw=true' #debe ser 2
prediccion = categorizar (url)
print(prediccion)

In [None]:
#Crear la carpeta para exportarla a TF Serving
!mkdir -p carpeta_salida/modelo_cocina/1

In [None]:
#Guardar el modelo en formato SavedModel
modelo.save('carpeta_salida/modelo_cocina/1')

In [None]:
#Hacerlo un zip para bajarlo y usarlo en otro lado
!zip -r modelo_cocina.zip /content/carpeta_salida/modelo_cocina/