# Creación de un modelo basado en Fine-Tuning de un modelo de terceros


En este notebook se realizará un procedimiento de Fine-Tunning sobre un modelo de terceros con el fin de batir los resultados de los anteriores modelos construidos


In [1]:
import sys

sys.path.append("../")  # Add the parent directory to the Python path

In [2]:
from src.data.data_loader import data_loader, data_loader_test
from src.models.train import ModelTrainer, ModelConfiguration
from src.models.evaluator import ModelEvaluator

## Carga de datos de entrenamiento


In [3]:
train_data, val_data = data_loader("../data/train", (150, 150), batch_size=128)

Found 12777 files belonging to 6 classes.
Using 10222 files for training.
Using 2555 files for validation.


## Carga del modelo preentrenado desde el catálogo de Keras


Se ha incluido dentro de la clase `ModelTrainer` la posibilidad de elegir entrenar un modelo basado en `Xception`.

#### Xception

La decisión de utilizar `Xception` frente a otros modelos de visión artificial viene motivada por los siguientes puntos:

- **Bajo número de parámetros**: A pesar de su alto rendimiento, `Xception` tiene un número relativamente bajo de parámetros en comparación con otras arquitecturas profundas. Esto hace que el modelo sea eficiente en cuanto a memoria y recursos computacionales, lo que es beneficioso para el desarrollo de esta práctica, ya que se cuenta con una modesta RTX 3060.

- **Características no probadas hasta ahora**: Xception` incluye en su arquitectura características innovadoras, como las convoluciones separables en profundidad y los módulos de afinidad lineal. Estas características no se habían probado en los modelos simple y aumentado, por lo que es interesante que a la hora de eligir un modelo externo se apueste por uno con funciones diferentes.


In [4]:
# El número de capas de Xception a entrenar es de 5, ya que no se quiere hacer fine tunning de demasiadas capas.
# Utilizando el equipo portátil del que se dispone no es recomendable incrementar este número

# El total de parámetros a entrenar del modelo es de 9.729.094, lo que es asumible
N_LAYERS_TO_TRAIN = 5

In [5]:
custom_xception_model = ModelTrainer(
    "xception_finetuned",
    ModelConfiguration.XCEPTION_CUSTOM,
    6,
)

In [6]:
custom_xception_model.train(
    train_data, val_data, epochs=25, n_layers_to_train=N_LAYERS_TO_TRAIN
)

[1;38;5;39mCOMET INFO:[0m Couldn't find a Git repository in 'c:\\Users\\pablo\\Documents\\Master\\Modulo_8\\notebooks' nor in any parent directory. Set `COMET_GIT_DIRECTORY` if your Git Repository is elsewhere.
[1;38;5;39mCOMET INFO:[0m Experiment is live on comet.com https://www.comet.com/pablotorresr/modulo8/2d576540d11f47f69981532e960c8160



Model: "model"
__________________________________________________________________________________________________
 Layer (type)                   Output Shape         Param #     Connected to                     
 input_1 (InputLayer)           [(None, 150, 150, 3  0           []                               
                                )]                                                                
                                                                                                  
 block1_conv1 (Conv2D)          (None, 74, 74, 32)   864         ['input_1[0][0]']                
                                                                                                  
 block1_conv1_bn (BatchNormaliz  (None, 74, 74, 32)  128         ['block1_conv1[0][0]']           
 ation)                                                                                           
                                                                                              



INFO:tensorflow:Assets written to: bestvalue\assets


INFO:tensorflow:Assets written to: bestvalue\assets


Epoch 2/25



INFO:tensorflow:Assets written to: bestvalue\assets


INFO:tensorflow:Assets written to: bestvalue\assets


Epoch 3/25
Epoch 4/25
Epoch 5/25



INFO:tensorflow:Assets written to: bestvalue\assets


INFO:tensorflow:Assets written to: bestvalue\assets


Epoch 6/25



INFO:tensorflow:Assets written to: bestvalue\assets


INFO:tensorflow:Assets written to: bestvalue\assets


Epoch 7/25



INFO:tensorflow:Assets written to: bestvalue\assets


INFO:tensorflow:Assets written to: bestvalue\assets


Epoch 8/25
Epoch 9/25
Epoch 10/25
Epoch 11/25
Epoch 12/25
Epoch 13/25
Epoch 14/25
Epoch 15/25
Epoch 16/25
Epoch 17/25


[1;38;5;39mCOMET INFO:[0m ---------------------------------------------------------------------------------------
[1;38;5;39mCOMET INFO:[0m Comet.ml Experiment Summary
[1;38;5;39mCOMET INFO:[0m ---------------------------------------------------------------------------------------
[1;38;5;39mCOMET INFO:[0m   Data:
[1;38;5;39mCOMET INFO:[0m     display_summary_level : 1
[1;38;5;39mCOMET INFO:[0m     url                   : https://www.comet.com/pablotorresr/modulo8/2d576540d11f47f69981532e960c8160
[1;38;5;39mCOMET INFO:[0m   Uploads:
[1;38;5;39mCOMET INFO:[0m     conda-environment-definition : 1
[1;38;5;39mCOMET INFO:[0m     conda-info                   : 1
[1;38;5;39mCOMET INFO:[0m     conda-specification          : 1
[1;38;5;39mCOMET INFO:[0m     environment details          : 1
[1;38;5;39mCOMET INFO:[0m     filename                     : 1
[1;38;5;39mCOMET INFO:[0m     installed packages           : 1
[1;38;5;39mCOMET INFO:[0m     notebook                 

INFO:tensorflow:Assets written to: ../models/xception_finetuned\assets


INFO:tensorflow:Assets written to: ../models/xception_finetuned\assets


## Test del modelo Xception con Fine-Tuning


In [10]:
SAVED_MODEL_ROUTE = "../models/xception_finetuned"
test_data = data_loader_test("../data/test", (150, 150))

Found 4257 files belonging to 6 classes.


In [11]:
model_evaluator = ModelEvaluator(SAVED_MODEL_ROUTE)

In [12]:
model_evaluator.evaluate(test_data)

[1;38;5;39mCOMET INFO:[0m Couldn't find a Git repository in 'c:\\Users\\pablo\\Documents\\Master\\Modulo_8\\notebooks' nor in any parent directory. Set `COMET_GIT_DIRECTORY` if your Git Repository is elsewhere.
[1;38;5;39mCOMET INFO:[0m Experiment is live on comet.com https://www.comet.com/pablotorresr/modulo8/9b9480d91d76479190fab4f68c3fe913





[1;38;5;39mCOMET INFO:[0m ---------------------------------------------------------------------------------------
[1;38;5;39mCOMET INFO:[0m Comet.ml Experiment Summary
[1;38;5;39mCOMET INFO:[0m ---------------------------------------------------------------------------------------
[1;38;5;39mCOMET INFO:[0m   Data:
[1;38;5;39mCOMET INFO:[0m     display_summary_level : 1
[1;38;5;39mCOMET INFO:[0m     url                   : https://www.comet.com/pablotorresr/modulo8/9b9480d91d76479190fab4f68c3fe913
[1;38;5;39mCOMET INFO:[0m   Metrics:
[1;38;5;39mCOMET INFO:[0m     test_metrics : [1.1878060102462769, 0.7495889067649841]
[1;38;5;39mCOMET INFO:[0m   Uploads:
[1;38;5;39mCOMET INFO:[0m     conda-environment-definition : 1
[1;38;5;39mCOMET INFO:[0m     conda-info                   : 1
[1;38;5;39mCOMET INFO:[0m     conda-specification          : 1
[1;38;5;39mCOMET INFO:[0m     environment details          : 1
[1;38;5;39mCOMET INFO:[0m     filename                    

#### Análisis de resultados

El resultado final de evaluar el modelo con Fine Tuning sobre el set de test de un accuracy del `0.7496`. </br>
Esta métrica es inferior a la obtenida en nuestro modelo optimizando los hiperparámetros. Para mejorar este bajo rendimiento se propone lo siguiente:

- Añadir más capas densas en el tramo final, para poder que la información proveniente de Xception se acople mejor

- Descongelar más capas de Xception

Ambas soluciones implican un gran coste computacional, por lo que es mejor antes probar otras alternativas, como entrenar el modelo con un set de imágenes aumentadas.

#### Desventajas adicionales del modelo

Debido a que el modelo cuenta con muchas más capas y neuronas que los anteriores, se ha observado que el tiempo de inferencia es también bastante superior. `40ms vs 400ms` por inferencia
