### AUTO-KERAS

<img src="https://i0.wp.com/datasmarts.net/es/wp-content/uploads/2019/08/16334080-c4f5-11e9-800f-2ca025732007.png?resize=1020%2C511&ssl=1" alt="Drawing" style="width: 500px;"/>
Auto-keras es uno de los frameworks más utilizados dentro del AutoMl. Como el nombre indica, es un sistema basado en Keras, uno de los frameworks más populares para el Deep Learning. El diseño de AutoKeras sigue el clásico diseño utilizado por la API de Scikit-Learn.

AutoKeras incluye funcionalidades de optimización de hiperparámetros durante el proceso de DL (Deep Learning), la clave para ello reside en el uso de algoritmos NAS (Neural Architecture Search). NAS reemplaza al ingeniero/profesional de DL por un conjunto de algoritmos que ajusta automáticamente el modelo.

En la actualidad, AutoKeras da soporte a varios tipos de modelos:

- Deep Learning
    - Image Classification
    - Image Regression
    - Text Classification
    - Text Regression
- Tabular Dataset
    - Structured Data Classification
    - Structured Data Regression
- No implementado pero disponible en futuras actualizaciones 
    - Time Series Forcasting
    - Object Detection
    - Image Segmentation
    
Como podemos deducir por la lista anterior, AutoKeras es un package en continua evolución. Por otro lado una de las características más complejas de AutoKeras, es AutoModel.

## Pruebas


In [1]:
#!pip install git+https://github.com/keras-team/keras-tuner.git
#!pip install autokeras

In [2]:
import numpy as np
import pandas as pd
import tensorflow as tf

import autokeras as ak

In [3]:
TRAIN_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/train.csv"
TEST_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/eval.csv"
train_file_path = tf.keras.utils.get_file("train.csv", TRAIN_DATA_URL)
test_file_path = tf.keras.utils.get_file("eval.csv", TEST_DATA_URL)
#train_file_path = "./titanic/train.csv"
#test_file_path = "./titanic/test.csv"

In [4]:
# Initialize the structured data classifier.
clf = ak.StructuredDataClassifier(
    overwrite=True, max_trials=10
)  # It tries 3 different models.
# Feed the structured data classifier with training data.
clf.fit(
    # The path to the train.csv file.
    train_file_path,
    # The name of the label column.
    "survived",
    epochs=10,
)
# Predict with the best model.
predicted_y = clf.predict(test_file_path)
# Evaluate the best model with testing data.
print(clf.evaluate(test_file_path, "survived"))

Trial 10 Complete [00h 00m 04s]
val_accuracy: 0.852173924446106

Best val_accuracy So Far: 0.886956512928009
Total elapsed time: 00h 00m 33s
INFO:tensorflow:Oracle triggered exit
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
INFO:tensorflow:Assets written to: ./structured_data_classifier/best_model/assets


[0.47048333287239075, 0.7878788113594055]


StructuredDataClassifier es bastante flexible en cuanto a el formato de datos.

En el ejemplo anterior se ha mostrado cómo utilizar archivos CSV. Además de CSV, también soporta numpy.ndarray, pandas.DataFrame o tf.data.Dataset. Los datos deben ser bidimensionales con valores numéricos o categóricos.

Para las etiquetas de clasificación, AutoKeras acepta tanto etiquetas simples, es decir, strings o int, como etiquetas codificadas con un solo punto, es decir, vectores de 0s y 1s. Las etiquetas pueden ser numpy.ndarray, pandas.DataFrame, o pandas.Series.


También se pueden especificar los nombres de las columnas y los tipos de los datos. La columna_names es opcional. Cualquier columna cuyo tipo no se especifique se inferirá de los datos de entrenamiento.


#### Argumentos

column_names:Una lista de strings que especifica los nombres de las columnas, el tamaño de la lista debe ser igual al numero de columnas de los datos, sin incluir la del target. Si no se especifica se selecciona de la cabecera del csv o del pandas.DataFrame.

column_types: Diccionario. Las claves son los nombres de las columnas. Los valores deben ser 'numerical' o 'categorical', indicando el formato de la columna. El valor por defecto es None. Si no es None, hay que especificar los nombres de las columnas. Si es None, se deducirá de los datos..

num_classes: Int. Por defecto es None. Si es None, se deducirá de los datos.

multi_label: Boolean. Por defecto False.

loss: Función de pérdida de Keras. Por defecto utiliza 'binary_crossentropy' o 'categorical_crossentropy' en función del número de clases.

metrics: Una lista de métricas de Keras. Por defecto se utiliza 'accuracy'.

project_name: String.El nombre del AutoModel. Por defecto es 'structured_data_classifier'.

max_trials: Int. El número máximo de modelos a probar. Por defecto 100.

directory: String.La ruta a un directorio para almacenar los resultados de la búsqueda. Por defecto es None, que crearía una carpeta con el nombre del AutoModel en el directorio actual.

objective: String.Nombre de la métrica del modelo a minimizar o maximizar. Por defecto es 'val_accuracy'.

overwrite: Boolean. Por defecto es False. Si es False, recarga un proyecto existente con el mismo nombre si se encuentra uno. En caso contrario, crea el proyecto.

In [5]:
# Initialize the structured data classifier.
clf = ak.StructuredDataClassifier(
    column_names=[
        "sex",
        "age",
        "n_siblings_spouses",
        "parch",
        "fare",
        "class",
        "deck",
        "embark_town",
        "alone",
    ],
    column_types={"sex": "categorical", "fare": "numerical"},
    max_trials=10,  # It tries 10 different models.
    overwrite=True,
)

clf.fit(
    # The path to the train.csv file.
    train_file_path,
    # The name of the label column.
    "survived",
    epochs=10,
)
# Predict with the best model.
predicted_y = clf.predict(test_file_path)
# Evaluate the best model with testing data.
print(clf.evaluate(test_file_path, "survived"))

Trial 10 Complete [00h 00m 03s]
val_accuracy: 0.8782608509063721

Best val_accuracy So Far: 0.886956512928009
Total elapsed time: 00h 00m 31s
INFO:tensorflow:Oracle triggered exit
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
INFO:tensorflow:Assets written to: ./structured_data_classifier/best_model/assets


[0.43632370233535767, 0.810606062412262]


El mejor modelo encontrado por AutoKeras, se puede exportar como un modelo de Keras.


In [7]:
model = clf.export_model()



## AutoModel

AutoModel permite que especificando unicamente las entradas y salidas del modelo, el framework infiera el resto del modelo.

Cuando se realiza una tarea en concreto como clasificación de imágenes o regresión de imagenes se pueden utilizar las APIs más sencillas proporcionadas por AutoKeras llamadas Task API: ImageClassifier, ImageRegressor, TextClassifier, TextRegressor, etc. En este caso tienes una entrada (imagen o texto o datos tabulares, ...) y una salida (clasificación, regresión). 

Con AutoModel, sin embargo cuando te encuentras en una situación en la que tienes por ejemplo una tarea que requiere una arquitectura de múltiples entradas/salidas, entonces no puedes utilizar directamente la API de tareas, y aquí es donde Automodel actua como la API de E/S. 

Keras AutoModel se utiliza principalmente para Multi-Modal y Multi-Task. 

Datos multimodales significa que cada instancia de datos tiene múltiples formas de información. Por ejemplo, una foto puede ser guardada como una imagen. Además de la imagen, también puede tener como atributos cuándo y dónde fue tomada, lo que puede representarse como datos estructurados.

La multitarea se refiere a que queremos predecir múltiples objetivos con las mismas características de entrada. Por ejemplo, no sólo queremos clasificar una imagen en función de su contenido, sino que también queremos regresionar su calidad como un número float entre 0 y 1.


### Ventajas:

- Rápida configuración y puesta en marcha.
- Imita la API de Keras y por lo tanto es fácil de usar.
    
### Contras:
- En comparación con otros frameworks,no da mucha información en cuanto a conocer los parametros del mejor modelo que AutoKeras eligio.  
- Solo utiliza modelos de DL. Otros frameworks ofrecen además modelos de ML que aveces pueden ser útiles si la explicavilidad del modelo es calve. 