<h1>Ejemplo de uso de la librería de AutoML AutoKeras</h1>

<hr>

<h3>En este Notebook se va a preparar y ejecutar un ejemplo básico de clasificación mediante AutoML a través de la librería AutoKeras, con el fin de tener una primera toma de contacto con ella y comprobar su correcto funcionamiento. El ejemplo aquí mostrado ha sido extraído de la documentación de AutoKeras (https://autokeras.com/tutorial/structured_data_classification/#a-simple-example).</h3>

<hr>

<h2>1. Importación de librerías y preparación del <i>dataset</i></h2>

<p>Se importan las librerías necesarias:</p>

In [1]:
import numpy as np
import pandas as pd
import tensorflow as tf
import autokeras as ak

Se carga un dataset de ejemplo del repositorio de Google, en este caso el del desastre del Titanic. Desde las URLs se extraen dos archivos CSV, uno con los datos de entrenamiento y el otro con los datos de prueba.

In [2]:
TRAIN_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/train.csv"
TEST_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/eval.csv"

train_file_path = tf.keras.utils.get_file("train.csv", TRAIN_DATA_URL)
test_file_path = tf.keras.utils.get_file("eval.csv", TEST_DATA_URL)

<h2>2. Declaración del clasificador de aprendizaje automático automatizado y búsqueda del mejor modelo</h2>

Creación del clasificador de aprendizaje automático automatizado de AutoKeras, configurado para ejecutar 3 repeticiones. Luego, se realiza su entrenamiento mediante el método <i>fit</i>, al que se le pasa el CSV con los datos de entrenamiento y el nombre de la columna objetivo. Cada repetición del entrenamiento tendrá un máximo de 10 <i>epochs</i>.

In [3]:
clf = ak.StructuredDataClassifier(overwrite=True, max_trials=3, project_name='autokeras_approach')
clf.fit(train_file_path, "survived", epochs=10)

Trial 3 Complete [00h 00m 01s]
val_accuracy: 0.852173924446106

Best val_accuracy So Far: 0.8782608509063721
Total elapsed time: 00h 00m 05s
INFO:tensorflow:Oracle triggered exit
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
INFO:tensorflow:Assets written to: ./autokeras_approach/best_model/assets


<p>Por último, una vez entrenado el clasificador, se comprueba su precisión. Para ello, en primer lugar se predecirá los valores de la columna 'survived' mediante el método <i>predict</i>, el cual necesitará el CSV con los datos de prueba. Una vez hecho, se evalúa la precisión con el método <i>evaluate</i> del clasificador.

In [4]:
predicted_y = clf.predict(test_file_path)
print(clf.evaluate(test_file_path, "survived"))

[0.45017048716545105, 0.7803030014038086]
