# **Utiliser AutoKeras pour de la Classification Binaire** - [Lire l'article](https://inside-machinelearning.com/autokeras-la-librairie-du-futur/)

## **Charger les données**

Dans ce programme, on va se servir d'**AutoKeras** pour faire de la **Classification de Texte**. Pour cela, on utilise les données de la **compétition Kaggle** *Natural Language Processing with Disaster Tweets*.

L'objectif est de **classifier des tweets** : parlent-ils de **catastrophes** entrain de se passer ou bien de **la vie de tous les jours ?**

Notre algorithmes de **Deep Learning** devra en décider **par lui-même !**

Ici on a donc des **données textes à classifier** en **1** (catastrophe) ou en **0** (vie quotidienne).

On commence par importer les **librairies de base** pour faire du **Machine Learning :**
- numpy
- pandas

In [1]:
import numpy as np
import pandas as pd

On importe les **tweets** qui se trouvent au **format CSV** sur **Github** à [cette adresse](https://github.com/tkeldenich/AutoKeras_BinaryClassification_DisasterTweet).

In [2]:
!git clone https://github.com/tkeldenich/AutoKeras_BinaryClassification_DisasterTweet.git  &> /dev/null

Ensuite on **charge** les données de **train** et de **test**.

Ici, une **différence** par rapport à d'habitude, pour utiliser AutoKeras nous devons **transformer notre liste** de tweet en **array numpy**, pour cela on utilise la fonction *to_numpy()*.

In [3]:
train_data = pd.read_csv('/content/AutoKeras_BinaryClassification_DisasterTweet/train.csv', index_col = 'id')
train_data = train_data.reset_index(drop = True)

X_train = train_data[['text']].to_numpy()
y_train = train_data[['target']].to_numpy()

In [4]:
test_data = pd.read_csv('/content/AutoKeras_BinaryClassification_DisasterTweet/test.csv')

test_id = test_data[['id']]

X_test = test_data[['text']].to_numpy()

On peut **vérifier** que nos données sont bien sous forme d'**array numpy** :

In [5]:
X_train

array([['Our Deeds are the Reason of this #earthquake May ALLAH Forgive us all'],
       ['Forest fire near La Ronge Sask. Canada'],
       ["All residents asked to 'shelter in place' are being notified by officers. No other evacuation or shelter in place orders are expected"],
       ...,
       ['M1.94 [01:04 UTC]?5km S of Volcano Hawaii. http://t.co/zDtoyd8EbJ'],
       ['Police investigating after an e-bike collided with a car in Little Portugal. E-bike rider suffered serious non-life threatening injuries.'],
       ['The Latest: More Homes Razed by Northern California Wildfire - ABC News http://t.co/YmY4rSkQ3d']],
      dtype=object)

### **Modèle AutoKeras**

Pour **utiliser AutoKeras** la première chose à faire est d'**installer la librairie** sur notre serveur :

In [6]:
!pip install autokeras &> /dev/null

On **importe** ensuite la **librairie**.

In [7]:
import autokeras as ak

La **partie intéressante** commence ! On veut faire de la **classification de texte**, on utilise donc la fonction *TextClassifier()* de **AutoKeras**.

Cette fonction possède un **paramètre** principale : **max_trials**.

**max_trials** permet de déterminer **le nombre de modèle** que AutoKeras va tester avant de **choisir le meilleur d'entre eux**.

**D'autres paramètres existe** que vous pouvez **consulter** sur la [documentation](https://autokeras.com/text_classifier/).

In [8]:
clf = ak.TextClassifier(
    max_trials=3
)

Puis, on **entraîne notre modèle !**

In [9]:
clf.fit(X_train, y_train, validation_split = 0.2, epochs=4)

Trial 3 Complete [00h 12m 40s]
val_loss: 0.38932037353515625

Best val_loss So Far: 0.38932037353515625
Total elapsed time: 00h 13m 58s
INFO:tensorflow:Oracle triggered exit
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4




INFO:tensorflow:Assets written to: ./text_classifier/best_model/assets


INFO:tensorflow:Assets written to: ./text_classifier/best_model/assets


**Simple, rapide, efficace...** que demande le peuple ?

On réalise ensuite notre **prédiction**.

In [10]:
predictions = clf.predict(X_test)

















Cette **prédiction** est **composé de 1 et de 0** au format **float**, on les transforme en **int**.

In [11]:
predictions = list(map(int, predictions))

**3 lignes de code** pour réaliser le **preprocessing, l'entraînement et la prédiction**. On peut **difficilement faire mieux !**

Et pour **exporter le modèle** et le **réutiliser ailleurs**, voilà **la marche à suivre :**

In [12]:
model = clf.export_model()


try:
    model.save("model_autokeras", save_format="tf")
except Exception:
    model.save("model_autokeras.h5")



INFO:tensorflow:Assets written to: model_autokeras/assets


INFO:tensorflow:Assets written to: model_autokeras/assets


Ainsi que les étapes pour **réutiliser ce modèle exporter** :

In [13]:
#loaded_model = load_model("model_autokeras", custom_objects=ak.CUSTOM_OBJECTS)
#prediction = loaded_model.predict(X_test)

Et voilà, nous avons vu la **base d'AutoKeras** et il ne vous reste plus qu'à l'**utiliser à votre guise.**

N'hésitez pas à **faire un tour** sur [la documentation d'AutoKeras](https://autokeras.com) pour en **apprendre plus.**

Cette librairie est un **petit bijoux** et n'annonce que du bon pour **le futur du Machine Learning !** ;)