<a href="https://colab.research.google.com/github/Bennath-coder/Bennath-coder/blob/main/De%CC%81couverte_de_Gradio_Live%20coding_vNPz.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Pour débuter avec Gradio, nous aurons besoin d'installer la librairie dédiée.

In [1]:
!pip install gradio

Collecting gradio
  Downloading gradio-5.20.0-py3-none-any.whl.metadata (16 kB)
Collecting aiofiles<24.0,>=22.0 (from gradio)
  Downloading aiofiles-23.2.1-py3-none-any.whl.metadata (9.7 kB)
Collecting fastapi<1.0,>=0.115.2 (from gradio)
  Downloading fastapi-0.115.11-py3-none-any.whl.metadata (27 kB)
Collecting ffmpy (from gradio)
  Downloading ffmpy-0.5.0-py3-none-any.whl.metadata (3.0 kB)
Collecting gradio-client==1.7.2 (from gradio)
  Downloading gradio_client-1.7.2-py3-none-any.whl.metadata (7.1 kB)
Collecting groovy~=0.1 (from gradio)
  Downloading groovy-0.1.2-py3-none-any.whl.metadata (6.1 kB)
Collecting markupsafe~=2.0 (from gradio)
  Downloading MarkupSafe-2.1.5-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.0 kB)
Collecting pydub (from gradio)
  Downloading pydub-0.25.1-py2.py3-none-any.whl.metadata (1.4 kB)
Collecting python-multipart>=0.0.18 (from gradio)
  Downloading python_multipart-0.0.20-py3-none-any.whl.metadata (1.8 kB)
Collecting ruff>=0.9.3

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

import pickle
import gradio as gr
from sklearn.feature_extraction.text import CountVectorizer
from keras.models import load_model

Notre objectif est de venir créer une interface graphique avec Gradio afin d'intéragir avec nos modèles comme on pourrait le faire avec une application en production.

Gradio va nous permettre de créer et de personnaliser cette interface.

Nous travaillerons à partir du dataset *SMS Spam Collection*. Ce jeu de données est une collection de SMS pouvant être des spams.

On cherche à créer une application simple sur laquelle l'utilisateur a le choix du modèle qu'il utilise et peut venir rentrer son propre sms afin de tester s'il s'agit d'un spam ou non.

## Chargement des données

On commence par récupérer les données et les mettre sous la forme d'un dataset pandas.

In [9]:
with open(f'SMSSpamCollection.txt') as f: # On lit le fichier
  data = f.readlines()

data = [content.split('\t') for content in data] # On sépare les mails

y = []
for target in [content[0] for content in data]: # On crée la colonne y
  y.append(0 if target=='ham' else 1)
y = np.array(y)

X = [content[1].strip('\n') for content in data] # On crée la colonne X
X = np.array(X)

df = pd.DataFrame([X, y]).T # Puis le dataframe
df.columns = ['sms_content', 'is_spam']
df['is_spam'] = df['is_spam'].astype('int')

In [10]:
df.head()

Unnamed: 0,sms_content,is_spam
0,"Go until jurong point, crazy.. Available only ...",0
1,Ok lar... Joking wif u oni...,0
2,Free entry in 2 a wkly comp to win FA Cup fina...,1
3,U dun say so early hor... U c already then say...,0
4,"Nah I don't think he goes to usf, he lives aro...",0


In [11]:
df.shape

(5574, 2)

Nous allons utiliser un **vectorizer** qui va nous permettre de transformer les données textuelles sous forme de vecteurs compréhensibles par nos modèles.

In [12]:
from sklearn.model_selection import train_test_split

X = df['sms_content'].values
y = df['is_spam'].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [13]:
vectorizer = CountVectorizer()
vectorizer.fit(X_train)

## Chargement des modèles

Nous allons récupérer deux modèles déjà entraînés sur le problème de classification des SMS.

Importons d'abord un modèle de régression logistique :

In [14]:
with open('logistic_regression.pkl', 'rb') as f:
    logistic_regression = pickle.load(f)

https://scikit-learn.org/stable/model_persistence.html#security-maintainability-limitations


In [15]:
logistic_regression

Puis un réseau de neurones Keras :

In [16]:
neural_network = load_model('neural_network.h5')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [17]:
neural_network.summary()

A partir de ces deux modèles, il faut que l'on puisse réaliser une prédiction à partir d'un nouveau SMS. Ecrivons une fonction pour cela :

In [19]:
def prediction(model_choice, sms_to_test):
  # On transforme le SMS que l'on souhaite tester en vecteur
  sms_to_test = pd.Series(sms_to_test)
  sms_to_test = vectorizer.transform(sms_to_test)

  # Puis on choisit un modèle parmi les deux disponibles.
  if model_choice == 'Neural Network':
    prediction = neural_network.predict(sms_to_test)[0][0]
    confidence = f" (le modèle est confiant à {prediction:.2%})"
    return "Le SMS n'est pas un spam" + confidence if prediction < 0.5 else "Le SMS est un spam" + confidence

  elif model_choice == 'Logistic Regression':
    prediction = logistic_regression.predict_proba(sms_to_test)[0][1]
    confidence = f" (le modèle est confiant à {prediction:.2%})"
    return "Le SMS n'est pas un spam" + confidence if prediction < 0.5 else "Le SMS est un spam" + confidence

## Interface Gradio

Avec très peu de code, on peut construire une application Gradio fonctionnelle qui répond à nos besoins:

In [None]:
# Créer une interface Gradio
demo = gr.Interface(fn=prediction, # Il faut passer ici la fonction que l'on a créé
                    inputs= [gr.Radio(['Neural Network', 'Logistic Regression'], label="Model"), #Les inputs décrivent le fonctionnement de l'app
                             gr.Textbox()],
                    outputs="text")

demo.launch(debug=True)

Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://9a76e4b1f35f797691.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 326ms/step


Quelques SMS à tester :

> You just win 100 dollars ! You have won a week in mexico ! Please contact me to collect your gift and reward

> You have won a 1 week free membership in our 1 000 000 prize jackpot !

> Thanks for your subscription to our service, your mobile will be charged $5/month







