# üß† Application Deep Learning - Classification de sentiments dans des textes

Ce projet consiste √† d√©velopper une application de classification automatique de sentiments dans des textes en fran√ßais et en anglais, √† l‚Äôaide de techniques de traitement du langage naturel (NLP) et de machine learning.

L‚Äôobjectif est de permettre √† un utilisateur de saisir son opinion, puis d‚Äôobtenir imm√©diatement une pr√©diction du sentiment (positif ou n√©gatif) via une interface web interactive d√©ploy√©e avec Streamlit.

## ‚úÖ . Les √©tapes r√©alis√©es dans le projet

 1.  Cr√©ation manuelle d‚Äôun fichier sentiment_data.csv contenant des phrases annot√©es avec les labels "positive" ou "negative" pour entra√Æner le mod√®le.

 2. Installation des biblioth√®ques n√©cessaires

 3. Cr√©ation du fichier train_model.py

 4. Cr√©ation du fichier app.py

 5. Ex√©cution de l'application

 6. D√©ploiement de l'application



 


 ## 1.  Cr√©ation manuelle d‚Äôun fichier sentiment_data.csv contenant des phrases annot√©es avec les labels "positive" ou "negative" pour entra√Æner le mod√®le.


![Texte alternatif](capture1s.png)

 ## 2. Installation des biblioth√®ques n√©cessaires

![Texte alternatif](Capture2s.png)

## 3. Cr√©ation du fichier train_model.py

Ce script lit un fichier CSV contenant des textes et leurs sentiments (positif ou n√©gatif), nettoie les textes, les transforme en vecteurs num√©riques gr√¢ce √† la m√©thode TF-IDF, puis entra√Æne un mod√®le de machine learning LinearSVC pour pr√©dire les sentiments. Enfin, il √©value les performances du mod√®le et sauvegarde √† la fois le mod√®le entra√Æn√© et le vectoriseur pour une utilisation future dans l'application.

  ‚úÖ **Explication du script** :


üîÅ 3.1 Importation des biblioth√®ques

In [None]:
import pandas as pd
import joblib
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import LinearSVC
from sklearn.metrics import classification_report


- pandas : pour manipuler les donn√©es

- joblib : pour sauvegarder le mod√®le et le vectoriseur

- train_test_split :  pour diviser les donn√©es en entra√Ænement/test

- TfidfVectorizer :  pour convertir le texte en vecteurs num√©riques

- LinearSVC : comme mod√®le de classification

- classification_report :  pour √©valuer les performances


üìÇ 3.2  Chargement du jeu de donn√©es

In [None]:
df = pd.read_csv(r'C:\Users\USER\Documents\monprojetmaching\sentiment_data.csv')


Cette √©tape est pour lire  un fichier .csv contenant des textes et leurs √©tiquettes de sentiment (positive ou negative), avec deux colonnes : text et label.

üßπ 3.3 Nettoyage des textes

In [None]:
df['text'] = df['text'].str.lower().str.replace(r'[^\w\s]', '', regex=True)


- Tous les textes sont mis en minuscules (str.lower())

- Suppression de la ponctuation √† l‚Äôaide d‚Äôune expression r√©guli√®re ([^\w\s])



üßÆ 3.4 Vectorisation TF-IDF

In [None]:
vectorizer = TfidfVectorizer(max_features=5000, ngram_range=(1, 2))
X = vectorizer.fit_transform(df['text'])
y = df['label']


Cr√©ation du TF-IDF Vectorizer :

- max_features=5000 ‚Üí ne garde que les 5000 termes les plus fr√©quents

- ngram_range=(1, 2) ‚Üí utilise des mots seuls (unigrammes) et des paires de mots (bigrammes)

X : les textes transform√©s en vecteurs num√©riques

y : les √©tiquettes (positive/negative)

üß™ 3.5 S√©paration du dataset

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)


S√©pare le jeu de donn√©es en :

- 70 % pour l‚Äôentra√Ænement

- 30 % pour le test

ü§ñ 3.6 Entra√Ænement du mod√®le SVM

In [None]:
model = LinearSVC()
model.fit(X_train, y_train)


- Cr√©ation d‚Äôun mod√®le SVM lin√©aire (Linear Support Vector Classifier)

- Entra√Ænement sur les donn√©es vectoris√©es



üìä 3.7 Pr√©dictions et √©valuation

In [None]:
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))


- Le mod√®le pr√©dit les sentiments des textes du jeu de test

- classification_report affiche les m√©triques :

  - precision : proportion de bonnes pr√©dictions parmi les positives pr√©dites

  - recall : proportion de bonnes pr√©dictions parmi les positives r√©elles

  - f1-score : moyenne harmonique de precision et recall

  - accuracy : pourcentage global de bonnes pr√©dictions

![Texte alternatif](captures.png)

üíæ 3.8 Sauvegarde du mod√®le et du vectoriseur



In [None]:
joblib.dump(model, r'C:\Users\USER\Documents\monprojetmaching\model_svm.pkl')
joblib.dump(vectorizer, r'C:\Users\USER\Documents\monprojetmaching\vectorizer.pkl')


Sauvegarde du  :

 -  mod√®le entra√Æn√© dans model_svm.pkl

 - TF-IDF vectorizer dans vectorizer.pkl

 Pour les r√©utiliser ensuite dans  l'application Streamlit

In [None]:
import pandas as pd
import joblib
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import LinearSVC
from sklearn.metrics import classification_report

# Charger les donn√©es
df = pd.read_csv(r'C:\Users\USER\Documents\monprojetmaching\sentiment_data.csv')  # Assure-toi d'avoir une colonne 'text' et 'label'

# Nettoyage simple du texte
df['text'] = df['text'].str.lower().str.replace(r'[^\w\s]', '', regex=True)

# Vectorisation TF-IDF
vectorizer = TfidfVectorizer(max_features=5000, ngram_range=(1, 2))
X = vectorizer.fit_transform(df['text'])
y = df['label']

# S√©parer les donn√©es
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Entra√Æner le mod√®le SVM
model = LinearSVC()
model.fit(X_train, y_train)

# Pr√©dictions et √©valuation
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))

# Sauvegarde du mod√®le et du vectoriseur
joblib.dump(model, r'C:\Users\USER\Documents\monprojetmaching\model_svm.pkl')
joblib.dump(vectorizer, r'C:\Users\USER\Documents\monprojetmaching\vectorizer.pkl')



##  4. Cr√©ation du fichier app.py

Ce script cr√©e une interface web simple pour pr√©dire si un texte est positif ou n√©gatif, en utilisant le mod√®le SVM pr√©alablement entra√Æn√© et le vectoriseur.

**üìú Explication du code** :



In [None]:
import streamlit as st
import joblib


- streamlit est la biblioth√®que utilis√©e pour cr√©er l‚Äôinterface web.

- joblib permet de charger le mod√®le et le vectoriseur sauvegard√©s.

üì¶ Charger le mod√®le et le vectoriseur

In [None]:
model = joblib.load("model_svm.pkl")
vectorizer = joblib.load("vectorizer.pkl")


charge de mod√®le SVM et le TF-IDF vectorizer entra√Æn√©s et sauvegard√©s dans des fichiers .pkl.



üßæ Configurer l‚Äôinterface

In [None]:
st.set_page_config(page_title="Pr√©diction d'Opinion", layout="centered")
st.title("üß† Pr√©diction d'Opinion (SVM)")


- set_page_config : d√©finit le titre de l‚Äôonglet du navigateur et le layout.

- title : affiche un titre principal dans l‚Äôapplication.



üìò Texte d‚Äôintroduction

In [None]:
st.write("Entrez un texte pour pr√©dire s‚Äôil est positif ou n√©gatif.")


Affiche un message expliquant √† l‚Äôutilisateur ce qu‚Äôil doit faire.



üñãÔ∏è Zone de texte pour saisie

In [None]:
user_input = st.text_area("Votre texte ici :", "")


Cr√©e une zone de texte o√π l‚Äôutilisateur peut saisir une opinion ou un commentaire.

üîò Bouton de pr√©diction

In [None]:
if st.button("Pr√©dire"):


Cr√©e un bouton. Quand l‚Äôutilisateur clique, le code √† l‚Äôint√©rieur s‚Äôex√©cute.

üß™ Validation de l‚Äôentr√©e

In [None]:
    if user_input.strip() == "":
        st.warning("Veuillez entrer un texte.")


Si l‚Äôutilisateur clique sur "Pr√©dire" sans entrer de texte, affiche un message d‚Äôavertissement.



ü§ñ Pr√©diction



In [None]:
    else:
        vect_text = vectorizer.transform([user_input])
        prediction = model.predict(vect_text)
        st.success(f"‚úÖ Opinion pr√©dite : **{prediction[0]}**")


- vectorizer.transform([user_input]) : transforme le texte entr√© en vecteur TF-IDF .

- model.predict(...) : fait une pr√©diction avec le mod√®le charg√©.

- st.success(...) : affiche le r√©sultat dans un encadr√© vert avec le sentiment pr√©dit : positive ou negative.



In [None]:

import streamlit as st
import joblib

# Charger le mod√®le et le vectoriseur
model = joblib.load("model_svm.pkl")
vectorizer = joblib.load("vectorizer.pkl")

st.set_page_config(page_title="Pr√©diction d'Opinion", layout="centered")
st.title("üß† Pr√©diction d'Opinion (SVM)")

st.write("Entrez un texte pour pr√©dire s‚Äôil est positif ou n√©gatif.")

# Entr√©e utilisateur
user_input = st.text_area("Votre texte ici :", "")

# Bouton pr√©diction
if st.button("Pr√©dire"):
    if user_input.strip() == "":
        st.warning("Veuillez entrer un texte.")
    else:
        vect_text = vectorizer.transform([user_input])
        prediction = model.predict(vect_text)
        st.success(f"‚úÖ Opinion pr√©dite : **{prediction[0]}**")


## 5. Ex√©cution de l'application

L‚Äôapplication est ex√©cut√©e localement √† l‚Äôaide de la commande suivante dans le terminal :

In [None]:
 streamlit run "C:\Users\USER\Documents\monprojetmaching\app.py"


Cette commande lance l‚Äôapplication Streamlit en local. Elle s‚Äôouvre automatiquement dans le navigateur via une URL.Pour rendre l‚Äôapplication accessible √† tout le monde via un lien public, un h√©bergement sur Streamlit Cloud est n√©cessaire.



##  6. D√©ploiement de l'application

Apr√®s l‚Äôh√©bergement de l‚Äôapplication sur Streamlit Cloud, j‚Äôai obtenu une URL publique permettant √† tout utilisateur d‚Äôy acc√©der facilement en ligne : https://sentiment-app-uyupimyppbjn43evu5xha9.streamlit.app/   
**Voici un aper√ßu du r√©sultat de l‚Äôapplication en ligne :**

![Texte alternatif](Capture3s.PNG)

![Texte alternatif](Capture4s.PNG)

![Texte alternatif](Capture5s.PNG)

![Texte alternatif](Capture6s.PNG)