# 🧠 Application Deep Learning - Classification de sentiments dans des textes

Ce projet consiste à développer une application de classification automatique de sentiments dans des textes en français et en anglais, à l’aide de techniques de traitement du langage naturel (NLP) et de machine learning.

L’objectif est de permettre à un utilisateur de saisir son opinion, puis d’obtenir immédiatement une prédiction du sentiment (positif ou négatif) via une interface web interactive déployée avec Streamlit.

## ✅ . Les étapes réalisées dans le projet

 1.  Création manuelle d’un fichier sentiment_data.csv contenant des phrases annotées avec les labels "positive" ou "negative" pour entraîner le modèle.

 2. Installation des bibliothèques nécessaires

 3. Création du fichier train_model.py

 4. Création du fichier app.py

 5. Exécution de l'application

 6. Déploiement de l'application



 


 ## 1.  Création manuelle d’un fichier sentiment_data.csv contenant des phrases annotées avec les labels "positive" ou "negative" pour entraîner le modèle.


![Texte alternatif](capture1s.png)

 ## 2. Installation des bibliothèques nécessaires

![Texte alternatif](Capture2s.png)

## 3. Création du fichier train_model.py

Ce script lit un fichier CSV contenant des textes et leurs sentiments (positif ou négatif), nettoie les textes, les transforme en vecteurs numériques grâce à la méthode TF-IDF, puis entraîne un modèle de machine learning LinearSVC pour prédire les sentiments. Enfin, il évalue les performances du modèle et sauvegarde à la fois le modèle entraîné et le vectoriseur pour une utilisation future dans l'application.

  ✅ **Explication du script** :


🔁 3.1 Importation des bibliothèques

In [None]:
import pandas as pd
import joblib
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import LinearSVC
from sklearn.metrics import classification_report


- pandas : pour manipuler les données

- joblib : pour sauvegarder le modèle et le vectoriseur

- train_test_split :  pour diviser les données en entraînement/test

- TfidfVectorizer :  pour convertir le texte en vecteurs numériques

- LinearSVC : comme modèle de classification

- classification_report :  pour évaluer les performances


📂 3.2  Chargement du jeu de données

In [None]:
df = pd.read_csv(r'C:\Users\USER\Documents\monprojetmaching\sentiment_data.csv')


Cette étape est pour lire  un fichier .csv contenant des textes et leurs étiquettes de sentiment (positive ou negative), avec deux colonnes : text et label.

🧹 3.3 Nettoyage des textes

In [None]:
df['text'] = df['text'].str.lower().str.replace(r'[^\w\s]', '', regex=True)


- Tous les textes sont mis en minuscules (str.lower())

- Suppression de la ponctuation à l’aide d’une expression régulière ([^\w\s])



🧮 3.4 Vectorisation TF-IDF

In [None]:
vectorizer = TfidfVectorizer(max_features=5000, ngram_range=(1, 2))
X = vectorizer.fit_transform(df['text'])
y = df['label']


Création du TF-IDF Vectorizer :

- max_features=5000 → ne garde que les 5000 termes les plus fréquents

- ngram_range=(1, 2) → utilise des mots seuls (unigrammes) et des paires de mots (bigrammes)

X : les textes transformés en vecteurs numériques

y : les étiquettes (positive/negative)

🧪 3.5 Séparation du dataset

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)


Sépare le jeu de données en :

- 70 % pour l’entraînement

- 30 % pour le test

🤖 3.6 Entraînement du modèle SVM

In [None]:
model = LinearSVC()
model.fit(X_train, y_train)


- Création d’un modèle SVM linéaire (Linear Support Vector Classifier)

- Entraînement sur les données vectorisées



📊 3.7 Prédictions et évaluation

In [None]:
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))


- Le modèle prédit les sentiments des textes du jeu de test

- classification_report affiche les métriques :

  - precision : proportion de bonnes prédictions parmi les positives prédites

  - recall : proportion de bonnes prédictions parmi les positives réelles

  - f1-score : moyenne harmonique de precision et recall

  - accuracy : pourcentage global de bonnes prédictions

![Texte alternatif](captures.png)

💾 3.8 Sauvegarde du modèle et du vectoriseur



In [None]:
joblib.dump(model, r'C:\Users\USER\Documents\monprojetmaching\model_svm.pkl')
joblib.dump(vectorizer, r'C:\Users\USER\Documents\monprojetmaching\vectorizer.pkl')


Sauvegarde du  :

 -  modèle entraîné dans model_svm.pkl

 - TF-IDF vectorizer dans vectorizer.pkl

 Pour les réutiliser ensuite dans  l'application Streamlit

In [None]:
import pandas as pd
import joblib
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import LinearSVC
from sklearn.metrics import classification_report

# Charger les données
df = pd.read_csv(r'C:\Users\USER\Documents\monprojetmaching\sentiment_data.csv')  # Assure-toi d'avoir une colonne 'text' et 'label'

# Nettoyage simple du texte
df['text'] = df['text'].str.lower().str.replace(r'[^\w\s]', '', regex=True)

# Vectorisation TF-IDF
vectorizer = TfidfVectorizer(max_features=5000, ngram_range=(1, 2))
X = vectorizer.fit_transform(df['text'])
y = df['label']

# Séparer les données
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Entraîner le modèle SVM
model = LinearSVC()
model.fit(X_train, y_train)

# Prédictions et évaluation
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))

# Sauvegarde du modèle et du vectoriseur
joblib.dump(model, r'C:\Users\USER\Documents\monprojetmaching\model_svm.pkl')
joblib.dump(vectorizer, r'C:\Users\USER\Documents\monprojetmaching\vectorizer.pkl')



##  4. Création du fichier app.py

Ce script crée une interface web simple pour prédire si un texte est positif ou négatif, en utilisant le modèle SVM préalablement entraîné et le vectoriseur.

**📜 Explication du code** :



In [None]:
import streamlit as st
import joblib


- streamlit est la bibliothèque utilisée pour créer l’interface web.

- joblib permet de charger le modèle et le vectoriseur sauvegardés.

📦 Charger le modèle et le vectoriseur

In [None]:
model = joblib.load("model_svm.pkl")
vectorizer = joblib.load("vectorizer.pkl")


charge de modèle SVM et le TF-IDF vectorizer entraînés et sauvegardés dans des fichiers .pkl.



🧾 Configurer l’interface

In [None]:
st.set_page_config(page_title="Prédiction d'Opinion", layout="centered")
st.title("🧠 Prédiction d'Opinion (SVM)")


- set_page_config : définit le titre de l’onglet du navigateur et le layout.

- title : affiche un titre principal dans l’application.



📘 Texte d’introduction

In [None]:
st.write("Entrez un texte pour prédire s’il est positif ou négatif.")


Affiche un message expliquant à l’utilisateur ce qu’il doit faire.



🖋️ Zone de texte pour saisie

In [None]:
user_input = st.text_area("Votre texte ici :", "")


Crée une zone de texte où l’utilisateur peut saisir une opinion ou un commentaire.

🔘 Bouton de prédiction

In [None]:
if st.button("Prédire"):


Crée un bouton. Quand l’utilisateur clique, le code à l’intérieur s’exécute.

🧪 Validation de l’entrée

In [None]:
    if user_input.strip() == "":
        st.warning("Veuillez entrer un texte.")


Si l’utilisateur clique sur "Prédire" sans entrer de texte, affiche un message d’avertissement.



🤖 Prédiction



In [None]:
    else:
        vect_text = vectorizer.transform([user_input])
        prediction = model.predict(vect_text)
        st.success(f"✅ Opinion prédite : **{prediction[0]}**")


- vectorizer.transform([user_input]) : transforme le texte entré en vecteur TF-IDF .

- model.predict(...) : fait une prédiction avec le modèle chargé.

- st.success(...) : affiche le résultat dans un encadré vert avec le sentiment prédit : positive ou negative.



In [None]:

import streamlit as st
import joblib

# Charger le modèle et le vectoriseur
model = joblib.load("model_svm.pkl")
vectorizer = joblib.load("vectorizer.pkl")

st.set_page_config(page_title="Prédiction d'Opinion", layout="centered")
st.title("🧠 Prédiction d'Opinion (SVM)")

st.write("Entrez un texte pour prédire s’il est positif ou négatif.")

# Entrée utilisateur
user_input = st.text_area("Votre texte ici :", "")

# Bouton prédiction
if st.button("Prédire"):
    if user_input.strip() == "":
        st.warning("Veuillez entrer un texte.")
    else:
        vect_text = vectorizer.transform([user_input])
        prediction = model.predict(vect_text)
        st.success(f"✅ Opinion prédite : **{prediction[0]}**")


## 5. Exécution de l'application

L’application est exécutée localement à l’aide de la commande suivante dans le terminal :

In [None]:
 streamlit run "C:\Users\USER\Documents\monprojetmaching\app.py"


Cette commande lance l’application Streamlit en local. Elle s’ouvre automatiquement dans le navigateur via une URL.Pour rendre l’application accessible à tout le monde via un lien public, un hébergement sur Streamlit Cloud est nécessaire.



##  6. Déploiement de l'application

Après l’hébergement de l’application sur Streamlit Cloud, j’ai obtenu une URL publique permettant à tout utilisateur d’y accéder facilement en ligne : https://sentiment-app-uyupimyppbjn43evu5xha9.streamlit.app/   
**Voici un aperçu du résultat de l’application en ligne :**

![Texte alternatif](Capture3s.PNG)

![Texte alternatif](Capture4s.PNG)

![Texte alternatif](Capture5s.PNG)

![Texte alternatif](Capture6s.PNG)