In [None]:
{
  "cells": [
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "# RNN/LSTM pour l'analyse de sentiment\n",
        "\n",
        "##  S√©ance 2: Types de r√©seaux de neurones\n",
        "\n",
        "Ce notebook vous guidera √† travers l'impl√©mentation d'un mod√®le LSTM (Long Short-Term Memory) pour l'analyse de sentiment. Vous d√©couvrirez comment les r√©seaux r√©currents peuvent √™tre utilis√©s pour comprendre et classifier du texte.\n",
        "\n",
        "### Objectifs d'apprentissage:\n",
        "- Comprendre le pr√©traitement du texte pour les mod√®les de Deep Learning\n",
        "- D√©couvrir l'architecture et le fonctionnement des r√©seaux LSTM\n",
        "- Apprendre √† √©valuer un mod√®le d'analyse de sentiment\n",
        "- Visualiser et interpr√©ter les embeddings de mots\n",
        "\n",
        "### Pr√©requis:\n",
        "- Connaissances de base en Python\n",
        "- Notions fondamentales de r√©seaux de neurones\n",
        "- Avoir suivi la s√©ance 1 d'introduction au Deep Learning"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 1. Configuration de l'environnement\n",
        "\n",
        "Commen√ßons par importer les biblioth√®ques n√©cessaires et configurer notre environnement."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "import numpy as np\n",
        "import matplotlib.pyplot as plt\n",
        "import tensorflow as tf\n",
        "from tensorflow.keras.models import Sequential\n",
        "from tensorflow.keras.layers import Embedding, LSTM, Dense, Dropout, Bidirectional\n",
        "from tensorflow.keras.preprocessing.text import Tokenizer\n",
        "from tensorflow.keras.preprocessing.sequence import pad_sequences\n",
        "from tensorflow.keras.callbacks import EarlyStopping\n",
        "import pandas as pd\n",
        "import re\n",
        "import time\n",
        "import seaborn as sns\n",
        "from sklearn.metrics import confusion_matrix, classification_report\n",
        "\n",
        "# Configuration pour reproductibilit√©\n",
        "np.random.seed(42)\n",
        "tf.random.set_seed(42)\n",
        "\n",
        "# V√©rifier la version de TensorFlow\n",
        "print(f\"TensorFlow version: {tf.__version__}\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 2. Pr√©paration des donn√©es\n",
        "\n",
        "Pour ce TP, nous allons utiliser un petit dataset simul√© d'avis sur des films. Chaque avis sera class√© comme positif, n√©gatif ou neutre.\n",
        "\n",
        "Dans un projet r√©el, vous pourriez utiliser des datasets plus importants comme IMDB, Amazon Reviews, etc."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Cr√©er un petit jeu de donn√©es d'avis sur les films (simul√©)\n",
        "reviews = [\n",
        "    \"Ce film √©tait excellent, j'ai vraiment ador√© les performances des acteurs.\",\n",
        "    \"Une exp√©rience cin√©matographique incroyable, absolument √† voir !\",\n",
        "    \"Un chef-d'≈ìuvre du cin√©ma, magnifiquement r√©alis√©.\",\n",
        "    \"J'ai beaucoup appr√©ci√© l'histoire et les personnages √©taient bien d√©velopp√©s.\",\n",
        "    \"Visuellement √©poustouflant avec une histoire captivante.\",\n",
        "    \"Un film d√©cevant avec un sc√©nario plein de trous.\",\n",
        "    \"Vraiment terrible, je n'ai pas aim√© du tout.\",\n",
        "    \"Un g√¢chis complet de temps et d'argent, √©vitez √† tout prix.\",\n",
        "    \"Ennuyeux et pr√©visible, les acteurs semblaient d√©sint√©ress√©s.\",\n",
        "    \"Une d√©ception totale, l'intrigue ne fait aucun sens.\",\n",
        "    \"C'√©tait correct, ni bon ni mauvais.\",\n",
        "    \"Un film moyen avec quelques bons moments.\",\n",
        "    \"Certaines sc√®nes √©taient bonnes, mais dans l'ensemble assez moyen.\",\n",
        "    \"Pas aussi bon que je l'esp√©rais, mais pas horrible non plus.\",\n",
        "    \"Une histoire int√©ressante mais mal ex√©cut√©e.\",\n",
        "    \"Un film brillant qui m'a fait r√©fl√©chir pendant des jours.\",\n",
        "    \"Absolument sublime, l'un des meilleurs films que j'ai jamais vus.\",\n",
        "    \"Un d√©sastre total, je me suis endormi au milieu.\",\n",
        "    \"Pas du tout ce √† quoi je m'attendais, tr√®s d√©√ßu.\",\n",
        "    \"Le jeu d'acteur √©tait fantastique, mais l'histoire √©tait faible.\"\n",
        "]\n",
        "\n",
        "# Attribuer des sentiments (0 = n√©gatif, 1 = neutre, 2 = positif)\n",
        "sentiments = [2, 2, 2, 2, 2, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 0, 0, 1]\n",
        "\n",
        "# Convertir en DataFrame pour faciliter la manipulation\n",
        "df = pd.DataFrame({\n",
        "    'review': reviews,\n",
        "    'sentiment': sentiments\n",
        "})\n",
        "\n",
        "# Afficher quelques informations sur le dataset\n",
        "print(f\"Nombre total d'avis: {len(df)}\")\n",
        "print(f\"R√©partition des sentiments: {df['sentiment'].value_counts().sort_index()}\")\n",
        "\n",
        "# Afficher quelques exemples\n",
        "print(\"\\nExemples d'avis:\")\n",
        "for sentiment in [0, 1, 2]:\n",
        "    sample = df[df['sentiment'] == sentiment].iloc[0]\n",
        "    print(f\"Sentiment {sentiment}: '{sample['review']}'\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation de la distribution des sentiments\n",
        "\n",
        "V√©rifions que notre jeu de donn√©es est √©quilibr√© entre les diff√©rentes classes."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Visualiser la distribution des sentiments\n",
        "plt.figure(figsize=(8, 5))\n",
        "ax = sns.countplot(x='sentiment', data=df)\n",
        "plt.title('Distribution des sentiments')\n",
        "plt.xlabel('Sentiment (0=n√©gatif, 1=neutre, 2=positif)')\n",
        "plt.ylabel('Nombre d\\'avis')\n",
        "\n",
        "# Ajouter les valeurs sur les barres\n",
        "for p in ax.patches:\n",
        "    ax.annotate(f\"{p.get_height()}\", (p.get_x() + p.get_width()/2., p.get_height()),\n",
        "                ha='center', va='bottom')\n",
        "\n",
        "plt.show()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 3. Pr√©traitement du texte\n",
        "\n",
        "Avant de pouvoir utiliser le texte avec notre mod√®le LSTM, nous devons le pr√©traiter. Cela implique plusieurs √©tapes:\n",
        "1. Nettoyage (minuscules, suppression de ponctuation, etc.)\n",
        "2. Tokenisation (conversion du texte en s√©quences de nombres)\n",
        "3. Padding (uniformisation de la longueur des s√©quences)\n",
        "\n",
        "Commen√ßons par le nettoyage de texte:"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "def preprocess_text(text):\n",
        "    \"\"\"Fonction pour nettoyer et normaliser le texte\"\"\"\n",
        "    # Convertir en minuscules\n",
        "    text = text.lower()\n",
        "    # Supprimer la ponctuation et les caract√®res sp√©ciaux\n",
        "    text = re.sub(r'[^\\w\\s]', '', text)\n",
        "    # Supprimer les chiffres\n",
        "    text = re.sub(r'\\d+', '', text)\n",
        "    # Supprimer les espaces multiples\n",
        "    text = re.sub(r'\\s+', ' ', text).strip()\n",
        "    return text\n",
        "\n",
        "# Appliquer le pr√©traitement √† nos avis\n",
        "df['processed_review'] = df['review'].apply(preprocess_text)\n",
        "\n",
        "# Afficher un exemple avant et apr√®s pr√©traitement\n",
        "example_idx = 0\n",
        "print(f\"Avant: {df['review'][example_idx]}\")\n",
        "print(f\"Apr√®s: {df['processed_review'][example_idx]}\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Tokenisation du texte\n",
        "\n",
        "La tokenisation convertit le texte en s√©quences num√©riques que notre r√©seau de neurones peut traiter."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Configuration pour la tokenisation\n",
        "max_words = 1000  # Taille du vocabulaire\n",
        "max_len = 100     # Longueur maximale des s√©quences\n",
        "\n",
        "# Cr√©er et configurer le tokenizer\n",
        "tokenizer = Tokenizer(num_words=max_words, oov_token='<OOV>')\n",
        "tokenizer.fit_on_texts(df['processed_review'])\n",
        "\n",
        "# Convertir les textes en s√©quences de tokens\n",
        "sequences = tokenizer.texts_to_sequences(df['processed_review'])\n",
        "\n",
        "# Appliquer le padding pour uniformiser la longueur des s√©quences\n",
        "padded_sequences = pad_sequences(sequences, maxlen=max_len, padding='post', truncating='post')\n",
        "\n",
        "print(f\"Taille du vocabulaire: {len(tokenizer.word_index)}\")\n",
        "print(f\"Forme des s√©quences apr√®s padding: {padded_sequences.shape}\")\n",
        "\n",
        "# Afficher le mapping de quelques mots vers leurs tokens\n",
        "print(\"\\nExemples de mapping mot -> token:\")\n",
        "sample_words = ['film', 'bon', 'mauvais', 'excellent', 'terrible']\n",
        "for word in sample_words:\n",
        "    if word in tokenizer.word_index:\n",
        "        print(f\"{word} -> {tokenizer.word_index[word]}\")\n",
        "    else:\n",
        "        print(f\"{word} -> Non trouv√© dans le vocabulaire\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation d'une s√©quence tokenis√©e\n",
        "\n",
        "Pour mieux comprendre la tokenisation, visualisons comment un avis est converti en s√©quence de tokens."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "def visualize_tokenized_sequence(text, tokens):\n",
        "    \"\"\"Visualise la correspondance entre mots et tokens\"\"\"\n",
        "    words = text.split()\n",
        "    plt.figure(figsize=(15, 3))\n",
        "    plt.bar(range(len(tokens)), tokens)\n",
        "    plt.xticks(range(len(tokens)), words, rotation=45, ha='right')\n",
        "    plt.ylabel('Token ID')\n",
        "    plt.title('Repr√©sentation tokenis√©e d\\'un avis')\n",
        "    plt.tight_layout()\n",
        "    plt.show()\n",
        "\n",
        "sample_idx = 0\n",
        "sample_text = df['processed_review'][sample_idx].split()[:15]  # Limiter √† 15 mots pour lisibilit√©\n",
        "sample_tokens = sequences[sample_idx][:15]\n",
        "\n",
        "print(f\"Exemple d'avis: {' '.join(sample_text)}\")\n",
        "print(f\"Tokens correspondants: {sample_tokens}\")\n",
        "visualize_tokenized_sequence(' '.join(sample_text), sample_tokens)"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 4. Division en ensembles d'entra√Ænement et de test\n",
        "\n",
        "Avant de cr√©er notre mod√®le, divisons nos donn√©es en ensembles d'entra√Ænement et de test pour √©valuer ses performances."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "from sklearn.model_selection import train_test_split\n",
        "\n",
        "# Division 70-30 avec stratification pour conserver la distribution des classes\n",
        "X_train, X_test, y_train, y_test = train_test_split(\n",
        "    padded_sequences, \n",
        "    df['sentiment'],\n",
        "    test_size=0.3,\n",
        "    random_state=42,\n",
        "    stratify=df['sentiment']  # Assurer une r√©partition √©quilibr√©e des classes\n",
        ")\n",
        "\n",
        "print(f\"Forme des donn√©es d'entra√Ænement: {X_train.shape}\")\n",
        "print(f\"Forme des donn√©es de test: {X_test.shape}\")\n",
        "print(f\"Distribution des classes (entra√Ænement): {pd.Series(y_train).value_counts().sort_index()}\")\n",
        "print(f\"Distribution des classes (test): {pd.Series(y_test).value_counts().sort_index()}\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 5. Cr√©ation du mod√®le LSTM\n",
        "\n",
        "Nous allons maintenant cr√©er notre mod√®le d'analyse de sentiment en utilisant une architecture LSTM bidirectionnelle.\n",
        "\n",
        "### Architecture du mod√®le\n",
        "- **Couche d'embedding**: Convertit les tokens en vecteurs denses\n",
        "- **Couches LSTM bidirectionnelles**: Capture les d√©pendances √† long terme dans les deux directions\n",
        "- **Dropout**: √âvite le surapprentissage\n",
        "- **Couche dense finale**: Classification en 3 cat√©gories (n√©gatif, neutre, positif)"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Param√®tres du mod√®le\n",
        "embedding_dim = 32  # Dimension de l'espace d'embedding\n",
        "\n",
        "# Cr√©ation du mod√®le\n",
        "model = Sequential([\n",
        "    # Couche d'embedding pour convertir les tokens en vecteurs denses\n",
        "    Embedding(input_dim=max_words, output_dim=embedding_dim, input_length=max_len),\n",
        "    \n",
        "    # Couche LSTM bidirectionnelle\n",
        "    Bidirectional(LSTM(64, return_sequences=True)),\n",
        "    \n",
        "    # Deuxi√®me couche LSTM suivie de dropout pour r√©gularisation\n",
        "    Bidirectional(LSTM(32)),\n",
        "    Dropout(0.5),\n",
        "    \n",
        "    # Couche de classification (3 classes: n√©gatif, neutre, positif)\n",
        "    Dense(3, activation='softmax')\n",
        "])\n",
        "\n",
        "# Afficher un r√©sum√© du mod√®le\n",
        "model.summary()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### üí° Points cl√©s √† observer dans l'architecture\n",
        "\n",
        "- **LSTM bidirectionnel** : Lit le texte de gauche √† droite ET de droite √† gauche, capturant mieux le contexte\n",
        "- **return_sequences=True** : Permet d'empiler plusieurs couches LSTM\n",
        "- **Dropout** : D√©sactive al√©atoirement 50% des neurones pendant l'entra√Ænement pour √©viter le surapprentissage\n",
        "- **Activation softmax** : G√©n√®re une distribution de probabilit√© sur les 3 classes"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 6. Compilation et entra√Ænement du mod√®le\n",
        "\n",
        "Maintenant, compilons et entra√Ænons notre mod√®le LSTM."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Compiler le mod√®le\n",
        "model.compile(\n",
        "    optimizer='adam',\n",
        "    loss='sparse_categorical_crossentropy',  # Pour les √©tiquettes sous forme d'entiers (non one-hot)\n",
        "    metrics=['accuracy']\n",
        ")\n",
        "\n",
        "# Early stopping pour √©viter le surapprentissage\n",
        "early_stopping = EarlyStopping(\n",
        "    monitor='val_loss',\n",
        "    patience=3,\n",
        "    restore_best_weights=True\n",
        ")\n",
        "\n",
        "# Mesure du temps d'entra√Ænement\n",
        "start_time = time.time()\n",
        "\n",
        "# Entra√Ænement du mod√®le\n",
        "history = model.fit(\n",
        "    X_train, \n",
        "    y_train, \n",
        "    epochs=20,\n",
        "    batch_size=4,  # Petit batch size en raison de la petite taille du dataset\n",
        "    validation_split=0.2,  # 20% des donn√©es d'entra√Ænement serviront √† la validation\n",
        "    callbacks=[early_stopping],\n",
        "    verbose=1\n",
        ")\n",
        "\n",
        "training_time = time.time() - start_time\n",
        "print(f\"\\nTemps d'entra√Ænement: {training_time:.2f} secondes\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation de l'√©volution de l'entra√Ænement\n",
        "\n",
        "Observons comment la pr√©cision et la perte ont √©volu√© au cours de l'entra√Ænement."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Visualisation de l'entra√Ænement\n",
        "plt.figure(figsize=(12, 5))\n",
        "\n",
        "# Graphique de pr√©cision\n",
        "plt.subplot(1, 2, 1)\n",
        "plt.plot(history.history['accuracy'], label='Entra√Ænement')\n",
        "plt.plot(history.history['val_accuracy'], label='Validation')\n",
        "plt.title('√âvolution de la pr√©cision')\n",
        "plt.xlabel('√âpoque')\n",
        "plt.ylabel('Pr√©cision')\n",
        "plt.legend()\n",
        "plt.grid(True, linestyle='--', alpha=0.6)\n",
        "\n",
        "# Graphique de perte\n",
        "plt.subplot(1, 2, 2)\n",
        "plt.plot(history.history['loss'], label='Entra√Ænement')\n",
        "plt.plot(history.history['val_loss'], label='Validation')\n",
        "plt.title('√âvolution de la perte')\n",
        "plt.xlabel('√âpoque')\n",
        "plt.ylabel('Perte')\n",
        "plt.legend()\n",
        "plt.grid(True, linestyle='--', alpha=0.6)\n",
        "\n",
        "plt.tight_layout()\n",
        "plt.show()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 7. √âvaluation du mod√®le\n",
        "\n",
        "Maintenant, √©valuons les performances de notre mod√®le sur l'ensemble de test."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# √âvaluation sur l'ensemble de test\n",
        "test_loss, test_acc = model.evaluate(X_test, y_test, verbose=1)\n",
        "print(f\"Pr√©cision sur l'ensemble de test: {test_acc*100:.2f}%\")\n",
        "\n",
        "# G√©n√©rer les pr√©dictions\n",
        "y_pred_proba = model.predict(X_test)\n",
        "y_pred_classes = np.argmax(y_pred_proba, axis=1)\n",
        "\n",
        "# Matrice de confusion\n",
        "conf_mat = confusion_matrix(y_test, y_pred_classes)\n",
        "plt.figure(figsize=(8, 6))\n",
        "sns.heatmap(conf_mat, annot=True, fmt='d', cmap='Blues', \n",
        "            xticklabels=['N√©gatif', 'Neutre', 'Positif'],\n",
        "            yticklabels=['N√©gatif', 'Neutre', 'Positif'])\n",
        "plt.xlabel('Pr√©dit')\n",
        "plt.ylabel('R√©el')\n",
        "plt.title('Matrice de confusion')\n",
        "plt.tight_layout()\n",
        "plt.show()\n",
        "\n",
        "# Rapport de classification\n",
        "print(\"\\nRapport de classification d√©taill√©:\")\n",
        "target_names = ['N√©gatif', 'Neutre', 'Positif']\n",
        "print(classification_report(y_test, y_pred_classes, target_names=target_names))"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### üß† R√©flexions sur les r√©sultats\n",
        "\n",
        "- **Analysez la matrice de confusion**: Quelles classes sont le mieux reconnues? Y a-t-il des confusions particuli√®res?\n",
        "- **Pr√©cision vs Rappel**: Y a-t-il un d√©s√©quilibre? Quelle m√©trique privil√©gier selon le contexte?\n",
        "- **Taille du dataset**: Comment les r√©sultats pourraient-ils √™tre affect√©s par la petite taille de notre jeu de donn√©es?\n",
        "\n",
        "üëâ **Discussion**: Notez vos observations ci-dessous:"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "*√âcrivez vos observations ici...*"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 8. Test avec de nouveaux avis\n",
        "\n",
        "Testons maintenant notre mod√®le avec quelques nouveaux avis qui n'ont pas √©t√© utilis√©s pour l'entra√Ænement."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Nouveaux avis √† tester\n",
        "new_reviews = [\n",
        "    \"Ce film √©tait vraiment fantastique, j'ai ador√© chaque minute.\",\n",
        "    \"Je n'ai pas du tout aim√© ce film, c'√©tait une perte de temps compl√®te.\",\n",
        "    \"C'√©tait un film correct, ni bon ni mauvais.\"\n",
        "]\n",
        "\n",
        "# Pr√©traitement des nouveaux avis\n",
        "processed_new_reviews = [preprocess_text(review) for review in new_reviews]\n",
        "sequences_new = tokenizer.texts_to_sequences(processed_new_reviews)\n",
        "padded_new = pad_sequences(sequences_new, maxlen=max_len, padding='post', truncating='post')\n",
        "\n",
        "# Pr√©dictions\n",
        "predictions = model.predict(padded_new)\n",
        "predicted_classes = np.argmax(predictions, axis=1)\n",
        "\n",
        "# Afficher les r√©sultats\n",
        "sentiment_labels = {0: \"N√©gatif\", 1: \"Neutre\", 2: \"Positif\"}\n",
        "\n",
        "print(\"Pr√©dictions pour les nouveaux avis:\\n\")\n",
        "for i, review in enumerate(new_reviews):\n",
        "    pred_class = predicted_classes[i]\n",
        "    confidence = predictions[i][pred_class] * 100\n",
        "    \n",
        "    print(f\"Avis: {review}\")\n",
        "    print(f\"Sentiment pr√©dit: {sentiment_labels[pred_class]} (confiance: {confidence:.2f}%)\")\n",
        "    print(\"Probabilit√©s pour chaque classe:\")\n",
        "    for j, label in sentiment_labels.items():\n",
        "        print(f\"  {label}: {predictions[i][j]*100:.2f}%\")\n",
        "    print()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation graphique des pr√©dictions\n",
        "\n",
        "Visualisons les probabilit√©s pour chaque classe pour les nouveaux avis."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Visualisation des probabilit√©s pour chaque avis\n",
        "plt.figure(figsize=(15, 5))\n",
        "labels = ['N√©gatif', 'Neutre', 'Positif']\n",
        "\n",
        "for i, review in enumerate(new_reviews):\n",
        "    plt.subplot(1, 3, i+1)\n",
        "    plt.bar(labels, predictions[i], color=['red', 'gray', 'green'])\n",
        "    plt.title(f\"Avis {i+1}\")\n",
        "    plt.ylim(0, 1)\n",
        "    plt.ylabel('Probabilit√©')\n",
        "    plt.xticks(rotation=45)\n",
        "    \n",
        "    # Ajouter les valeurs sur les barres\n",
        "    for j, p in enumerate(predictions[i]):\n",
        "        plt.text(j, p + 0.02, f\"{p*100:.1f}%\", ha='center')\n",
        "        \n",
        "plt.tight_layout()\n",
        "plt.show()"
      ]
    },