# Sentiment analysis 

## 1. Textblob-FR

Documentation: https://textblob.readthedocs.io/en/dev/

### Imports

In [1]:
from textblob import Blobber
from textblob_fr import PatternTagger, PatternAnalyzer

### Adaptation de la fonction `get_sentiment` pour return les valeurs des sentiments

In [9]:
tb = Blobber(pos_tagger=PatternTagger(), analyzer=PatternAnalyzer())

def get_sentiment(input_text):
    blob = tb(input_text)
    polarity, subjectivity = blob.sentiment
    polarity_perc = 100 * abs(polarity)
    subjectivity_perc = 100 * subjectivity

    # Polarité : positif / négatif / neutre
    if polarity > 0:
        polarity_str = f"{polarity_perc:.0f}% positive"
        polarity_label = "Positive"
    elif polarity < 0:
        polarity_str = f"{polarity_perc:.0f}% negative"
        polarity_label = "Négative"
    else:
        polarity_str = "Neutre"
        polarity_label = "Neutre"

    # Subjectivité
    if subjectivity > 0:
        subjectivity_str = f"{subjectivity_perc:.0f}% subjective"
    else:
        subjectivity_str = "Parfaitement objective"

    # → on retourne un dictionnaire (pour un DataFrame)
    return {
        "Texte": input_text,
        "Polarité": polarity,
        "Polarité (%)": f"{polarity_perc:.0f}%",
        "Tonalité": polarity_label,
        "Détail polarité": polarity_str,
        "Subjectivité": subjectivity,
        "Subjectivité (%)": f"{subjectivity_perc:.0f}%",
        "Détail subjectivité": subjectivity_str
    }

### Analyser le sentiment de 10 phrases

In [10]:
# choisir 10 phrases au hasard

phrase1 = "Etienne Debel (né à Iseghem, trente- quatre ans, visage ouvert, parfait bilingue) avait commencé une carrière de comédien au Théâtre national d’expression flamande"

phrase2 = (
    "Puis, à vingt-quatre ans, il crée sa propre compagnie (• Het Vlaamse Schouwtoneel •) pour laquelle il signe quelque vingt mises en scène et qu’il emmène en tournée, "
    "notamment en Allemagne, en Hollande et au Congo"
)

phrase3 = (
    "Un jour, ce jeune aventurier du théâtre, passionné par les pièces les plus ambitieuses mais aussi par la découverte des auteurs nationaux, décide de créer (avant qu’aucune troupe d’expression française n'y ait songé) "
    "* Èliezer et Sarah », une pièce de notre compatriote Marcel Falmagne"
)

phrase4 = "L'action se passe en Israël, dans un kibboutz, c'est-à-dire une ferme collective, et il fallait que des Tel-Aviv, et l’qxitre * Victor ou les enfants au pàxivoir », de Roger Vitrac, en province"

phrase5 = (
    "Et on compte encore, à Tel-Aviv, le théâtre Ha- caxneri qui donne, entre autres, des comédies mxisicales israéliennes (ou « My Fait Lady », qui a fait salle comble pendant un an), plus le théâtre Zavit, "
    "avec deux troxipes également, le théâtre des Saisons, dirigé par le jeune auteur israélien Aloni qui vaxit, poxir moi, Ioxxesco et Beckett, plus des tas de jeunes compagnies professionnelles (dont l’xtne a joué < Les Chaises », d’Ionesco pendaxxt cinq ans)"
)

phrase6 = "Saxxs compter les théâtres de boxilevard... — "

phrase7 = "C'est évidemment une activité assez prodigiexise poxir une ville de... — Huit cent mille habitants" 

phrase8 = "Mais tout bouge sur le plan artistique en Israël" 

phrase9 = "Il xj a xm théâtre mxinicipal à Haïffa" 

phrase10 = "Il faudrait que soit bien amer, le spectateur qui se déclarerait déçu d’un spectacle où le « mort » même ne manque pas d’esprit"


In [7]:
import pandas as pd

In [11]:
# Créer une liste des phrases
phrases = [phrase1, phrase2, phrase3, phrase4, phrase5, phrase6, phrase7, phrase8, phrase9, phrase10]

# Boucle sur les phrases
resultats = [get_sentiment(p) for p in phrases]

# Création du DataFrame
df_sentiments = pd.DataFrame(resultats)

# Affichage du tableau complet
print(df_sentiments)

                                               Texte  Polarité Polarité (%)  \
0  Etienne Debel (né à Iseghem, trente- quatre an...  0.370000          37%   
1  Puis, à vingt-quatre ans, il crée sa propre co...  0.330000          33%   
2  Un jour, ce jeune aventurier du théâtre, passi...  0.261667          26%   
3  L'action se passe en Israël, dans un kibboutz,...  0.225000          22%   
4  Et on compte encore, à Tel-Aviv, le théâtre Ha...  0.155000          16%   
5     Saxxs compter les théâtres de boxilevard... —   0.000000           0%   
6  C'est évidemment une activité assez prodigiexi...  0.200000          20%   
7   Mais tout bouge sur le plan artistique en Israël  0.160000          16%   
8             Il xj a xm théâtre mxinicipal à Haïffa  0.000000           0%   
9  Il faudrait que soit bien amer, le spectateur ... -0.400000          40%   

   Tonalité Détail polarité  Subjectivité Subjectivité (%)  \
0  Positive    37% positive       0.30000              30%   
1  Pos

In [10]:
get_sentiment("Cette phrase est négative et je ne suis pas content !")

This text is 41% negative and 60% subjective.


## 2. Utilisation de transformers

Documentation: https://github.com/TheophileBlard/french-sentiment-analysis-with-bert

**!!** Si le code ne tourne pas sur votre machine, vous pouvez le tester directement sur Google Colab en utilisant [ce lien](https://colab.research.google.com/github/TheophileBlard/french-sentiment-analysis-with-bert/blob/master/colab/french_sentiment_analysis_with_bert.ipynb) **!!**

Le modèle peut également être testé en ligne sur [HuggingFace](https://huggingface.co/tblard/tf-allocine)

### Installation des librairies et imports

In [11]:
%pip install tensorflow
%pip install sentencepiece
%pip install transformers
%pip install tf_keras

from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
from transformers import pipeline

Collecting tensorflow
  Downloading tensorflow-2.20.0-cp311-cp311-win_amd64.whl.metadata (4.6 kB)
Collecting absl-py>=1.0.0 (from tensorflow)
  Downloading absl_py-2.3.1-py3-none-any.whl.metadata (3.3 kB)
Collecting astunparse>=1.6.0 (from tensorflow)
  Downloading astunparse-1.6.3-py2.py3-none-any.whl.metadata (4.4 kB)
Collecting flatbuffers>=24.3.25 (from tensorflow)
  Downloading flatbuffers-25.9.23-py2.py3-none-any.whl.metadata (875 bytes)
Collecting gast!=0.5.0,!=0.5.1,!=0.5.2,>=0.2.1 (from tensorflow)
  Downloading gast-0.6.0-py3-none-any.whl.metadata (1.3 kB)
Collecting google_pasta>=0.1.1 (from tensorflow)
  Downloading google_pasta-0.2.0-py3-none-any.whl.metadata (814 bytes)
Collecting libclang>=13.0.0 (from tensorflow)
  Downloading libclang-18.1.1-py2.py3-none-win_amd64.whl.metadata (5.3 kB)
Collecting opt_einsum>=2.3.2 (from tensorflow)
  Downloading opt_einsum-3.4.0-py3-none-any.whl.metadata (6.3 kB)
Collecting protobuf>=5.28.0 (from tensorflow)
  Downloading protobuf-6.33

### Chargement du modèle

In [14]:
#tokenizer = AutoTokenizer.from_pretrained("tblard/tf-allocine", use_pt=False)
#model = TFAutoModelForSequenceClassification.from_pretrained("tblard/tf-allocine")

#sentiment_analyser = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)

#proposition de correction de GPT
from transformers import AutoTokenizer, TFAutoModelForSequenceClassification, pipeline

tokenizer = AutoTokenizer.from_pretrained("tblard/tf-allocine")
model = TFAutoModelForSequenceClassification.from_pretrained("tblard/tf-allocine")

sentiment_analyser = pipeline(
    "sentiment-analysis",
    model=model,
    tokenizer=tokenizer,
    framework="tf"
)

All model checkpoint layers were used when initializing TFCamembertForSequenceClassification.

All the layers of TFCamembertForSequenceClassification were initialized from the model checkpoint at tblard/tf-allocine.
If your task is similar to the task the model of the checkpoint was trained on, you can already use TFCamembertForSequenceClassification for predictions without further training.


NameError: name 'torch' is not defined

### Analyser le sentiment d'une phrase

In [39]:
sentiment_analyser("Ce journal est vraiment super intéressant.")

In [None]:
sentiment_analyser("Cette phrase est négative et je ne suis pas content !")