# Sentiment analysis 

## 1. Textblob-FR

Documentation: https://textblob.readthedocs.io/en/dev/

### Imports

In [2]:
from textblob import Blobber
from textblob_fr import PatternTagger, PatternAnalyzer

### Création d'une fonction `get_sentiment`

In [None]:
tb = Blobber(pos_tagger=PatternTagger(), analyzer=PatternAnalyzer())

def get_sentiment(input_text):
    blob = tb(input_text)
    polarity, subjectivity = blob.sentiment
    polarity_perc = f"{100*abs(polarity):.0f}"
    subjectivity_perc = f"{100*subjectivity:.0f}"
    if polarity > 0:
        polarity_str = f"{polarity_perc}% positive"
    elif polarity < 0:
        polarity_str = f"{polarity_perc}% negative"
    else:
        polarity_str = "neutral"
    if subjectivity > 0:
        subjectivity_str = f"{subjectivity_perc}% subjective"
    else:
        subjectivity_str = "perfectly objective"
    print(f"Ce texte est {polarity_str} et {subjectivity_str}.")

### Analyser le sentiment d'une phrase

In [None]:
get_sentiment("Quelle que soit l'heure à laquelle vous achetez LE SOIR, réclamez au vendeur LA DERNIERE EDITION PARUE") #phrase ligne 1

This text is 65% positive and 75% subjective.
This text is 41% negative and 60% subjective.


In [None]:
get_sentiment("Il est courant de dire que per- *onne ne peut comprendre la politique d’aucun pays, sauf le sien.") #ligne 5

This text is 5% positive and 10% subjective.


In [None]:
get_sentiment("Trois fois par jour une cuillerée de cet excellent remède et la toux est bannie de ma maison") #ligne 11

This text is 50% positive and 90% subjective.


In [11]:
get_sentiment("Les VENTES CHOCS de CADO RADIO sont appréciées de tous.") #ligne 14

This text is 22% positive and 10% subjective.


In [12]:
get_sentiment("SACHEZ, PÈRE BRICOLE, QUE JE N'APPRÉCIË PAS DU tOUT VOS MÉTHODES DE CHASSE") #ligne 20

This text is 22% positive and 10% subjective.


In [14]:
get_sentiment("Regardez-nous... et reconnaissez que nous sommes bien élégantes, toutes les trois") #ligne 27

This text is 31% positive and 33% subjective.


In [15]:
get_sentiment("L’Autriche vous comblera : elle a le sourire ensoleillé, des prix vraiment accueillants  et tout • absolument toutl * pour vous plaire." ) #ligne 38, enlèvement des guillements pour "accueillants"

This text is 39% positive and 46% subjective.


In [None]:
get_sentiment("S’il ne l’obtint pas, c’est que le jury cannois, toujours soucieux. dè contenter le plus de monde possible et de ne froisser personne, estima prudent dè rie pas mettre trop en évidence uné œuvre qui, fatalement, aux yeux de la majorité des croyants, était blasphématoire et sacrilège.") #ligne 45

This text is 9% negative and 35% subjective.


In [None]:
get_sentiment("Essayez-le aujourd'hui encore, mais insistez auprès de votre détaillant : c'est un film-couleurs GEVACOLOR, de Gevaert, qu'il vous faut.") #ligne 54

This text is 75% negative and 100% subjective.


In [18]:
get_sentiment("Sous la fracassante, sous la sauvage beauté de Sophia se cachaient une personnalité, une passion qui, un jour ou l’autre, devaient éclater.") #ligne 64

This text is 1% negative and 5% subjective.


## 2. Utilisation de transformers

Documentation: https://github.com/TheophileBlard/french-sentiment-analysis-with-bert

**!!** Si le code ne tourne pas sur votre machine, vous pouvez le tester directement sur Google Colab en utilisant [ce lien](https://colab.research.google.com/github/TheophileBlard/french-sentiment-analysis-with-bert/blob/master/colab/french_sentiment_analysis_with_bert.ipynb) **!!**

Le modèle peut également être testé en ligne sur [HuggingFace](https://huggingface.co/tblard/tf-allocine)

### Installation des librairies et imports

In [6]:
%pip install tensorflow
%pip install sentencepiece
%pip install transformers
%pip install tf_keras

from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
from transformers import pipeline

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip
  from .autonotebook import tqdm as notebook_tqdm


### Chargement du modèle

In [7]:
tokenizer = AutoTokenizer.from_pretrained("tblard/tf-allocine", use_pt=False)
model = TFAutoModelForSequenceClassification.from_pretrained("tblard/tf-allocine")

sentiment_analyser = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)





TensorFlow and JAX classes are deprecated and will be removed in Transformers v5. We recommend migrating to PyTorch classes or pinning your version of Transformers.
All model checkpoint layers were used when initializing TFCamembertForSequenceClassification.

All the layers of TFCamembertForSequenceClassification were initialized from the model checkpoint at tblard/tf-allocine.
If your task is similar to the task the model of the checkpoint was trained on, you can already use TFCamembertForSequenceClassification for predictions without further training.
TensorFlow and JAX classes are deprecated and will be removed in Transformers v5. We recommend migrating to PyTorch classes or pinning your version of Transformers.
Device set to use 0


### Analyser le sentiment d'une phrase

In [8]:
sentiment_analyser("Ce journal est vraiment super intéressant.")

TensorFlow and JAX classes are deprecated and will be removed in Transformers v5. We recommend migrating to PyTorch classes or pinning your version of Transformers.


[{'label': 'POSITIVE', 'score': 0.9936434030532837}]

In [9]:
sentiment_analyser("Cette phrase est négative et je ne suis pas content !")

[{'label': 'NEGATIVE', 'score': 0.9664190411567688}]