# Sentiment analysis 

## 1. Textblob-FR

Documentation: https://textblob.readthedocs.io/en/dev/

### Imports

In [12]:
import sys
from textblob import Blobber
from textblob_fr import PatternTagger, PatternAnalyzer

### Création d'une fonction `get_sentiment`

In [13]:
tb = Blobber(pos_tagger=PatternTagger(), analyzer=PatternAnalyzer())

def get_sentiment(input_text):
    blob = tb(input_text)
    polarity, subjectivity = blob.sentiment
    polarity_perc = f"{100*abs(polarity):.0f}"
    subjectivity_perc = f"{100*subjectivity:.0f}"
    if polarity > 0:
        polarity_str = f"{polarity_perc}% positive"
    elif polarity < 0:
        polarity_str = f"{polarity_perc}% negative"
    else:
        polarity_str = "neutral"
    if subjectivity > 0:
        subjectivity_str = f"{subjectivity}% subjective"
    else:
        subjectivity_str = "perfectly objective"
    print(f"This text is {polarity_str} and {subjectivity_str}.")

### Analyser le sentiment d'une phrase

In [14]:
phrases = [
    "Le notaire DE COOK adjugera, le jeudi 30 avril 1925, à Woluwe-Saint-Lambert, un lieu empreint de sérénité et d'histoire",
    "Trois maisons avec jardin s'offrent, promettant un havre de paix à leurs futurs occupants",
    "La vente offre une opportunité rare de résider dans la commune prisée de Woluwé-Saint-Lambert",
   "Ces propriétés avec jardin invitent à la rêverie et à la contemplation de la nature",
    "Une maison de rentier, garantissant un investissement sûr et un rendement stable, est mise en lumière",
    "L'annonce d'une belle maison de commerce avec annexe et jardin suscite enthousiasme et anticipation",
   "La villa à vendre à Ostende promet une évasion côtière et des vues imprenables sur la mer",
    "La mise à prix de la 'VILLA CORONA' est un appel à la détente au bord de la mer",
   "Le charme indéniable de la propriété sise chemin du Vogelsang offre un cadre idyllique pour une vie harmonieuse",
    "L'adjudication définitive d'une belle maison de rentier représente une occasion en or d'acquérir un bijou architectural"
]

# Appliquer la fonction get_sentiment à chaque phrase et imprimer les résultats
for phrase in phrases:
    sentiment_result = get_sentiment(phrase)
    print(f"Phrase: {phrase}\nSentiment: {sentiment_result}\n")

This text is neutral and perfectly objective.
Phrase: Le notaire DE COOK adjugera, le jeudi 30 avril 1925, à Woluwe-Saint-Lambert, un lieu empreint de sérénité et d'histoire
Sentiment: None

This text is neutral and perfectly objective.
Phrase: Trois maisons avec jardin s'offrent, promettant un havre de paix à leurs futurs occupants
Sentiment: None

This text is 16% positive and 0.25% subjective.
Phrase: La vente offre une opportunité rare de résider dans la commune prisée de Woluwé-Saint-Lambert
Sentiment: None

This text is 25% positive and 0.5% subjective.
Phrase: Ces propriétés avec jardin invitent à la rêverie et à la contemplation de la nature
Sentiment: None

This text is 10% positive and 0.375% subjective.
Phrase: Une maison de rentier, garantissant un investissement sûr et un rendement stable, est mise en lumière
Sentiment: None

This text is 80% positive and 0.8% subjective.
Phrase: L'annonce d'une belle maison de commerce avec annexe et jardin suscite enthousiasme et anticip

In [16]:
from textblob import TextBlob
from textblob_fr import PatternTagger, PatternAnalyzer

# Création du tableau de résultats
results = []

for phrase in phrases:
    blob = TextBlob(phrase, pos_tagger=PatternTagger(), analyzer=PatternAnalyzer())
    sentiment = blob.sentiment
    results.append({
        'Phrase': phrase,
        'Polarité': sentiment[0],
        'Subjectivité': sentiment[1]
    })



# Affichage des résultats
for result in results:
    print(f"Phrase: {result['Phrase']}, Polarité: {result['Polarité']}, Subjectivité: {result['Subjectivité']}")

Phrase: Le notaire DE COOK adjugera, le jeudi 30 avril 1925, à Woluwe-Saint-Lambert, un lieu empreint de sérénité et d'histoire, Polarité: 0.0, Subjectivité: 0.0
Phrase: Trois maisons avec jardin s'offrent, promettant un havre de paix à leurs futurs occupants, Polarité: 0.0, Subjectivité: 0.0
Phrase: La vente offre une opportunité rare de résider dans la commune prisée de Woluwé-Saint-Lambert, Polarité: 0.165, Subjectivité: 0.25
Phrase: Ces propriétés avec jardin invitent à la rêverie et à la contemplation de la nature, Polarité: 0.25, Subjectivité: 0.5
Phrase: Une maison de rentier, garantissant un investissement sûr et un rendement stable, est mise en lumière, Polarité: 0.095, Subjectivité: 0.375
Phrase: L'annonce d'une belle maison de commerce avec annexe et jardin suscite enthousiasme et anticipation, Polarité: 0.8, Subjectivité: 0.8
Phrase: La villa à vendre à Ostende promet une évasion côtière et des vues imprenables sur la mer, Polarité: 0.0, Subjectivité: 0.0
Phrase: La mise à 

## 2. Utilisation de transformers

Documentation: https://github.com/TheophileBlard/french-sentiment-analysis-with-bert

**!!** Si le code ne tourne pas sur votre machine, vous pouvez le tester directement sur Google Colab en utilisant [ce lien](https://colab.research.google.com/github/TheophileBlard/french-sentiment-analysis-with-bert/blob/master/colab/french_sentiment_analysis_with_bert.ipynb) **!!**

Le modèle peut également être testé en ligne sur [HuggingFace](https://huggingface.co/tblard/tf-allocine)

### Installation des librairies et imports

In [17]:
!pip install tensorflow
!pip install sentencepiece
!pip install transformers

from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
from transformers import pipeline



DEPRECATION: textract 1.6.5 has a non-standard dependency specifier extract-msg<=0.29.*. pip 23.3 will enforce this behaviour change. A possible replacement is to upgrade to a newer version of textract or contact the author to suggest that they release a version with a conforming dependency specifiers. Discussion can be found at https://github.com/pypa/pip/issues/12063

[notice] A new release of pip is available: 23.2.1 -> 23.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip




DEPRECATION: textract 1.6.5 has a non-standard dependency specifier extract-msg<=0.29.*. pip 23.3 will enforce this behaviour change. A possible replacement is to upgrade to a newer version of textract or contact the author to suggest that they release a version with a conforming dependency specifiers. Discussion can be found at https://github.com/pypa/pip/issues/12063

[notice] A new release of pip is available: 23.2.1 -> 23.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip





DEPRECATION: textract 1.6.5 has a non-standard dependency specifier extract-msg<=0.29.*. pip 23.3 will enforce this behaviour change. A possible replacement is to upgrade to a newer version of textract or contact the author to suggest that they release a version with a conforming dependency specifiers. Discussion can be found at https://github.com/pypa/pip/issues/12063

[notice] A new release of pip is available: 23.2.1 -> 23.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip




### Chargement du modèle

In [19]:
tokenizer = AutoTokenizer.from_pretrained("tblard/tf-allocine", use_pt=True)
model = TFAutoModelForSequenceClassification.from_pretrained("tblard/tf-allocine")

sentiment_analyser = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)



All model checkpoint layers were used when initializing TFCamembertForSequenceClassification.

All the layers of TFCamembertForSequenceClassification were initialized from the model checkpoint at tblard/tf-allocine.
If your task is similar to the task the model of the checkpoint was trained on, you can already use TFCamembertForSequenceClassification for predictions without further training.


Phrase: Le notaire DE COOK adjugera, le jeudi 30 avril 1925, à Woluwe-Saint-Lambert, un lieu empreint de sérénité et d'histoire
Sentiment: POSITIVE, Score: 0.84

Phrase: Trois maisons avec jardin s'offrent, promettant un havre de paix à leurs futurs occupants
Sentiment: NEGATIVE, Score: 0.56

Phrase: La vente offre une opportunité rare de résider dans la commune prisée de Woluwé-Saint-Lambert
Sentiment: POSITIVE, Score: 0.82

Phrase: Ces propriétés avec jardin invitent à la rêverie et à la contemplation de la nature
Sentiment: POSITIVE, Score: 0.94

Phrase: Une maison de rentier, garantissant un investissement sûr et un rendement stable, est mise en lumière
Sentiment: POSITIVE, Score: 0.82

Phrase: L'annonce d'une belle maison de commerce avec annexe et jardin suscite enthousiasme et anticipation
Sentiment: POSITIVE, Score: 0.86

Phrase: La villa à vendre à Ostende promet une évasion côtière et des vues imprenables sur la mer
Sentiment: POSITIVE, Score: 0.78

Phrase: La mise à prix de 

### Analyser le sentiment sur nos phrases

In [21]:
#liste de mes phrases
phrases = [
    "Le notaire DE COOK adjugera, le jeudi 30 avril 1925, à Woluwe-Saint-Lambert, un lieu empreint de sérénité et d'histoire",
    "Trois maisons avec jardin s'offrent, promettant un havre de paix à leurs futurs occupants",
    "La vente offre une opportunité rare de résider dans la commune prisée de Woluwé-Saint-Lambert",
   "Ces propriétés avec jardin invitent à la rêverie et à la contemplation de la nature",
    "Une maison de rentier, garantissant un investissement sûr et un rendement stable, est mise en lumière",
    "L'annonce d'une belle maison de commerce avec annexe et jardin suscite enthousiasme et anticipation",
   "La villa à vendre à Ostende promet une évasion côtière et des vues imprenables sur la mer",
    "La mise à prix de la 'VILLA CORONA' est un appel à la détente au bord de la mer",
   "Le charme indéniable de la propriété sise chemin du Vogelsang offre un cadre idyllique pour une vie harmonieuse",
    "L'adjudication définitive d'une belle maison de rentier représente une occasion en or d'acquérir un bijou architectural"
]

# Appliquer l'analyse de sentiment à chaque phrase
for phrase in phrases:
    sentiment = sentiment_analyser(phrase)[0]
    print(f"Phrase: {phrase}\nSentiment: {sentiment['label']}, Score: {sentiment['score']:.2f}\n")

Phrase: Le notaire DE COOK adjugera, le jeudi 30 avril 1925, à Woluwe-Saint-Lambert, un lieu empreint de sérénité et d'histoire
Sentiment: POSITIVE, Score: 0.84

Phrase: Trois maisons avec jardin s'offrent, promettant un havre de paix à leurs futurs occupants
Sentiment: NEGATIVE, Score: 0.56

Phrase: La vente offre une opportunité rare de résider dans la commune prisée de Woluwé-Saint-Lambert
Sentiment: POSITIVE, Score: 0.82

Phrase: Ces propriétés avec jardin invitent à la rêverie et à la contemplation de la nature
Sentiment: POSITIVE, Score: 0.94

Phrase: Une maison de rentier, garantissant un investissement sûr et un rendement stable, est mise en lumière
Sentiment: POSITIVE, Score: 0.82

Phrase: L'annonce d'une belle maison de commerce avec annexe et jardin suscite enthousiasme et anticipation
Sentiment: POSITIVE, Score: 0.86

Phrase: La villa à vendre à Ostende promet une évasion côtière et des vues imprenables sur la mer
Sentiment: POSITIVE, Score: 0.78

Phrase: La mise à prix de 

In [None]:
sentiment_analyser("Cette phrase est négative et je ne suis pas content !")