# Sentiment analysis 

## 1. Textblob-FR

Documentation: https://textblob.readthedocs.io/en/dev/

### Imports

In [1]:
import sys
from textblob import Blobber
from textblob_fr import PatternTagger, PatternAnalyzer

### Création d'une fonction `get_sentiment`

In [2]:
tb = Blobber(pos_tagger=PatternTagger(), analyzer=PatternAnalyzer())

def get_sentiment(input_text):
    blob = tb(input_text)
    polarity, subjectivity = blob.sentiment
    polarity_perc = f"{100*abs(polarity):.0f}"
    subjectivity_perc = f"{100*subjectivity:.0f}"
    if polarity > 0:
        polarity_str = f"{polarity_perc}% positive"
    elif polarity < 0:
        polarity_str = f"{polarity_perc}% negative"
    else:
        polarity_str = "neutral"
    if subjectivity > 0:
        subjectivity_str = f"{subjectivity}% subjective"
    else:
        subjectivity_str = "perfectly objective"
    print(f"This text is {polarity_str} and {subjectivity_str}.")

### Analyser les sentiments des phrases suivantes:

In [3]:
get_sentiment("On verra alors si tes protestations des partis politiques ont un caractère uniquement platonique")

This text is 65% positive and 0.75% subjective.


In [15]:
get_sentiment("elle pourrait servir de raison ou de prétexte à Un désengagement américain qui serait pour la Franco un péril mortel")

This text is 8% positive and 0.1% subjective.


In [4]:
get_sentiment("Aussi longtemps que des Européens • bon teint » figuraient dans le gouvernement, l’espoir d’un compromis pouvait être nourri")

This text is 35% positive and 0.35% subjective.


In [10]:
get_sentiment("la victoire du Racing de Malines fut entièrement méritée")

This text is neutral and perfectly objective.


In [9]:
get_sentiment("les Malinois ne se laissèrent plus surprendre")

This text is 15% positive and 0.1% subjective.


In [8]:
get_sentiment("La défaite du leader apparaît presque normale car les Ostendals n’ont pas su imposer leur Jeu")

This text is 4% positive and 0.175% subjective.


In [7]:
get_sentiment("La politique du chef de l’Etat au neutralisme, à l’affaiblissement de l’0.T.A.N.» dangereuse")

This text is 28% negative and 0.3% subjective.


In [6]:
get_sentiment("8.	La politique du chef de l’Etat au neutralisme, à l’affaiblissement de l’0.T.A.N.» dangereuse dans la mesure où, tôt ou tard, elle pourrait servir de raison ou de prétexte à Un désengagement américain qui serait pour la Franco un péril mortel »")

This text is 16% negative and 0.2333333333333333% subjective.


In [5]:
get_sentiment("L’équipe anversoise est arrivée A ses fins, aprè*. avoir mené le match quasi de bout en bout")

This text is neutral and 0.125% subjective.


In [11]:
get_sentiment("“Van Kersschaever. au pivot, n’atteignit Jamais son rendement habituel Alors qu’il était considéré comme l’atout majeur de l’équipe ostendnise, il se révéla franchement décevant et il ne tira guère profit, hormis en récupération défensive, de son avantage de taille")

This text is 5% negative and perfectly objective.


## 2. Utilisation de transformers

Documentation: https://github.com/TheophileBlard/french-sentiment-analysis-with-bert

**!!** Si le code ne tourne pas sur votre machine, vous pouvez le tester directement sur Google Colab en utilisant [ce lien](https://colab.research.google.com/github/TheophileBlard/french-sentiment-analysis-with-bert/blob/master/colab/french_sentiment_analysis_with_bert.ipynb) **!!**

Le modèle peut également être testé en ligne sur [HuggingFace](https://huggingface.co/tblard/tf-allocine)

### Installation des librairies et imports

In [None]:
!pip install tensorflow
!pip install sentencepiece
!pip install transformers

from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
from transformers import pipeline

### Chargement du modèle

In [None]:
tokenizer = AutoTokenizer.from_pretrained("tblard/tf-allocine", use_pt=True)
model = TFAutoModelForSequenceClassification.from_pretrained("tblard/tf-allocine")

sentiment_analyser = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)

### Analyser le sentiment d'une phrase

In [39]:
sentiment_analyser("Ce journal est vraiment super intéressant.")

In [None]:
sentiment_analyser("Cette phrase est négative et je ne suis pas content !")