# Sentiment analysis 

## 1. Textblob-FR

Documentation: https://textblob.readthedocs.io/en/dev/

### Imports

In [None]:
import sys
from textblob import Blobber
from textblob_fr import PatternTagger, PatternAnalyzer

### Création d'une fonction `get_sentiment`

In [None]:
tb = Blobber(pos_tagger=PatternTagger(), analyzer=PatternAnalyzer())

def get_sentiment(input_text):
    blob = tb(input_text)
    polarity, subjectivity = blob.sentiment
    polarity_perc = f"{100*abs(polarity):.0f}"
    subjectivity_perc = f"{100*subjectivity:.0f}"
    if polarity > 0:
        polarity_str = f"{polarity_perc}% positive"
    elif polarity < 0:
        polarity_str = f"{polarity_perc}% negative"
    else:
        polarity_str = "neutral"
    if subjectivity > 0:
        subjectivity_str = f"{subjectivity}% subjective"
    else:
        subjectivity_str = "perfectly objective"
    print(f"This text is {polarity_str} and {subjectivity_str}.")

### Analyser le sentiment d'une phrase

In [None]:
get_sentiment("Les textes prévoient expressément l’utilisation de la préférence pour le cas où la Belgique entendrait aliéner les territoires, les échanger, les concéder, les louer, à une puissance étrangère.")

In [None]:
get_sentiment("Conformément à l’article 73 de la Charte des Nations Unies, il amène le peuple congolais a l’indépendance.")

In [None]:
get_sentiment("LA SUCCESSION D'EISENHOWER PETITE GAZETTE M. Nixon devra compter avec le sénateur Kennedy FEUX VERTS La Belgique va, enfin! avoir une politique scientifique.")

In [None]:
get_sentiment("LE som VENDREDI 11 MARS 1960 ÇA, LA BELLE EPOQUE ? Ce qui est sûr, c'est que ce n’était pas une époque pratique !")

In [None]:
get_sentiment("Pourquoi le relèvement du plafond, au lieu d’une augmentation du pourcentage des cotisations?")

In [None]:
get_sentiment("Et encore cette image poétique. : « la laine de couleur est pareille à une musique ».")

In [None]:
get_sentiment("Il gardait ce recueil sur sa table de chevet et disait à J. J. Brousson. son secrétaire : — Quand Je me sens las, je le feuillette.")

In [None]:
get_sentiment("Le bourreau fait 5 moins le martyr que le martyr s ne fait le bourreau.")

In [None]:
get_sentiment("Etrange domaine que cette suite de granges et d’escaliers où la bohème montoise s’est réfugiée I Pourquoi ne pas l’avouer ?")

In [None]:
get_sentiment("En effet, nous l’avons vu, des déficiences circulatoires ont une éventuelle incidence sur l’apparition des vertiges.")

## 2. Utilisation de transformers

Documentation: https://github.com/TheophileBlard/french-sentiment-analysis-with-bert

**!!** Si le code ne tourne pas sur votre machine, vous pouvez le tester directement sur Google Colab en utilisant [ce lien](https://colab.research.google.com/github/TheophileBlard/french-sentiment-analysis-with-bert/blob/master/colab/french_sentiment_analysis_with_bert.ipynb) **!!**

Le modèle peut également être testé en ligne sur [HuggingFace](https://huggingface.co/tblard/tf-allocine)

### Installation des librairies et imports

In [None]:
!pip install tensorflow
!pip install sentencepiece
!pip install transformers

from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
from transformers import pipeline

### Chargement du modèle

In [None]:
tokenizer = AutoTokenizer.from_pretrained("tblard/tf-allocine", use_pt=True)
model = TFAutoModelForSequenceClassification.from_pretrained("tblard/tf-allocine")

sentiment_analyser = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)

### Analyser le sentiment d'une phrase

In [None]:
sentiment_analyser("Ce journal est vraiment super intéressant.")

In [None]:
sentiment_analyser("Cette phrase est négative et je ne suis pas content !")