---
# **FRENCH**
---

### **STEP 1: Downloading and installing the dependencies:**
>>**English PyMUSAS RuleBasedTagger**

>>**English spaCy pipeline**

>>**colorama:** *Colorama is a Python module that displays colored output in consoles.*
---


In [1]:
!pip install https://github.com/UCREL/pymusas-models/releases/download/fr_single_upos2usas_contextual-0.3.3/fr_single_upos2usas_contextual-0.3.3-py3-none-any.whl
!python -m spacy download fr_core_news_sm

Collecting fr-single-upos2usas-contextual==0.3.3
  Downloading https://github.com/UCREL/pymusas-models/releases/download/fr_single_upos2usas_contextual-0.3.3/fr_single_upos2usas_contextual-0.3.3-py3-none-any.whl (88 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m88.7/88.7 kB[0m [31m4.3 MB/s[0m eta [36m0:00:00[0m
Collecting pymusas<0.4.0,>=0.3.0 (from fr-single-upos2usas-contextual==0.3.3)
  Downloading pymusas-0.3.0-py3-none-any.whl.metadata (6.5 kB)
Collecting click<8.1.0 (from pymusas<0.4.0,>=0.3.0->fr-single-upos2usas-contextual==0.3.3)
  Downloading click-8.0.4-py3-none-any.whl.metadata (3.2 kB)
Downloading pymusas-0.3.0-py3-none-any.whl (51 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m51.9/51.9 kB[0m [31m2.0 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading click-8.0.4-py3-none-any.whl (97 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m97.5/97.5 kB[0m [31m3.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collecte

In [2]:
!pip install colorama

Collecting colorama
  Downloading colorama-0.4.6-py2.py3-none-any.whl.metadata (17 kB)
Downloading colorama-0.4.6-py2.py3-none-any.whl (25 kB)
Installing collected packages: colorama
Successfully installed colorama-0.4.6


---
### **STEP 2: Creating the tagger**

---



In [3]:
import spacy

# We exclude the following components as we do not need them.
nlp = spacy.load('fr_core_news_sm', exclude=['parser', 'ner'])
# Load the French PyMUSAS rule-based tagger in a separate spaCy pipeline
french_tagger_pipeline = spacy.load('fr_single_upos2usas_contextual')
# Adds the French PyMUSAS rule-based tagger to the main spaCy pipeline
nlp.add_pipe('pymusas_rule_based_tagger', source=french_tagger_pipeline)

<pymusas.spacy_api.taggers.rule_based.RuleBasedTagger at 0x7823f617f850>

---

### **STEP 3: Importing the libraries**

---



In [4]:
import re
import pandas as pd
import numpy as np
from colorama import Fore, Back, Style

import nltk
nltk.download('punkt_tab')
from nltk.tokenize import sent_tokenize

[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt_tab.zip.


---
### **STEP 4: Tagging text:** *tag_text function*

>>**input:** piece of text

>>**output:** python dictionary where *keys* represent the index of a sentence in the input text and *values* represent the usas semantic tags for that sentence

---



In [5]:
import re

# Defining the tagging function
def tag_text(text):
  usas_eval_tags = {}
  usas_list = {}
  sentences = re.split(r'(。|！|\!|？|\?)', text)
  for i in range(len(sentences)):
    if(sentences[i]):
      print(Fore.GREEN + Style.BRIGHT + "------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
      print(Fore.CYAN + Style.BRIGHT + f"Sentence {i}:", sentences[i])
      print(Fore.CYAN + Style.BRIGHT + "------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
      sent = nlp(sentences[i])
      for token in sent:
        tags = token._.pymusas_tags
        print(Fore.CYAN + f'{token.text}:' + Fore.GREEN, tags)
        for tag in tags:
          usas_list[token.text] = token._.pymusas_tags
      usas_eval_tags[i] = usas_list
  return usas_eval_tags

In [6]:
# Input text 1
text_1 = """ Bonjour camarades, je voulais juste partager mon histoire après une opération où j'ai marqué un autre but contre le cancer, menant 3-0. J'espère qu'elle inspirera quelqu'un.

J'ai été diagnostiqué d'un cancer du côlon en mai 2020 lorsque j'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30 cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade 2. Selon les médecins, j'étais guéri, l'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d'un verre. Le score était de 1-0.

Pourtant, j'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier 2021, un scanner de routine a révélé de mauvaises nouvelles. J'avais des lésions au foie et le chirurgien m'a annoncé que c'était inopérable. J'étais désormais atteint d'un cancer du côlon de stade 4 avec métastases hépatiques inopérables et deux jeunes garçons de 3 et 5 ans que je ne pouvais laisser orphelins.

C'était pendant le confinement du Covid-19, ma famille et mes enfants ne pouvaient pas m'accompagner à l'hôpital à cause des restrictions.

Néanmoins, je ne suis pas du genre à abandonner, j'ai pris cela comme un défi à relever. Avec peu de chances au départ, j'ai été déclaré sans signe de cancer après 1,5 an de chimiothérapie et de radiothérapie extrêmement éprouvante. Je n'ai même pas eu besoin d'une opération du foie. Le score était de 2-0, et nous croisions les doigts pour qu'il ne revienne jamais.

Il n'est pas revenu, mais un autre cancer allait devenir mon nouveau défi. Les médecins suspectaient quelque chose à la thyroïde lors d'un contrôle de routine. Après des examens supplémentaires et des biopsies à l'aiguille, j'ai appris que j'avais maintenant un cancer de la thyroïde. Je me suis dit : "meh, ça c’est facile".

Hier, on m'a retiré toute la thyroïde. La tumeur faisait déjà 2 cm. C’est désormais 3-0. Je ne sais pas ce qui m’attend, mais peu importe, je continuerai à me battre. En attendant, je suivrai une chimiothérapie préventive tous les 6 mois tout en continuant à profiter de mes enfants.

Alors camarade, vois cela comme un défi à relever. Tu as en toi la force et l'optimisme nécessaires, peu importe à quel point la vie est dure. Garde la tête haute et continue à marquer des buts."""

In [7]:
# Tagging input text 1
text1_tags = tag_text(text_1)

[32m[1m------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[36m[1mSentence 0:  Bonjour camarades, je voulais juste partager mon histoire après une opération où j'ai marqué un autre but contre le cancer, menant 3-0. J'espère qu'elle inspirera quelqu'un.

J'ai été diagnostiqué d'un cancer du côlon en mai 2020 lorsque j'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30 cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade 2. Selon les médecins, j'étais guéri, l'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d'un verre. Le score était de 1-0.

Pourtant, j'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier 2021, un

In [8]:
# Output tags text 1
text1_tags

{0: {' ': ['Z99'],
  'Bonjour': ['S1.1.1', 'Z4'],
  'camarades': ['Z99'],
  ',': ['PUNCT'],
  'je': ['Z8mf'],
  'voulais': ['X7+', 'S6+', 'A7+', 'S3.2', 'A9-'],
  'juste': ['Z99'],
  'partager': ['S1.1.2+'],
  'mon': ['Z8'],
  'histoire': ['Z99'],
  'après': ['Z5'],
  'une': ['Z5'],
  'opération': ['A1.1.1', 'B3', 'G3'],
  'où': ['Z8'],
  "j'": ['Z8mf'],
  'ai': ['A9+', 'Z5', 'A2.2', 'S4'],
  'marqué': ['O4.2-', 'Q1.2', 'A5/P1', 'N3.1', 'Q1.1'],
  'un': ['Z5'],
  'autre': ['A6.1-', 'A6.1-/Z8'],
  'but': ['Z99'],
  'contre': ['Z5'],
  'le': ['Z5'],
  'cancer': ['B2-'],
  'menant': ['S7.1+', 'A2.2', 'M2', 'A1.1.1'],
  '3': ['N1'],
  '-': ['Z99'],
  '0': ['Z99'],
  '.': ['PUNCT'],
  "J'": ['Z8mf'],
  'espère': ['X2.6+', 'E4.1+', 'X9.2+', 'A5.1+'],
  "qu'": ['Z5'],
  'elle': ['Z8'],
  'inspirera': ['S8+'],
  "quelqu'": ['A13.5', 'N5', 'Z5'],
  '\n\n': ['Z99'],
  'été': ['T1.3'],
  'diagnostiqué': ['Z99'],
  "d'": ['Z5'],
  'du': ['Z5'],
  'côlon': ['Z99'],
  'en': ['Z5'],
  'mai': ['T1.3',


---

### **STEP 5: Extracting emotion words using USAS emotion tags:** *usas_emotion_tags function*

>>**input:** piece of text

>>**output:** python dictionary where *keys* represent a sentence in the input text and *values* represent a dictionary of usas tagged emotion words and tags for that sentence

---



In [9]:
usas_emo_cls_dict = {'E1': 'Emotional Actions, States And Processes General',
 'E1+': 'Emotional',
 'E1-': 'Unemotional',
 'E2': 'Liking',
 'E2+': 'Like',
 'E2-': 'Dislike',
 'E3': 'Calm/Violent/Angry',
 'E3+': 'Calm',
 'E3-': 'Violent/Angry',
 'E4': 'Happiness and Contentment',
 'E4.1': 'Happy/sad',
 'E4.1+': 'Happy',
 'E4.1-': 'Sad',
 'E4.2': 'Contentment',
 'E4.2+': 'Content',
 'E4.2-': 'Discontent',
 'E5': 'Bravery and Fear',
 'E5+': 'Bravery',
 'E5-': 'Fear/shock',
 'E6': 'Worry and confidence',
 'E6+': 'Confident',
 'E6-': 'Worry'}

In [10]:
# Defining the emotion tag extraction function
def usas_emotion_tags(text):
  usas_eval_tags = {}
  sentences = re.split(r'(。|！|\!|？|\?)', text)
  for i in range(len(sentences)):
    if(sentences[i]):
      usas_list = {}
      sent = nlp(sentences[i])
      print("\n")
      print(Fore.MAGENTA + Style.BRIGHT + "--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
      print(Fore.BLUE + Style.BRIGHT + f"Sentence {i}:", sentences[i])
      for token in sent:
        tags = token._.pymusas_tags
        emo_tags = [x for x in tags if x.startswith('E')]
        if emo_tags:
          usas_list[token.text] = emo_tags
          print(Fore.MAGENTA + f'{token.text}:' + Fore.GREEN, emo_tags)
      usas_eval_tags[sentences[i]] = usas_list
  return usas_eval_tags

In [11]:
# Text 1 emotion tag extraction
text1_emo_tags = usas_emotion_tags(text_1)



[35m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[34m[1mSentence 0:  Bonjour camarades, je voulais juste partager mon histoire après une opération où j'ai marqué un autre but contre le cancer, menant 3-0. J'espère qu'elle inspirera quelqu'un.

J'ai été diagnostiqué d'un cancer du côlon en mai 2020 lorsque j'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30 cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade 2. Selon les médecins, j'étais guéri, l'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d'un verre. Le score était de 1-0.

Pourtant, j'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En 

In [12]:
text1_emo_tags

{' Bonjour camarades, je voulais juste partager mon histoire après une opération où j\'ai marqué un autre but contre le cancer, menant 3-0. J\'espère qu\'elle inspirera quelqu\'un.\n\nJ\'ai été diagnostiqué d\'un cancer du côlon en mai 2020 lorsque j\'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30\xa0cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade\xa02. Selon les médecins, j\'étais guéri, l\'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d\'un verre. Le score était de 1-0.\n\nPourtant, j\'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier\xa02021, un scanner de routine a révélé de mauvaises nouvelles. J\'avais des lésions au foie et le chirurgien m\'a annoncé que c\'était inopérable. J\'étais désormais atteint d\'un cancer du côlon de stade\xa


---

### **STEP 6: USAS Sentiment Classification:** *usas_sentiment_classifier function*

>>**input:** dictionary of sentence and emotion word tags

>>**output:** sentiment class *positive*, *negative*, *neutral* with counts per class

---



In [13]:
# Defining the sentiment classifier
def usas_sentiment_classifier(usas_emo_tag, positive, negative, neutral):
  sentiment_cls = {}
  for sent, emo_dict in usas_emo_tag.items():
    neg, pos, neu = 0, 0, 0
    if(emo_dict):
      for key, val_list in emo_dict.items():
        for val in val_list:
          if val.endswith('-'):
            neg+=1
            negative+=1
          elif  val.endswith('+'):
            pos+=1
            positive+=1
          else:
            neu+=1
            neutral+=1
    else:
      neu+=1
      neutral+=1
    if neg==max(pos, neg, neu):
          sentiment = 'negative'
          sentiment_cls[sent] = sentiment
    elif pos==max(pos, neg, neu):
          sentiment = 'positive'
          sentiment_cls[sent] = sentiment
    else:
          sentiment = 'neutral'
          sentiment_cls[sent] = sentiment
    print(Fore.MAGENTA + Style.BRIGHT + "Sentence:", sent)
    print(Fore.GREEN + Style.BRIGHT + "class:", sentiment)
    print("\n")
    print(Fore.GREEN + Style.BRIGHT + "--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
  return sentiment_cls, positive, negative, neutral

In [14]:
# Sentiment counts and tagging
sentiments_text1, pos_text1, neg_text1, neu_text1 = usas_sentiment_classifier(text1_emo_tags, 0, 0, 0)

[35m[1mSentence:  Bonjour camarades, je voulais juste partager mon histoire après une opération où j'ai marqué un autre but contre le cancer, menant 3-0. J'espère qu'elle inspirera quelqu'un.

J'ai été diagnostiqué d'un cancer du côlon en mai 2020 lorsque j'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30 cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade 2. Selon les médecins, j'étais guéri, l'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d'un verre. Le score était de 1-0.

Pourtant, j'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier 2021, un scanner de routine a révélé de mauvaises nouvelles. J'avais des lésions au foie et le chirurgien m'a annoncé que c'était inopérable. J'étais désormais atteint d'un cancer du côlon de stade 4 avec métasta

In [15]:
# Text 1 sentiment tags per sentence
sentiments_text1

{' Bonjour camarades, je voulais juste partager mon histoire après une opération où j\'ai marqué un autre but contre le cancer, menant 3-0. J\'espère qu\'elle inspirera quelqu\'un.\n\nJ\'ai été diagnostiqué d\'un cancer du côlon en mai 2020 lorsque j\'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30\xa0cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade\xa02. Selon les médecins, j\'étais guéri, l\'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d\'un verre. Le score était de 1-0.\n\nPourtant, j\'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier\xa02021, un scanner de routine a révélé de mauvaises nouvelles. J\'avais des lésions au foie et le chirurgien m\'a annoncé que c\'était inopérable. J\'étais désormais atteint d\'un cancer du côlon de stade\xa

In [16]:
# Text 1 sentiment counts for per class
print(f'Text 1: positive = {pos_text1}, negative = {neg_text1}, neutral = {neu_text1}')

Text 1: positive = 1, negative = 3, neutral = 0


In [17]:
text1_emo_tags

{' Bonjour camarades, je voulais juste partager mon histoire après une opération où j\'ai marqué un autre but contre le cancer, menant 3-0. J\'espère qu\'elle inspirera quelqu\'un.\n\nJ\'ai été diagnostiqué d\'un cancer du côlon en mai 2020 lorsque j\'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30\xa0cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade\xa02. Selon les médecins, j\'étais guéri, l\'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d\'un verre. Le score était de 1-0.\n\nPourtant, j\'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier\xa02021, un scanner de routine a révélé de mauvaises nouvelles. J\'avais des lésions au foie et le chirurgien m\'a annoncé que c\'était inopérable. J\'étais désormais atteint d\'un cancer du côlon de stade\xa

---
### **STEP 7: Sentiment Probability - Sentence-level**
---



In [18]:
# Defining the probability estimation function for sentiment classification at the sentence-level
def sentence_sentiment_prob(usas_emo_tag):
  sentiment_cls = {}
  for sent, emo_dict in usas_emo_tag.items():
    neg, pos, neu = 0, 0, 0
    if(emo_dict):
      for key, val_list in emo_dict.items():
        for val in val_list:
          if val.endswith('-'):
            neg+=1
          elif val.endswith('+'):
            pos+=1
          else:
            neu+=1
    else:
      neu+=1
    sentiment = f'positive={pos/(pos+neg+neu)}, negative={neg/(pos+neg+neu)}, neutral={neu/(pos+neg+neu)}'
    sentiment_cls[sent] = sentiment
    print(Fore.GREEN + Style.BRIGHT + "Sentence:", sent)
    print(Fore.CYAN + Style.BRIGHT + "class:", sentiment)
    print("\n")
    print(Fore.CYAN + Style.BRIGHT + "--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
  return sentiment_cls

In [19]:
# Text 1 sentence-level sentiment probability
sentiment_prob_text1 = (sentence_sentiment_prob(text1_emo_tags))

[32m[1mSentence:  Bonjour camarades, je voulais juste partager mon histoire après une opération où j'ai marqué un autre but contre le cancer, menant 3-0. J'espère qu'elle inspirera quelqu'un.

J'ai été diagnostiqué d'un cancer du côlon en mai 2020 lorsque j'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30 cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade 2. Selon les médecins, j'étais guéri, l'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d'un verre. Le score était de 1-0.

Pourtant, j'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier 2021, un scanner de routine a révélé de mauvaises nouvelles. J'avais des lésions au foie et le chirurgien m'a annoncé que c'était inopérable. J'étais désormais atteint d'un cancer du côlon de stade 4 avec métasta

In [20]:
sentiment_prob_text1

{' Bonjour camarades, je voulais juste partager mon histoire après une opération où j\'ai marqué un autre but contre le cancer, menant 3-0. J\'espère qu\'elle inspirera quelqu\'un.\n\nJ\'ai été diagnostiqué d\'un cancer du côlon en mai 2020 lorsque j\'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30\xa0cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade\xa02. Selon les médecins, j\'étais guéri, l\'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d\'un verre. Le score était de 1-0.\n\nPourtant, j\'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier\xa02021, un scanner de routine a révélé de mauvaises nouvelles. J\'avais des lésions au foie et le chirurgien m\'a annoncé que c\'était inopérable. J\'étais désormais atteint d\'un cancer du côlon de stade\xa

---
### **STEP 8: Sentiment Probability -Text-level**
---



In [21]:
def text_sentiment_prob(text, pos, neg, neu):
  prob = f'positive={pos/(pos+neg+neu)}, negative={neg/(pos+neg+neu)}, neutral={neu/(pos+neg+neu)}'
  print(Fore.CYAN+ text)
  print(Fore.GREEN+ "----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
  print(prob)
  return prob

In [22]:
text1_prob = text_sentiment_prob(text_1, pos_text1, neg_text1, neu_text1)

[36m Bonjour camarades, je voulais juste partager mon histoire après une opération où j'ai marqué un autre but contre le cancer, menant 3-0. J'espère qu'elle inspirera quelqu'un.

J'ai été diagnostiqué d'un cancer du côlon en mai 2020 lorsque j'ai eu une hémorragie majeure. Avant que je ne réalise, les chirurgiens avaient retiré 30 cm de mon côlon. La récupération a été difficile, mais gérable. Le côté positif était que, malgré la taille de la tumeur, les ganglions lymphatiques étaient indemnes, me plaçant au stade 2. Selon les médecins, j'étais guéri, l'un des chanceux à laisser le cancer derrière soi et à raconter son histoire autour d'un verre. Le score était de 1-0.

Pourtant, j'ai vite appris que cette saloperie pouvait aussi voyager par le sang. En janvier 2021, un scanner de routine a révélé de mauvaises nouvelles. J'avais des lésions au foie et le chirurgien m'a annoncé que c'était inopérable. J'étais désormais atteint d'un cancer du côlon de stade 4 avec métastases hépatiques