---
# **SPANISH**
---

### **STEP 1: Downloading and installing the dependencies:**
>>**English PyMUSAS RuleBasedTagger**

>>**English spaCy pipeline**

>>**colorama:** *Colorama is a Python module that displays colored output in consoles.*
---



In [1]:
!pip install https://github.com/UCREL/pymusas-models/releases/download/es_dual_upos2usas_contextual-0.3.3/es_dual_upos2usas_contextual-0.3.3-py3-none-any.whl
!python -m spacy download es_core_news_sm

Collecting es-dual-upos2usas-contextual==0.3.3
  Downloading https://github.com/UCREL/pymusas-models/releases/download/es_dual_upos2usas_contextual-0.3.3/es_dual_upos2usas_contextual-0.3.3-py3-none-any.whl (208 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m209.0/209.0 kB[0m [31m4.3 MB/s[0m eta [36m0:00:00[0m
Collecting pymusas<0.4.0,>=0.3.0 (from es-dual-upos2usas-contextual==0.3.3)
  Downloading pymusas-0.3.0-py3-none-any.whl.metadata (6.5 kB)
Collecting click<8.1.0 (from pymusas<0.4.0,>=0.3.0->es-dual-upos2usas-contextual==0.3.3)
  Downloading click-8.0.4-py3-none-any.whl.metadata (3.2 kB)
Downloading pymusas-0.3.0-py3-none-any.whl (51 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m51.9/51.9 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading click-8.0.4-py3-none-any.whl (97 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m97.5/97.5 kB[0m [31m2.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packag

In [2]:
!pip install colorama

Collecting colorama
  Downloading colorama-0.4.6-py2.py3-none-any.whl.metadata (17 kB)
Downloading colorama-0.4.6-py2.py3-none-any.whl (25 kB)
Installing collected packages: colorama
Successfully installed colorama-0.4.6


---
### **STEP 2: Creating the tagger**

---



In [3]:
import spacy

# We exclude the following components as we do not need them.
nlp = spacy.load('es_core_news_sm', exclude=['parser', 'ner'])
# Load the Spanish PyMUSAS rule-based tagger in a separate spaCy pipeline
spanish_tagger_pipeline = spacy.load('es_dual_upos2usas_contextual')
# Adds the Spanish PyMUSAS rule-based tagger to the main spaCy pipeline
nlp.add_pipe('pymusas_rule_based_tagger', source=spanish_tagger_pipeline)

<pymusas.spacy_api.taggers.rule_based.RuleBasedTagger at 0x7b64dc6f8e10>

---

### **STEP 3: Importing the libraries**

---



In [4]:
import re
import pandas as pd
import numpy as np
from colorama import Fore, Back, Style

import nltk
nltk.download('punkt_tab')
from nltk.tokenize import sent_tokenize

[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt_tab.zip.


---
### **STEP 4: Tagging text:** *tag_text function*

>>**input:** piece of text

>>**output:** python dictionary where *keys* represent the index of a sentence in the input text and *values* represent the usas semantic tags for that sentence

---



In [5]:
# Defining the tagging function
def tag_text(text):
  usas_eval_tags = {}
  usas_list = {}
  sentences = nltk.sent_tokenize(text)
  for i in range(len(sentences)):
    if(sentences[i]):
      print(Fore.GREEN + Style.BRIGHT + "------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
      print(Fore.CYAN + Style.BRIGHT + f"Sentence {i}:", sentences[i])
      print(Fore.CYAN + Style.BRIGHT + "------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
      sent = nlp(sentences[i])
      for token in sent:
        tags = token._.pymusas_tags
        print(Fore.CYAN + f'{token.text}:' + Fore.GREEN, tags)
        for tag in tags:
          usas_list[token.text] = token._.pymusas_tags
      usas_eval_tags[i] = usas_list
  return usas_eval_tags

In [6]:
# Input text 1
text_1 = """Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0. Espero que pueda inspirar a alguien por ahí.

Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante. Antes de darme cuenta, los cirujanos me extirparon 30 cm de colon. La recuperación fue dura, pero manejable. Lo bueno es que, aunque el tumor era grande, los ganglios linfáticos estaban limpios, colocándome en estadio 2. Según los médicos, estaba libre y era uno de los afortunados que podía dejar el cáncer atrás y contar la historia en un bar. El marcador era 1-0 para mí.

Sin embargo, más tarde aprendí por las malas que esta mierda también puede viajar por la sangre. En enero de 2021, mi escáner de rutina mostró noticias desagradables. Tenía varias lesiones en el hígado y mi mundo colapsó cuando el cirujano me dijo que era inoperable. Ahora era un estadio 4 de cáncer de colon con metástasis hepática inoperable y dos niños pequeños de 3 y 5 años que no podía dejar sin padre.

Esto fue durante los días de confinamiento por coronavirus, y mi familia e hijos no podían acompañarme todo el tiempo en el hospital por las restricciones.

Sin embargo, no soy de rendirme, y lo asumí como un nuevo reto que debía superar. Con pocas probabilidades al inicio, después de 1,5 años de quimioterapia y radioterapia que me patearon el trasero, no necesité ni siquiera una operación de hígado. El marcador iba 2-0 y cruzábamos los dedos para que no volviera nunca.

No volvió, pero un cáncer completamente distinto sería mi nuevo reto. Los médicos sospecharon algo en mi tiroides durante otro escáner de rutina. Tras pruebas y biopsias con aguja, resultó que ahora tengo cáncer de tiroides. Pensé: “meh, este es fácil”.

Ayer me extirparon toda la tiroides en una operación. El tumor ya medía 2 cm. Ahora estamos 3-0. No sé qué me espera, pero sea lo que sea, lo enfrentaré y lo combatiré. Mientras tanto, recibiré quimioterapia preventiva cada 6 meses y seguiré disfrutando de criar a mis hijos.

Así que, camarada, considera lo tuyo como un reto también. Tienes la fuerza y el optimismo para enfrentarlo, no importa lo dura que sea la vida. Mantén la cabeza en alto y sigue anotando."""

In [7]:
# Tagging input text 1
text1_tags = tag_text(text_1)

[32m[1m------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[36m[1mSentence 0: Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.
[36m[1m------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[36mHola:[32m ['Z99']
[36mcamaradas:[32m ['Z99']
[36m,:[32m ['PUNCT']
[36msolo:[32m ['A14', 'S5-', 'N5---', 'S5-', 'S3.2-']
[36mquería:[32m ['X7+', 'A2', 'S7', 'X2']
[36mcompartir:[32m ['S1.1.2+']
[36mmi:[32m ['Z5', 'Z8', 'A9']
[36mhistoria:[32m ['T1.1', 'X2', 'G1', 'P1', 'T3+']
[36mdespués:[32m ['N4', 'Z5', 'T1.1']
[36mde:[32m ['Z5']
[36muna:[32m ['Z5', 'Z8', 'N1']
[36moperación:[32m ['N2', 'B3', 'I2.2', 'G3', 'A1

In [8]:
# Output tags text 1
text1_tags

{0: {'Hola': ['Z99'],
  'camaradas': ['Z99'],
  ',': ['PUNCT'],
  'solo': ['A14', 'S5-', 'N5---', 'S5-', 'S3.2-'],
  'quería': ['X7+', 'A2', 'S7', 'X2'],
  'compartir': ['S1.1.2+'],
  'mi': ['Z5', 'Z8', 'A9'],
  'historia': ['T1.1', 'X2', 'G1', 'P1', 'T3+'],
  'después': ['N4', 'Z5', 'T1.1'],
  'de': ['Z5'],
  'una': ['Z5', 'Z8', 'N1'],
  'operación': ['N2', 'B3', 'I2.2', 'G3', 'A1.1.1', 'X2.4'],
  'en': ['Z5', 'N3'],
  'la': ['Z5'],
  'que': ['Z5', 'Z8'],
  'marqué': ['Z99'],
  'otro': ['Z8', 'A6.1-m', 'N5++'],
  'gol': ['Z99'],
  'contra': ['Z5', 'A1.8', 'S3'],
  'el': ['Z5'],
  'cáncer': ['B2-'],
  'y': ['Z5', 'A1.8+'],
  'lo': ['Z5', 'Z8'],
  'puse': ['M2', 'A9', 'A1.1.1'],
  '3-0': ['N1'],
  '.': ['PUNCT'],
  'Espero': ['T1.3', 'X2.6+', 'A3+', 'E4.1+', 'X9.2+'],
  'pueda': ['A1.1.1', 'S7.1+', 'O3', 'S1.2.5+', 'N2', 'S7', 'G1'],
  'inspirar': ['Z99'],
  'a': ['Z5'],
  'alguien': ['Z5', 'S2m'],
  'por': ['Z5', 'A2.2', 'M1', 'M6'],
  'ahí': ['M7', 'M6', 'T1.2', 'Z5'],
  'Fui': ['M1']


---

### **STEP 5: Extracting emotion words using USAS emotion tags:** *usas_emotion_tags function*

>>**input:** piece of text

>>**output:** python dictionary where *keys* represent a sentence in the input text and *values* represent a dictionary of usas tagged emotion words and tags for that sentence

---



In [9]:
usas_emo_cls_dict = {'E1': 'Emotional Actions, States And Processes General',
 'E1+': 'Emotional',
 'E1-': 'Unemotional',
 'E2': 'Liking',
 'E2+': 'Like',
 'E2-': 'Dislike',
 'E3': 'Calm/Violent/Angry',
 'E3+': 'Calm',
 'E3-': 'Violent/Angry',
 'E4': 'Happiness and Contentment',
 'E4.1': 'Happy/sad',
 'E4.1+': 'Happy',
 'E4.1-': 'Sad',
 'E4.2': 'Contentment',
 'E4.2+': 'Content',
 'E4.2-': 'Discontent',
 'E5': 'Bravery and Fear',
 'E5+': 'Bravery',
 'E5-': 'Fear/shock',
 'E6': 'Worry and confidence',
 'E6+': 'Confident',
 'E6-': 'Worry'}

In [10]:
# Defining the emotion tag extraction function
def usas_emotion_tags(text):
  usas_eval_tags = {}
  sentences = nltk.sent_tokenize(text)
  for i in range(len(sentences)):
    if(sentences[i]):
      usas_list = {}
      sent = nlp(sentences[i])
      print("\n")
      print(Fore.MAGENTA + Style.BRIGHT + "--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
      print(Fore.BLUE + Style.BRIGHT + f"Sentence {i}:", sentences[i])
      for token in sent:
        tags = token._.pymusas_tags
        emo_tags = [x for x in tags if x.startswith('E')]
        if emo_tags:
          usas_list[token.text] = emo_tags
          print(Fore.MAGENTA + f'{token.text}:' + Fore.GREEN, emo_tags)
      usas_eval_tags[sentences[i]] = usas_list
  return usas_eval_tags

In [11]:
# Text 1 emotion tag extraction
text1_emo_tags = usas_emotion_tags(text_1)



[35m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[34m[1mSentence 0: Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.


[35m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[34m[1mSentence 1: Espero que pueda inspirar a alguien por ahí.
[35mEspero:[32m ['E4.1+']


[35m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[34m[1mSentence 2: Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorr

In [12]:
text1_emo_tags

{'Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.': {},
 'Espero que pueda inspirar a alguien por ahí.': {'Espero': ['E4.1+']},
 'Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante.': {},
 'Antes de darme cuenta, los cirujanos me extirparon 30 cm de colon.': {},
 'La recuperación fue dura, pero manejable.': {},
 'Lo bueno es que, aunque el tumor era grande, los ganglios linfáticos estaban limpios, colocándome en estadio 2.': {'bueno': ['E1',
   'E2+']},
 'Según los médicos, estaba libre y era uno de los afortunados que podía dejar el cáncer atrás y contar la historia en un bar.': {},
 'El marcador era 1-0 para mí.': {},
 'Sin embargo, más tarde aprendí por las malas que esta mierda también puede viajar por la sangre.': {},
 'En enero de 2021, mi escáner de rutina mostró noticias desagradables.': {},
 'Tenía varias lesiones en el hígado y mi mundo colapsó cuando


---

### **STEP 6: USAS Sentiment Classification:** *usas_sentiment_classifier function*

>>**input:** dictionary of sentence and emotion word tags

>>**output:** sentiment class *positive*, *negative*, *neutral* with counts per class

---



In [13]:
# Defining the sentiment classifier
def usas_sentiment_classifier(usas_emo_tag, positive, negative, neutral):
  sentiment_cls = {}
  for sent, emo_dict in usas_emo_tag.items():
    neg, pos, neu = 0, 0, 0
    if(emo_dict):
      for key, val_list in emo_dict.items():
        for val in val_list:
          if val.endswith('-'):
            neg+=1
            negative+=1
          elif  val.endswith('+'):
            pos+=1
            positive+=1
          else:
            neu+=1
            neutral+=1
    else:
      neu+=1
      neutral+=1
    if neg==max(pos, neg, neu):
          sentiment = 'negative'
          sentiment_cls[sent] = sentiment
    elif pos==max(pos, neg, neu):
          sentiment = 'positive'
          sentiment_cls[sent] = sentiment
    else:
          sentiment = 'neutral'
          sentiment_cls[sent] = sentiment
    print(Fore.MAGENTA + Style.BRIGHT + "Sentence:", sent)
    print(Fore.GREEN + Style.BRIGHT + "class:", sentiment)
    print("\n")
    print(Fore.GREEN + Style.BRIGHT + "--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
  return sentiment_cls, positive, negative, neutral

In [14]:
# Sentiment counts and tagging
sentiments_text1, pos_text1, neg_text1, neu_text1 = usas_sentiment_classifier(text1_emo_tags, 0, 0, 0)

[35m[1mSentence: Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.
[32m[1mclass: neutral


[32m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[35m[1mSentence: Espero que pueda inspirar a alguien por ahí.
[32m[1mclass: positive


[32m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[35m[1mSentence: Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante.
[32m[1mclass: neutral


[32m[1m-------------------------------------------------------------------------------------------------------------------------------------------------------

In [15]:
# Text 1 sentiment tags per sentence
sentiments_text1

{'Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.': 'neutral',
 'Espero que pueda inspirar a alguien por ahí.': 'positive',
 'Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante.': 'neutral',
 'Antes de darme cuenta, los cirujanos me extirparon 30 cm de colon.': 'neutral',
 'La recuperación fue dura, pero manejable.': 'neutral',
 'Lo bueno es que, aunque el tumor era grande, los ganglios linfáticos estaban limpios, colocándome en estadio 2.': 'positive',
 'Según los médicos, estaba libre y era uno de los afortunados que podía dejar el cáncer atrás y contar la historia en un bar.': 'neutral',
 'El marcador era 1-0 para mí.': 'neutral',
 'Sin embargo, más tarde aprendí por las malas que esta mierda también puede viajar por la sangre.': 'neutral',
 'En enero de 2021, mi escáner de rutina mostró noticias desagradables.': 'neutral',
 'Tenía varias lesiones en el híga

In [16]:
# Text 1 sentiment counts for per class
print(f'Text 1: positive = {pos_text1}, negative = {neg_text1}, neutral = {neu_text1}')

Text 1: positive = 5, negative = 0, neutral = 26


In [17]:
text1_emo_tags

{'Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.': {},
 'Espero que pueda inspirar a alguien por ahí.': {'Espero': ['E4.1+']},
 'Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante.': {},
 'Antes de darme cuenta, los cirujanos me extirparon 30 cm de colon.': {},
 'La recuperación fue dura, pero manejable.': {},
 'Lo bueno es que, aunque el tumor era grande, los ganglios linfáticos estaban limpios, colocándome en estadio 2.': {'bueno': ['E1',
   'E2+']},
 'Según los médicos, estaba libre y era uno de los afortunados que podía dejar el cáncer atrás y contar la historia en un bar.': {},
 'El marcador era 1-0 para mí.': {},
 'Sin embargo, más tarde aprendí por las malas que esta mierda también puede viajar por la sangre.': {},
 'En enero de 2021, mi escáner de rutina mostró noticias desagradables.': {},
 'Tenía varias lesiones en el hígado y mi mundo colapsó cuando

---
### **STEP 7: Sentiment Probability - Sentence-level**
---



In [18]:
# Defining the probability estimation function for sentiment classification at the sentence-level
def sentence_sentiment_prob(usas_emo_tag):
  sentiment_cls = {}
  for sent, emo_dict in usas_emo_tag.items():
    neg, pos, neu = 0, 0, 0
    if(emo_dict):
      for key, val_list in emo_dict.items():
        for val in val_list:
          if val.endswith('-'):
            neg+=1
          elif val.endswith('+'):
            pos+=1
          else:
            neu+=1
    else:
      neu+=1
    sentiment = f'positive={pos/(pos+neg+neu)}, negative={neg/(pos+neg+neu)}, neutral={neu/(pos+neg+neu)}'
    sentiment_cls[sent] = sentiment
    print(Fore.GREEN + Style.BRIGHT + "Sentence:", sent)
    print(Fore.CYAN + Style.BRIGHT + "class:", sentiment)
    print("\n")
    print(Fore.CYAN + Style.BRIGHT + "--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
  return sentiment_cls

In [19]:
# Text 1 sentence-level sentiment probability
sentiment_prob_text1 = (sentence_sentiment_prob(text1_emo_tags))

[32m[1mSentence: Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.
[36m[1mclass: positive=0.0, negative=0.0, neutral=1.0


[36m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[32m[1mSentence: Espero que pueda inspirar a alguien por ahí.
[36m[1mclass: positive=1.0, negative=0.0, neutral=0.0


[36m[1m--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[32m[1mSentence: Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante.
[36m[1mclass: positive=0.0, negative=0.0, neutral=1.0


[36m[1m--------------------------------------------------------

In [20]:
sentiment_prob_text1

{'Hola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0.': 'positive=0.0, negative=0.0, neutral=1.0',
 'Espero que pueda inspirar a alguien por ahí.': 'positive=1.0, negative=0.0, neutral=0.0',
 'Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante.': 'positive=0.0, negative=0.0, neutral=1.0',
 'Antes de darme cuenta, los cirujanos me extirparon 30 cm de colon.': 'positive=0.0, negative=0.0, neutral=1.0',
 'La recuperación fue dura, pero manejable.': 'positive=0.0, negative=0.0, neutral=1.0',
 'Lo bueno es que, aunque el tumor era grande, los ganglios linfáticos estaban limpios, colocándome en estadio 2.': 'positive=0.5, negative=0.0, neutral=0.5',
 'Según los médicos, estaba libre y era uno de los afortunados que podía dejar el cáncer atrás y contar la historia en un bar.': 'positive=0.0, negative=0.0, neutral=1.0',
 'El marcador era 1-0 para mí.': 'positive=0.0, negat

---
### **STEP 8: Sentiment Probability -Text-level**
---



In [21]:
def text_sentiment_prob(text, pos, neg, neu):
  prob = f'positive={pos/(pos+neg+neu)}, negative={neg/(pos+neg+neu)}, neutral={neu/(pos+neg+neu)}'
  print(Fore.CYAN+ text)
  print(Fore.GREEN+ "----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------")
  print(prob)
  return prob

In [22]:
text1_prob = text_sentiment_prob(text_1, pos_text1, neg_text1, neu_text1)

[36mHola camaradas, solo quería compartir mi historia después de una operación en la que marqué otro gol contra el cáncer y lo puse 3-0. Espero que pueda inspirar a alguien por ahí.

Fui diagnosticado con cáncer de colon en mayo de 2020, cuando tuve una hemorragia importante. Antes de darme cuenta, los cirujanos me extirparon 30 cm de colon. La recuperación fue dura, pero manejable. Lo bueno es que, aunque el tumor era grande, los ganglios linfáticos estaban limpios, colocándome en estadio 2. Según los médicos, estaba libre y era uno de los afortunados que podía dejar el cáncer atrás y contar la historia en un bar. El marcador era 1-0 para mí.

Sin embargo, más tarde aprendí por las malas que esta mierda también puede viajar por la sangre. En enero de 2021, mi escáner de rutina mostró noticias desagradables. Tenía varias lesiones en el hígado y mi mundo colapsó cuando el cirujano me dijo que era inoperable. Ahora era un estadio 4 de cáncer de colon con metástasis hepática inoperable y