In [1]:
import transformers, re, datasets, torch, evaluate
import pandas as pd
from datasets import Dataset
from transformers import AutoTokenizer, AutoModelForSequenceClassification

dev = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
f1 = evaluate.load('f1')
acc = evaluate.load('accuracy')
dataset = pd.read_csv(r'C:\Users\FLopezP\Desktop\PCIC\Segundo Semestre\Minería de textos\Corpus TASS\corpusTASS-2020\test.tsv', sep = '\t')
dataset.head(5)

Unnamed: 0,id,texto,pais,etiqueta
0,770809220291760128,Quiero que alguien me diga cosas bonitas,ES,N
1,772825676793589760,@RavlRVara ¡Síguenos porfa! Tenemos que decirt...,ES,NEU
2,772508582923337729,@Charlywayty @Karim0931 cualquiera diría que e...,ES,NEU
3,790657169876193281,"a to esto, el tio de ono no ha venio",ES,N
4,770967255773507584,@IKEASpain es el mismo así que tomo nota de to...,ES,P


In [2]:
def no_arrobas(tweet):
    return re.sub("@+([a-zA-Z|0-9])+ | #+[a-zA-Z|0-9]", '', tweet)

def create_dataset(texto, tag, clean):
    """
    texto = list ; Conjunto de tweets
    tag = list ; Conjunto de etiquetas
    clean = bool ; Opción de preprocesamiento
    """
    if clean:
        texto = [no_arrobas(_) for _ in texto]
    dict_dataset = {'Tweets': texto, 'Tags': tag}
    aux_df = pd.DataFrame(dict_dataset)
    return Dataset.from_pandas(aux_df)

In [3]:
ds_limpio = create_dataset(dataset['texto'], dataset['etiqueta'], True)
ds_normal = create_dataset(dataset['texto'], dataset['etiqueta'], False)
ds_limpio

Dataset({
    features: ['Tweets', 'Tags'],
    num_rows: 7264
})

In [4]:
tokenizer = AutoTokenizer.from_pretrained("finiteautomata/beto-sentiment-analysis")
model = AutoModelForSequenceClassification.from_pretrained("finiteautomata/beto-sentiment-analysis").to(dev)

other_tokenizer = AutoTokenizer.from_pretrained('dccuchile/bert-base-spanish-wwm-cased')
other_model = AutoModelForSequenceClassification.from_pretrained('dccuchile/bert-base-spanish-wwm-cased').to(dev)

Some weights of BertForSequenceClassification were not initialized from the model checkpoint at dccuchile/bert-base-spanish-wwm-cased and are newly initialized: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight', 'classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


In [5]:
def evaluate_example(tweet, modelo, token_maker):
    """
    Evaluación manual multiclase 

    tweet = str ;  Texto a clasificar
    """
    inputs = token_maker(tweet, return_tensors = 'pt').to(dev)
    with torch.no_grad():
        logits = modelo(**inputs).logits
        logits = torch.sigmoid(logits)

    value = logits[0]
    aux = 0
    classifier = -1
    for _ in value:
        if _.item() > aux:
            aux = _
            classifier += 1
    return classifier

In [6]:
%%time

labels = ds_limpio['Tags']

# Modelo de Pysentimiento (ya entrenado con los datos)
pred_limpio = [evaluate_example(_, model, tokenizer) for _ in ds_limpio['Tweets']]
pred_normal = [evaluate_example(_, model, tokenizer) for _ in ds_normal['Tweets']]

# Modelo base (sin fine-tuning)
ft_limpio = [evaluate_example(_, other_model, other_tokenizer) for _ in ds_limpio['Tweets']]
ft_normal = [evaluate_example(_, other_model, other_tokenizer) for _ in ds_normal['Tweets']]

print(len(pred_limpio), len(pred_normal))

7264 7264
CPU times: total: 2min 12s
Wall time: 2min 12s


In [7]:
def translate_and_eval(etiquetas, predicciones):
    new_labels = []
    for _ in etiquetas:
        if str(_) == 'P':
            new_labels.append(2)
        elif str(_) == 'N':
            new_labels.append(0)
        else:
            new_labels.append(1)
    results = f1.compute(references = new_labels, predictions = predicciones, average = 'macro')
    accuracy = acc.compute(references = new_labels, predictions = predicciones)
    return results, accuracy, new_labels

In [8]:
# Modelo de Pysentimiento
f1_limpio, acc_limpio, limpio_labels = translate_and_eval(labels, pred_limpio)
f1_normal, acc_normal, normal_labels = translate_and_eval(labels, pred_normal)

# Modelo finetuneado apenas
f1_ft_limpio, acc_ft_limpio, ft_limpio_labels = translate_and_eval(labels, ft_limpio)
f1_ft_normal, acc_ft_normal, ft_normal_labels = translate_and_eval(labels, ft_normal)

print('Modelo: finiteautomata/beto-sentiment-analysis')
print('------------------F1------------------')
print('Dataset limpio: {}. Dataset normal: {}'.format(f1_limpio, f1_normal))
print('---------------Accuracy---------------')
print('Dataset limpio: {}. Dataset normal: {}'.format(acc_limpio, acc_normal))
print('-----------------------------------------------------------')
print('\n')
print('Modelo: dccuchile/bert-base-spanish-wwm-cased')
print('------------------F1------------------')
print('Dataset limpio: {}. Dataset normal: {}'.format(f1_ft_limpio, f1_ft_normal))
print('---------------Accuracy---------------')
print('Dataset limpio: {}. Dataset normal: {}'.format(acc_ft_limpio, acc_ft_normal))

Modelo: finiteautomata/beto-sentiment-analysis
------------------F1------------------
Dataset limpio: {'f1': 0.5762955723975381}. Dataset normal: {'f1': 0.5766719809382167}
---------------Accuracy---------------
Dataset limpio: {'accuracy': 0.5837004405286343}. Dataset normal: {'accuracy': 0.5817731277533039}
-----------------------------------------------------------


Modelo: dccuchile/bert-base-spanish-wwm-cased
------------------F1------------------
Dataset limpio: {'f1': 0.2589339284872167}. Dataset normal: {'f1': 0.2564499326284158}
---------------Accuracy---------------
Dataset limpio: {'accuracy': 0.3536618942731278}. Dataset normal: {'accuracy': 0.3560022026431718}


1. Positivo = 2
2. Negativo = 0
3. Neutral = 1

In [9]:
def analysis(prediction, reference, dataset):
    print('====== MAL CLASIFICADOS ======')
    for i in range(15):
        if prediction[i] != reference[i]:
            print(f"Tweet mal clasificado: {dataset['Tweets'][i]}")
            print(f"Tag correcto: {prediction[i]}. Tag del modelo: {reference[i]}.")
            print("---")

    print('====== BIEN CLASIFICADOS ======')
    for i in range(15):
        if prediction[i] == reference[i]:
            print(f"Tweet bien clasificado: {dataset['Tweets'][i]}")
            print(f"Tag correcto: {prediction[i]}. Tag del modelo: {reference[i]}.")
            print("---")


print('Análisis del modelo de Pysentimiento')
print('Dataset Limpio')
analysis(limpio_labels, pred_limpio, ds_limpio)
print("-----------------")
print('\n')
print('-----------------')
print('Dataset Sin Normalizar')
analysis(normal_labels, pred_normal, ds_normal)

Análisis del modelo de Pysentimiento
Dataset Limpio
Tweet mal clasificado: Quiero que alguien me diga cosas bonitas 
Tag correcto: 0. Tag del modelo: 1.
---
Tweet mal clasificado: es el mismo así que tomo nota de todo racias
Tag correcto: 2. Tag del modelo: 1.
---
Tweet mal clasificado: q en horas estemos en septiembre, perdona?????  24 junio dnde stas 
Tag correcto: 0. Tag del modelo: 1.
---
Tweet mal clasificado: Estás muy calladito por aquí julio... q n puedo poner la radio 
Tag correcto: 0. Tag del modelo: 1.
---
Tweet mal clasificado: Hay algunos shojos de comedia romántica que me gustaría que se centraran un poco más en lo romántico 
Tag correcto: 0. Tag del modelo: 2.
---
Tweet mal clasificado: Tengo que hacer resumen de sociales de 5 temas y todos los ejercicios de 4 temas  Me suicido ya?
Tag correcto: 0. Tag del modelo: 1.
---
Tweet bien clasificado: ¡Síguenos porfa! Tenemos que decirte una cosa 
Tag correcto: 1. Tag del modelo: 1.
---
Tweet bien clasificado: cualquiera diría 

In [10]:
print('Análisis del modelo base')
print('Dataset Limpio')
analysis(ft_limpio_labels, ft_limpio, ds_limpio)
print("-----------------")
print('\n')
print('-----------------')
print('Dataset Sin Normalizar')
analysis(ft_normal_labels, ft_normal, ds_normal)

Análisis del modelo base
Dataset Limpio
Tweet mal clasificado: ¡Síguenos porfa! Tenemos que decirte una cosa 
Tag correcto: 1. Tag del modelo: 0.
---
Tweet mal clasificado: cualquiera diría que estamos deseando pasar frío 
Tag correcto: 1. Tag del modelo: 0.
---
Tweet mal clasificado: es el mismo así que tomo nota de todo racias
Tag correcto: 2. Tag del modelo: 0.
---
Tweet mal clasificado: me encantan los VAPES gracias por estar ahí todos los días y alegrarnos 
Tag correcto: 2. Tag del modelo: 1.
---
Tweet mal clasificado: @HuGo17__ Vamos con PAM que preferimos entrenar vs DDH, teneis muy buen lvl bro 
Tag correcto: 2. Tag del modelo: 0.
---
Tweet mal clasificado: Hay algunos shojos de comedia romántica que me gustaría que se centraran un poco más en lo romántico 
Tag correcto: 0. Tag del modelo: 1.
---
Tweet mal clasificado: Tengo que hacer resumen de sociales de 5 temas y todos los ejercicios de 4 temas  Me suicido ya?
Tag correcto: 0. Tag del modelo: 1.
---
Tweet mal clasificado: @

**Posibles sesgos**

Modelo Pysentimiento:
1. Fácilmente influenciados por léxico tradicionalmente positivo o negativo: _Quiero que alguien me diga cosas bonitas_.

Modelo FT:
1. Considerablemente peor que el modelo ya ajustado.

2. Los modelos no tienen cambios particularmente notorios a partir del preprocesamiento.