# Classificazione di Aspect e Opinion con ModernBERT su Restaurant-ACOS

In [1]:
# Import delle librerie necessarie
import torch
import numpy as np
import random
import pandas as pd
import wandb
import os
import sys
import re
from torch.utils.data import Dataset, DataLoader
from transformers import AutoTokenizer, AutoModelForTokenClassification, get_linear_schedule_with_warmup
from torch.optim import AdamW
import torch.nn as nn
import bitsandbytes as bnb

from evaluate import load
from tqdm import tqdm

from torch.amp import autocast, GradScaler # Per Mixed Precision

print("Librerie caricate.")

Librerie caricate.


### Impostazioni per la riproducibilit√† 

In [2]:
def set_seed(seed_value=42):
    """Imposto i seed per la riproducibilit√†."""
    random.seed(seed_value)
    np.random.seed(seed_value)
    torch.manual_seed(seed_value)
    if torch.cuda.is_available():
        # Imposto anche i seed per la GPU, se disponibile
        torch.cuda.manual_seed_all(seed_value)

# Esegui l'impostazione del seed
set_seed(42) 
print("Random seeds impostati su 42.")

Random seeds impostati su 42.


In [8]:
import wandb

WANDB_ENTITY = "cristinatextmining"

# 1. Definizione degli Hyperparameters
config = {
    "learning_rate": 5e-5,
    "epochs": 10,
    "batch_size": 16,
    "model_name": "answerdotai/ModernBERT-base",
    "dataset": "Restaurant-ACOS",  
    "seed": 42,
    'patience': 2  # Per Early Stopping
}

# 2. Inizializzazione del Run
wandb.init(
    project="BigData-TextMining-ACOS",
    entity=WANDB_ENTITY,
    config=config,
    name=f"run_{config['model_name']}_{config['dataset']}"
)

print(f"W&B inizializzato per il progetto: {wandb.run.project}")
print(f"Nome della Run attuale: {wandb.run.name}")

W&B inizializzato per il progetto: BigData-TextMining-ACOS
Nome della Run attuale: run_answerdotai/ModernBERT-base_Restaurant-ACOS


## PyTorch Dataset & DataLoader Construction

### Creazione di PyTorch Dataset e DataLoader
In questa fase, trasformiamo i nostri DataFrame Pandas (strutture dati tabellari) in oggetti Dataset e DataLoader di PyTorch. Questo passaggio √® il "ponte" necessario per alimentare il modello ModernBERT durante l'addestramento.

#### Obiettivi di questa sezione:

  1. Standardizzazione dei Dati (ACOSDataset):

       * I modelli basati su Transformer non possono leggere direttamente i DataFrame. La classe ACOSDataset estrae le liste di input_ids, attention_mask e labels e le converte in Tensori PyTorch (torch.tensor).

       * Viene utilizzato il tipo di dato torch.long, richiesto dai layer di embedding e dalle funzioni di calcolo della Loss per task di classificazione.

  2. Gestione del Caricamento (DataLoader):

      * Batching: Invece di caricare l'intero dataset in memoria (rischioso per la GPU), i dati vengono divisi in piccoli blocchi chiamati Batch (nel nostro caso di dimensione 16).

      * Shuffling (Solo Training): Utilizziamo shuffle=True nel train_loader per rimescolare l'ordine delle frasi a ogni epoca. Questo impedisce al modello di imparare l'ordine sequenziale dei dati, costringendolo invece a focalizzarsi sui pattern linguistici reali.

      * Efficienza: I DataLoader gestiscono il caricamento dei dati in parallelo, ottimizzando i tempi di addestramento sulla GPU.

In [9]:

# --- 1. CARICAMENTO DEI DATASET SALVATI  ---
cartella_dati = "data_allineati"

print("üìÇ Caricamento dei dataset pre-processati...")
# Carichiamo i Ristoranti
df_train_align_rest = pd.read_pickle(os.path.join(cartella_dati, "train_rest_aligned.pkl"))
df_dev_align_rest = pd.read_pickle(os.path.join(cartella_dati, "dev_rest_aligned.pkl"))
df_test_align_rest = pd.read_pickle(os.path.join(cartella_dati, "test_rest_aligned.pkl"))


class ACOSDataset(Dataset):
    def __init__(self, df):
        # Estraiamo le colonne che abbiamo generato nella fase di allineamento
        self.input_ids = df['input_ids'].tolist()
        self.attention_mask = df['attention_mask'].tolist()
        self.labels = df['labels'].tolist()

    def __len__(self):
        return len(self.input_ids)

    def __getitem__(self, idx):
        # Convertiamo le liste in Tensori di PyTorch (LongTensor per ID e Label)
        return {
            'input_ids': torch.tensor(self.input_ids[idx], dtype=torch.long),
            'attention_mask': torch.tensor(self.attention_mask[idx], dtype=torch.long),
            'labels': torch.tensor(self.labels[idx], dtype=torch.long)
        }

# --- CREAZIONE DELLE ISTANZE ---

# Creiamo i dataset per il dominio restaruant
train_dataset_rest = ACOSDataset(df_train_align_rest)
dev_dataset_rest = ACOSDataset(df_dev_align_rest)
test_dataset_rest = ACOSDataset(df_test_align_rest)

# --- CONFIGURAZIONE DATALOADERS ---

BATCH_SIZE = 16 # Numero di frasi analizzate contemporaneamente

train_loader_rest = DataLoader(train_dataset_rest, batch_size=BATCH_SIZE, shuffle=True)
dev_loader_rest = DataLoader(dev_dataset_rest, batch_size=BATCH_SIZE)
test_loader_rest = DataLoader(test_dataset_rest, batch_size=BATCH_SIZE)

print(f"Dataset e DataLoaders creati con successo!")
print(f"Esempi nel set di Training RESTAURANT: {len(train_dataset_rest)}")  

üìÇ Caricamento dei dataset pre-processati...
Dataset e DataLoaders creati con successo!
Esempi nel set di Training RESTAURANT: 1530


### Definizione e l'Inizializzazione del Modello di Token Classification.

1. Caricare il "Cervello" (ModernBERT Pre-trained)
Dobbiamo scaricare il modello ModernBERT-base dal repository di Hugging Face. In questa fase, il modello sa gi√† "leggere" e "capire" la lingua inglese perch√© √® stato addestrato su miliardi di testi, ma non sa ancora nulla del tuo task specifico (ACOS). √à come un laureato in lingue che per√≤ non ha mai lavorato in un ristorante o in un negozio di computer.

2. Aggiungere la "Testa" di Classificazione
ModernBERT normalmente restituisce dei vettori numerici (embedding) per ogni parola. Noi dobbiamo aggiungere sopra questi vettori uno strato finale chiamato Linear Layer (o testa di classificazione).

   * Questo strato prender√† l'output di ModernBERT e lo "schiaccer√†" su 5 classi possibili: 0 (O), 1 (B-ASP), 2 (I-ASP), 3 (B-OPI), 4 (I-OPI).

   * Il modello dovr√† imparare a mappare ogni pezzetto di frase a una di queste cinque etichette.

3. Configurare la Strategia di Apprendimento (Optimizer & Loss)
Dobbiamo dare al modello gli strumenti per imparare dai suoi errori:

  * Loss Function (Funzione di Perdita): Useremo la CrossEntropyLoss. √à il "voto" che diamo al modello. Se il modello dice che "pizza" √® un'opinione (B-OPI) ma il tuo dataset dice che √® un aspetto (B-ASP), la Loss sar√† alta. Il modello cercher√† di abbassarla il pi√π possibile.

   * Optimizer (Ottimizzatore): Di solito si usa AdamW. √à l'algoritmo che decide "come" e "quanto" cambiare i pesi interni del modello per correggere gli errori.

   * Learning Rate: La velocit√† con cui il modello impara. Se √® troppo alta, il modello √® "frettoloso" e sbaglia; se √® troppo bassa, non imparer√† mai.

In [10]:

# --- 1. CONFIGURAZIONE DEL DEVICE ---
# Se hai una GPU NVIDIA, user√† 'cuda'. Se hai un Mac M1/M2, user√† 'mps'. Altrimenti 'cpu'.
if torch.cuda.is_available():
    device = torch.device("cuda")
    print(f" GPU Trovata: {torch.cuda.get_device_name(0)}")
elif torch.backends.mps.is_available():
    device = torch.device("mps")
    print(" Acceleratore Apple Metal (MPS) Trovato")
else:
    device = torch.device("cpu")
    print(" Nessuna GPU trovata. L'addestramento sar√† lento.")

# --- 2. CARICAMENTO DI MODERNBERT (IL "CERVELLO") + TESTA DI CLASSIFICAZIONE ---
# Definiamo le 5 etichette: 0=O, 1=B-ASP, 2=I-ASP, 3=B-OPI, 4=I-OPI
NUM_LABELS = 5 

print("Scaricamento e configurazione di ModernBERT...")
model = AutoModelForTokenClassification.from_pretrained(
    "answerdotai/ModernBERT-base",
    num_labels=NUM_LABELS
)

# Spostiamo il modello sul dispositivo di calcolo (GPU/MPS/CPU)
model.to(device)

# --- 3. CONFIGURAZIONE DELL'OTTIMIZZATORE E DELLA LOSS ---



# A. Optimizer (AdamW 8-bit)
# Usiamo il Learning Rate standard di 5e-5 come definito nei parametri sperimentali 
# e la versione a 8-bit per non saturare la memoria
optimizer = bnb.optim.AdamW8bit(model.parameters(), lr=5e-5)

# B. Loss Function (CrossEntropyLoss)
# La funzione che calcola l'errore tra la predizione del modello e le label reali.
# Nota: 'ignore_index=-100' √® lo standard di PyTorch per ignorare i token di padding nel calcolo dell'errore.
loss_fn = nn.CrossEntropyLoss()

print("\n" + "="*50)
print("MODELLO PRONTO PER IL TRAINING")
print("="*50)
print(f"Architettura: ModernBERT-base")
print(f"Task: Token Classification (Estrazione Aspetti & Opinioni)")
print(f"Numero di Classi: {NUM_LABELS}")
print(f"Optimizer: AdamW 8-bit (lr=5e-5)")
print(f"Loss Function: CrossEntropyLoss")

 GPU Trovata: NVIDIA GeForce RTX 4050 Laptop GPU
Scaricamento e configurazione di ModernBERT...




Loading weights:   0%|          | 0/136 [00:00<?, ?it/s]

[1mModernBertForTokenClassification LOAD REPORT[0m from: answerdotai/ModernBERT-base
Key               | Status     | 
------------------+------------+-
decoder.bias      | UNEXPECTED | 
classifier.weight | MISSING    | 
classifier.bias   | MISSING    | 

[3mNotes:
- UNEXPECTED[3m	:can be ignored when loading from different task/architecture; not ok if you expect identical arch.
- MISSING[3m	:those params were newly initialized because missing from the checkpoint. Consider training on your downstream task.[0m



MODELLO PRONTO PER IL TRAINING
Architettura: ModernBERT-base
Task: Token Classification (Estrazione Aspetti & Opinioni)
Numero di Classi: 5
Optimizer: AdamW 8-bit (lr=5e-5)
Loss Function: CrossEntropyLoss


In [11]:
# --- 1. CONFIGURAZIONE AVANZATA MEMORIA ---
# Gradient Checkpointing: risparmia tantissima VRAM ricalcolando i passaggi intermedi
model.gradient_checkpointing_enable()

# Parametri per simulare un batch size maggiore
accumulation_steps = config.get('accumulation_steps', 4) 
patience = config.get('patience', 2)
patience_counter = 0

optimizer = bnb.optim.AdamW8bit(
    model.parameters(), 
    lr=config['learning_rate']
)
# Scaler per Mixed Precision (fondamentale per evitare l'OOM)
scaler = GradScaler() 

total_steps = (len(train_loader_rest) // accumulation_steps) * config['epochs']
scheduler = get_linear_schedule_with_warmup(
    optimizer, 
    num_warmup_steps=0, 
    num_training_steps=total_steps
)

# --- 2. FUNZIONI DI SUPPORTO OTTIMIZZATE ---

def evaluate_model(model, data_loader, device):
    model.eval()
    total_loss = 0
    with torch.no_grad():
        for batch in data_loader:
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            labels = batch['labels'].to(device)
            
            # Usiamo autocast anche in valutazione
            with autocast(device_type='cuda'):
                outputs = model(input_ids=input_ids, attention_mask=attention_mask, labels=labels)
            
            total_loss += outputs.loss.item()
    return total_loss / len(data_loader)

def train_epoch(model, data_loader, optimizer, scheduler, device, epoch_idx, scaler, accumulation_steps):
    model.train()
    total_loss = 0
    optimizer.zero_grad() # Reset iniziale
    
    loop = tqdm(data_loader, leave=True)
    
    for i, batch in enumerate(loop):
        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        labels = batch['labels'].to(device)
        
        # A. Mixed Precision Forward Pass
        with autocast(device_type='cuda'):
            outputs = model(input_ids=input_ids, attention_mask=attention_mask, labels=labels)
            loss = outputs.loss / accumulation_steps 
        
        # B. Backward Pass con Scaler
        scaler.scale(loss).backward()
        
        # C. Update Pesi ogni 'accumulation_steps'
        if (i + 1) % accumulation_steps == 0 or (i + 1) == len(data_loader):
            scaler.step(optimizer)
            scaler.update()
            scheduler.step()
            optimizer.zero_grad()
        
        total_loss += loss.item() * accumulation_steps
        wandb.log({"batch_loss": loss.item() * accumulation_steps})
        loop.set_description(f"Epoca {epoch_idx + 1}")
        loop.set_postfix(loss=loss.item() * accumulation_steps)

    return total_loss / len(data_loader)

# --- 3. CICLO DI ADDESTRAMENTO ---

print(f"üöÄ Training su RESTAURANT: {config['epochs']} epoche | Device: {device}")
print(f"üì¶ Accumulo Gradienti ogni {accumulation_steps} step | FP16 Attivato")

best_valid_loss_rest = float('inf')


for epoch in range(config['epochs']):
    print(f"\n--- Epoca {epoch+1}/{config['epochs']} ---")
    
    # 1. Training
    train_loss_rest = train_epoch(model, train_loader_rest, optimizer, scheduler, device, epoch, scaler, accumulation_steps)
    
    # 2. Validazione
    valid_loss_rest = evaluate_model(model, dev_loader_rest, device)
    
    if torch.cuda.is_available():
        torch.cuda.empty_cache()
    
    print(f"üìâ Train Loss: {train_loss_rest:.4f} | üîç Valid Loss: {valid_loss_rest:.4f}")
    
    # 3. Log metriche epoca su W&B
    wandb.log({
        "epoch": epoch + 1,
        "train_loss_epoch": train_loss_rest,
        "valid_loss_epoch": valid_loss_rest
    })
    
    # --- LOGICA EARLY STOPPING & CHECKPOINT ---
    
    # Se il modello migliora (la valid loss scende)
    if valid_loss_rest < best_valid_loss_rest:
        best_valid_loss_rest = valid_loss_rest
        patience_counter = 0  # ### NUOVO: Resettiamo la pazienza ###
        
        print(f"üíæ Miglior modello trovato (Loss: {best_valid_loss_rest:.4f})! Salvataggio...")
        

        # Creiamo la cartella se non esiste (sicurezza aggiuntiva)
        if not os.path.exists("./best_model_restaurant"):
            os.makedirs("./best_model_restaurant")
            
        model.save_pretrained("./best_model_restaurant")
        
    # Se il modello NON migliora
    else:
        patience_counter += 1  # ### NUOVO: Incrementiamo il contatore ###
        print(f"‚ö†Ô∏è Nessun miglioramento. Patience: {patience_counter}/{patience}")
        
        # Se abbiamo esaurito la pazienza
        if patience_counter >= patience:
            print(f"\nüõë EARLY STOPPING ATTIVATO! Interruzione all'epoca {epoch+1}.")
            break # Esce dal ciclo for

print("\n‚úÖ Fine Addestramento.")
wandb.finish()

üöÄ Training su RESTAURANT: 10 epoche | Device: cuda
üì¶ Accumulo Gradienti ogni 4 step | FP16 Attivato

--- Epoca 1/10 ---


  0%|          | 0/96 [00:00<?, ?it/s]

Epoca 1: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 96/96 [00:19<00:00,  4.87it/s, loss=0.0938]


üìâ Train Loss: 0.2205 | üîç Valid Loss: 0.0974
üíæ Miglior modello trovato (Loss: 0.0974)! Salvataggio...


Writing model shards:   0%|          | 0/1 [00:00<?, ?it/s]


--- Epoca 2/10 ---


Epoca 2: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 96/96 [00:19<00:00,  4.90it/s, loss=0.0757]


üìâ Train Loss: 0.0855 | üîç Valid Loss: 0.0581
üíæ Miglior modello trovato (Loss: 0.0581)! Salvataggio...


Writing model shards:   0%|          | 0/1 [00:00<?, ?it/s]


--- Epoca 3/10 ---


Epoca 3: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 96/96 [00:19<00:00,  4.98it/s, loss=0.0501]


üìâ Train Loss: 0.0536 | üîç Valid Loss: 0.0414
üíæ Miglior modello trovato (Loss: 0.0414)! Salvataggio...


Writing model shards:   0%|          | 0/1 [00:00<?, ?it/s]


--- Epoca 4/10 ---


Epoca 4: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 96/96 [00:19<00:00,  4.83it/s, loss=0.0604]


üìâ Train Loss: 0.0363 | üîç Valid Loss: 0.0410
üíæ Miglior modello trovato (Loss: 0.0410)! Salvataggio...


Writing model shards:   0%|          | 0/1 [00:00<?, ?it/s]


--- Epoca 5/10 ---


Epoca 5: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 96/96 [00:19<00:00,  5.00it/s, loss=0.0217] 


üìâ Train Loss: 0.0249 | üîç Valid Loss: 0.0394
üíæ Miglior modello trovato (Loss: 0.0394)! Salvataggio...


Writing model shards:   0%|          | 0/1 [00:00<?, ?it/s]


--- Epoca 6/10 ---


Epoca 6: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 96/96 [00:19<00:00,  4.87it/s, loss=0.0219] 


üìâ Train Loss: 0.0160 | üîç Valid Loss: 0.0426
‚ö†Ô∏è Nessun miglioramento. Patience: 1/2

--- Epoca 7/10 ---


Epoca 7: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 96/96 [00:19<00:00,  4.86it/s, loss=0.00836]


üìâ Train Loss: 0.0096 | üîç Valid Loss: 0.0464
‚ö†Ô∏è Nessun miglioramento. Patience: 2/2

üõë EARLY STOPPING ATTIVATO! Interruzione all'epoca 7.

‚úÖ Fine Addestramento.


0,1
batch_loss,‚ñà‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÇ‚ñÇ‚ñÇ‚ñÇ‚ñÅ‚ñÇ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ
epoch,‚ñÅ‚ñÇ‚ñÉ‚ñÖ‚ñÜ‚ñá‚ñà
train_loss_epoch,‚ñà‚ñÑ‚ñÇ‚ñÇ‚ñÇ‚ñÅ‚ñÅ
valid_loss_epoch,‚ñà‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÇ

0,1
batch_loss,0.00836
epoch,7.0
train_loss_epoch,0.00963
valid_loss_epoch,0.04638


In [12]:

# --- A. CARICAMENTO DEL "CAMPIONE" ---
# Carichiamo i pesi migliori salvati durante il training (Epoca 3)
print("üìÇ Caricamento del modello migliore...")
model_path = "./best_model_restaurant"
model = AutoModelForTokenClassification.from_pretrained(model_path)
model.to(device)
model.eval() # Modalit√† esame (spegne dropout)

# --- B. PREPARAZIONE METRICHE ---
# Carichiamo la metrica seqeval (standard per NER/ABSA)
metric = load("seqeval")

# Mappa per decodificare i numeri in etichette
# (Assicurati che corrisponda al tuo training!)
id2label = {0: 'O', 1: 'B-ASP', 2: 'I-ASP', 3: 'B-OPI', 4: 'I-OPI'}
label_list = list(id2label.values())

print("üöÄ Inizio Test sul Dataset Restaurant...")

# --- C. CICLO DI PREVISIONE ---
predictions = []
true_labels = []

with torch.no_grad():
    for batch in tqdm(test_loader_rest, desc="Test RESTAURANT"):
        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        labels = batch['labels'].to(device)

        # 1. Il modello predice
        outputs = model(input_ids, attention_mask=attention_mask)
        logits = outputs.logits
        
        # 2. Prendiamo la classe con probabilit√† pi√π alta (argmax)
        preds = torch.argmax(logits, dim=-1)

        # 3. Convertiamo i numeri in etichette (pulendo i -100)
        # Dobbiamo ignorare i token speciali (-100) usati per il padding/subwords
        for i in range(len(labels)):
            true_label_row = []
            pred_label_row = []
            
            for j in range(len(labels[i])):
                if labels[i][j] != -100: # Ignoriamo i token di padding/speciali
                    true_label_row.append(id2label[labels[i][j].item()])
                    pred_label_row.append(id2label[preds[i][j].item()])
            
            true_labels.append(true_label_row)
            predictions.append(pred_label_row)

# --- D. CALCOLO E STAMPA RISULTATI ---
results = metric.compute(predictions=predictions, references=true_labels)

print("\n" + "="*50)
print("üìä RISULTATI FINALI (TEST SET - RESTAURANT)")
print("="*50)

# Stampiamo le metriche generali
print(f"Overall Precision: {results['overall_precision']:.4f}")
print(f"Overall Recall:    {results['overall_recall']:.4f}")
print(f"Overall F1-Score:  {results['overall_f1']:.4f}")
print(f"Overall Accuracy:  {results['overall_accuracy']:.4f}")

print("\nüîç Dettaglio per Classe (Quello che conta per il paper):")
print("-" * 50)
# Estraiamo le metriche specifiche per ASP e OPI
for key in results.keys():
    if key in ['ASP', 'OPI']: # Filtriamo solo le nostre classi di interesse
        print(f"üîπ {key}:")
        print(f"   Precision: {results[key]['precision']:.4f}")
        print(f"   Recall:    {results[key]['recall']:.4f}")
        print(f"   F1-Score:  {results[key]['f1']:.4f}")
        print(f"   Support:   {results[key]['number']}") # Quanti ce n'erano davvero
print("="*50)

üìÇ Caricamento del modello migliore...


Loading weights:   0%|          | 0/138 [00:00<?, ?it/s]

üöÄ Inizio Test sul Dataset Restaurant...


Test RESTAURANT: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 37/37 [00:06<00:00,  5.49it/s]



üìä RISULTATI FINALI (TEST SET - RESTAURANT)
Overall Precision: 0.6832
Overall Recall:    0.7110
Overall F1-Score:  0.6968
Overall Accuracy:  0.9824

üîç Dettaglio per Classe (Quello che conta per il paper):
--------------------------------------------------
üîπ ASP:
   Precision: 0.6384
   Recall:    0.6447
   F1-Score:  0.6416
   Support:   608
üîπ OPI:
   Precision: 0.7229
   Recall:    0.7731
   F1-Score:  0.7472
   Support:   648
