In [1]:
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' # Disable tensorflow debugging logs
os.environ["KERAS_BACKEND"] = "torch"
import keras_core as keras
import tensorflow as tf
import random

Using PyTorch backend.


## 1.- Dataset

In [2]:
import pathlib

path_to_zip = tf.keras.utils.get_file(
    'spa-eng.zip', origin='http://storage.googleapis.com/download.tensorflow.org/data/spa-eng.zip',
    extract=True)
path_to_file = pathlib.Path(path_to_zip).parent/'spa-eng/spa.txt'

with open(path_to_file) as f:
    lines = f.read().split("\n")[:-1]
    
text_pairs = []
for line in lines:
    eng, spa = line.lower().split("\t")
    text_pairs.append((eng, spa))

In [3]:
random.Random(43).shuffle(text_pairs)
num_val_samples = int(0.005 * len(text_pairs))
num_train_samples = len(text_pairs) - num_val_samples
train_pairs = text_pairs[:num_train_samples]
val_pairs = text_pairs[num_train_samples:]

print(f"{len(text_pairs)} total pairs")
print(f"{len(train_pairs)} training pairs")
print(f"{len(val_pairs)} validation pairs")

118964 total pairs
118370 training pairs
594 validation pairs


In [4]:
for s in train_pairs[:5]:
    print(s)

('the old woman fell and could not get up.', 'la anciana se cayó y no pudo levantarse.')
('what is this the abbreviation for?', '¿de qué es abreviatura esto?')
("you're not sick.", 'no estás enferma.')
('i have no knife to cut with.', 'no tengo un cuchillo con que cortarlo.')
('americans admire lincoln for his honesty.', 'los estadounidenses admiran a lincoln por su honestidad.')


## 2.- Evaluación

In [5]:
import warnings
# Disable warnings
warnings.filterwarnings("ignore")

In [6]:
import nltk

# Lista de oraciones de referencia (lista de listas)
referencias = [['El', 'gato', 'está', 'en', 'la', 'alfombra'],
               ['El', 'perro', 'juega', 'en', 'el', 'parque'],
               ['El', 'cielo', 'está', 'despejado'],
               ['El', 'sol', 'brilla', 'intensamente'],
               ['Los', 'pájaros', 'cantan', 'en', 'los', 'árboles']]

# Lista de oraciones candidatas (lista de listas)
candidatas = [['El', 'gato', 'está', 'durmiendo', 'en', 'la', 'alfombra'],
              ['El', 'perro', 'juega', 'en', 'el', 'jardín'],
              ['El', 'cielo', 'está', 'soleado'],
              ['El', 'sol', 'brilla', 'intensamente'],
              ['Los', 'pájaros', 'trinan', 'en', 'los', 'árboles']]

# Calcular el BLEU score para cada oración candidata
for i in range(len(candidatas)):
    referencia = referencias[i]
    candidata = candidatas[i]
    
    bleu_score = nltk.translate.bleu_score.sentence_bleu([referencia], candidata)
    print(f"BLEU score para la oración {i+1}: {bleu_score}")

BLEU score para la oración 1: 8.44484326442819e-78
BLEU score para la oración 2: 0.7598356856515925
BLEU score para la oración 3: 8.636168555094496e-78
BLEU score para la oración 4: 1.0
BLEU score para la oración 5: 7.262123179505913e-78
