# Entrenamiento internet

In [1]:
import os

# Dataset
SOURCE_LANGUAGE = "en"
TARGET_LANGUAGE = "it"
SUBSET = False
PERCENT_SUBSET = 0.1

# Train
EPOCH0 = 0
STEP0 = 0
LR = 1e-5
EPOCHS = 100000
GPUS = 1
GPU_NUMBER = 0
if GPUS > 1:
    BS = 120
else:
    if SUBSET:
        BS = 128
    else:
        BS = 60
print(f"BS: {BS}")
LR_SCHEDULER = False

# Model
MODEL_PATH = f"model"
if os.path.exists(MODEL_PATH):
    files = os.listdir(MODEL_PATH)
    for file in files:
        if "transformer" in file:
            name = file.split(".")[0]
            STEP0 = int(name.split("_")[-1])
            EPOCH0 = int(name.split("_")[-2])
DIM_EMBEDDING = 512
NUM_HEADS = 8
NUM_LAYERS = 6
DROPOUT = 0.1
LABEL_SMOOTHING = 0.1

# Tokenizers
TOKENIZERS_PATH = f"tokenizers"
if not os.path.exists(TOKENIZERS_PATH):
    os.makedirs(TOKENIZERS_PATH)
UNKNOWN_TOKEN = "[UNK]"
PADDING_TOKEN = "[PAD]"
START_OF_SEQUENCE = "[SOS]"
END_OF_SEQUENCE = "[EOS]"

BS: 60


In [2]:
# TODOs
# TODO: Cambiar el dataset
# TODO: Podar el transformer
# TODO: Usar mi función de crear máscara
# TODO: Usar mi función de validación
# TODO: Usar mi función de entrenamiento
# TODO: Sacar la máscara del dataset

## Device ✔

In [3]:
import torch

if torch.cuda.device_count() > 1 and GPUS > 1:
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print(f"Using {torch.cuda.device_count()} GPUs")
else:
    if torch.cuda.is_available():
        device = torch.device(f"cuda:{GPU_NUMBER}")
        print(f"Using GPU {GPU_NUMBER}")
    else:
        device = torch.device("cpu")
        print("Using CPU")

Using GPU 0


## Carga de los datos ✔

Cargamos el dataset

In [4]:
from datasets import load_dataset

if SUBSET:
    dataset_raw = load_dataset('opus_books', f'{SOURCE_LANGUAGE}-{TARGET_LANGUAGE}', split='train')
    len_dataset = len(dataset_raw)
    len_subset = int(len_dataset * PERCENT_SUBSET)
    dataset_raw = load_dataset('opus_books', f'{SOURCE_LANGUAGE}-{TARGET_LANGUAGE}', split=f'train[:{len_subset}]')
else:
    dataset_raw = load_dataset('opus_books', f'{SOURCE_LANGUAGE}-{TARGET_LANGUAGE}', split='train')

len(dataset_raw)

Found cached dataset opus_books (/home/wallabot/.cache/huggingface/datasets/opus_books/en-it/1.0.0/e8f950a4f32dc39b7f9088908216cd2d7e21ac35f893d04d39eb594746af2daf)


32332

Vamos a ver cómo es el dataset

In [5]:
dataset_raw

Dataset({
    features: ['id', 'translation'],
    num_rows: 32332
})

Vemos que es una tupla de con dos características cada elemento, la primera la id y la segunda el texto.

Vamos a ver el primer elemento de la tupla

In [6]:
dataset_raw[0]

{'id': '0',
 'translation': {'en': 'Source: Project Gutenberg',
  'it': 'Source: www.liberliber.it/Audiobook available here'}}

Veamos ahora el segundo elemento de la tupla

In [7]:
dataset_raw[1]

{'id': '1', 'translation': {'en': 'Jane Eyre', 'it': 'Jane Eyre'}}

Vemos que el `id` no nos aporta mucha información, por lo que no lo usaremos

Vamos ahora a ver el elemento `translation`

In [8]:
dataset_raw[2]['translation']

{'en': 'Charlotte Bronte', 'it': 'Charlotte Brontë'}

Cada elemento `translation` es un diccionario con el texto en el idioma original y el texto traducido

## Entrenamiento de los tokenizers ✔

Vamos a entrenar un tokenizer para cada idioma. Podríamos utilizar uno ya preentrenado, pero a veces entrenar uno propio puede dar mejores resultados.

In [9]:
from tokenizers import Tokenizer
from tokenizers.models import WordLevel
from tokenizers.trainers import WordLevelTrainer
from tokenizers.pre_tokenizers import Whitespace

In [10]:
def get_all_sentences(dataset):
    all_sentences = []
    for i in range(len(dataset)):
        all_sentences.append(dataset[i]['translation'][SOURCE_LANGUAGE])
        all_sentences.append(dataset[i]['translation'][TARGET_LANGUAGE])
    return all_sentences

Entrenamos el tokenizer para el idioma original

In [11]:
tokenizer_source_path = f"{TOKENIZERS_PATH}/tokenizer_{SOURCE_LANGUAGE}.json"

if not os.path.exists(tokenizer_source_path) or STEP0 == 0 or EPOCH0 == 0:
    print(f"Training source tokenizer")
    tokenizer_source = Tokenizer(WordLevel(unk_token=UNKNOWN_TOKEN))
    tokenizer_source.pre_tokenizer = Whitespace()
    trainer = WordLevelTrainer(special_tokens=[UNKNOWN_TOKEN, PADDING_TOKEN, START_OF_SEQUENCE, END_OF_SEQUENCE])
    all_sentences = get_all_sentences(dataset_raw)
    tokenizer_source.train_from_iterator(all_sentences, trainer)
    tokenizer_source.save(tokenizer_source_path)
else:
    tokenizer_source = Tokenizer.from_file(tokenizer_source_path)

Training source tokenizer


Vamos a ver cómo es el tokenizer

In [12]:
with open(tokenizer_source_path, 'r') as file:
    for i in range(100):
        line = file.readline()
        if line == "\n":
            continue
        print(line, end="")

{
  "version": "1.0",
  "truncation": null,
  "padding": null,
  "added_tokens": [
    {
      "id": 0,
      "content": "[UNK]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    },
    {
      "id": 1,
      "content": "[PAD]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    },
    {
      "id": 2,
      "content": "[SOS]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    },
    {
      "id": 3,
      "content": "[EOS]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    }
  ],
  "normalizer": null,
  "pre_tokenizer": {
    "type": "Whitespace"
  },
  "post_processor": null,
  "decoder": null,
  "model": {
    "type": "WordLevel",
    "vocab": {
      "[UNK]": 0,
      "[PAD]": 1

Entrenamos el tokenizer para el idioma traducido

In [13]:
tokenizer_target_path = f"{TOKENIZERS_PATH}/tokenizer_{TARGET_LANGUAGE}.json"

if not os.path.exists(tokenizer_target_path) or STEP0 == 0 or EPOCH0 == 0:
    print(f"Training target tokenizer")
    tokenizer_target = Tokenizer(WordLevel(unk_token=UNKNOWN_TOKEN))
    tokenizer_target.pre_tokenizer = Whitespace()
    trainer = WordLevelTrainer(special_tokens=[UNKNOWN_TOKEN, PADDING_TOKEN, START_OF_SEQUENCE, END_OF_SEQUENCE])
    all_sentences = get_all_sentences(dataset_raw)
    tokenizer_target.train_from_iterator(all_sentences, trainer)
    tokenizer_target.save(tokenizer_target_path)
else:
    tokenizer_target = Tokenizer.from_file(tokenizer_target_path)

Training target tokenizer


Vamos a ver cómo es el tokenizer

In [14]:
with open(tokenizer_target_path, 'r') as file:
    for i in range(100):
        line = file.readline()
        if line == "\n":
            continue
        print(line, end="")

{
  "version": "1.0",
  "truncation": null,
  "padding": null,
  "added_tokens": [
    {
      "id": 0,
      "content": "[UNK]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    },
    {
      "id": 1,
      "content": "[PAD]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    },
    {
      "id": 2,
      "content": "[SOS]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    },
    {
      "id": 3,
      "content": "[EOS]",
      "single_word": false,
      "lstrip": false,
      "rstrip": false,
      "normalized": false,
      "special": true
    }
  ],
  "normalizer": null,
  "pre_tokenizer": {
    "type": "Whitespace"
  },
  "post_processor": null,
  "decoder": null,
  "model": {
    "type": "WordLevel",
    "vocab": {
      "[UNK]": 0,
      "[PAD]": 1

## Obtención de la lóngitud máxima de las secuencias ✔

In [15]:
max_source_sequence_length = 0
max_target_sequence_length = 0

for i in range(len(dataset_raw)):
    source_sequence_length = len(tokenizer_source.encode(dataset_raw[i]['translation'][SOURCE_LANGUAGE]).ids)
    target_sequence_length = len(tokenizer_target.encode(dataset_raw[i]['translation'][TARGET_LANGUAGE]).ids)
    if source_sequence_length > max_source_sequence_length:
        max_source_sequence_length = source_sequence_length
    if target_sequence_length > max_target_sequence_length:
        max_target_sequence_length = target_sequence_length

max_sequence_len = max(max_source_sequence_length, max_target_sequence_length)
max_sequence_len += 2   # Add 2 for the start and end of sequence tokens

print(f"Max source sequence length: {max_source_sequence_length}")
print(f"Max target sequence length: {max_target_sequence_length}")
print(f"Max sequence length: {max_sequence_len}")

Max source sequence length: 309
Max target sequence length: 274
Max sequence length: 311


## Datasets ✔

### Mask ✔

In [16]:
def create_mask(size):
    mask = torch.triu(torch.ones(1, size, size), diagonal = 1).type(torch.int)
    return mask == 0

### Dataset class ✔

In [17]:
import torch
from torch.utils.data import Dataset

class BilingualDataset(Dataset):
    def __init__(self, dataset, tokenizer_src, tokenizer_tgt, src_lang, tgt_lang, max_seq_len) -> None:
        super().__init__()
        
        self.max_seq_len = max_seq_len
        self.dataset = dataset
        self.tokenizer_src = tokenizer_src
        self.tokenizer_tgt = tokenizer_tgt
        self.src_lang = src_lang
        self.tgt_lang = tgt_lang
        
        # Defining special tokens by using the target language tokenizer
        self.sos_token = torch.tensor([tokenizer_tgt.token_to_id(START_OF_SEQUENCE)], dtype=torch.int64)
        self.eos_token = torch.tensor([tokenizer_tgt.token_to_id(END_OF_SEQUENCE)], dtype=torch.int64)
        self.pad_token = torch.tensor([tokenizer_tgt.token_to_id(PADDING_TOKEN)], dtype=torch.int64)
        self.unk_token = torch.tensor([tokenizer_tgt.token_to_id(UNKNOWN_TOKEN)], dtype=torch.int64)
        
    def __len__(self):
        return len(self.dataset)
    
    def __getitem__(self, index):
        # Getting the source and target texts from the dataset
        src_target_pair = self.dataset[index]['translation']
        src_text = src_target_pair[self.src_lang]
        tgt_text = src_target_pair[self.tgt_lang]
        
        # Tokenizing source and target texts 
        encoder_input_tokens = self.tokenizer_src.encode(src_text).ids
        decoder_input_tokens = self.tokenizer_tgt.encode(tgt_text).ids
        
        # Computing how many padding tokens need to be added to the tokenized texts 
        encoder_num_padding_tokens = self.max_seq_len - len(encoder_input_tokens) - 2 # Subtracting the two '[EOS]' and '[SOS]' special tokens
        decoder_num_padding_tokens = self.max_seq_len - len(decoder_input_tokens) - 1 # Subtracting the '[SOS]' special token
        
        # If the texts exceed the 'seq_len' allowed, it will raise an error. This means that one of the sentences in the pair is too long to be processed
        # given the current sequence length limit (this will be defined in the config dictionary below)
        if encoder_num_padding_tokens < 0 or decoder_num_padding_tokens < 0:
            raise ValueError('Sentence is too long')
         
        # Building the encoder input tensor by combining several elements
        encoder_input = torch.cat(
            [
                self.sos_token, # inserting the '[SOS]' token
                torch.tensor(encoder_input_tokens, dtype = torch.int64), # Inserting the tokenized source text
                self.eos_token, # Inserting the '[EOS]' token
                torch.tensor([self.pad_token] * encoder_num_padding_tokens, dtype = torch.int64) # Addind padding tokens
            ]
        )
        
        # Building the decoder input tensor by combining several elements
        decoder_input = torch.cat(
            [
                self.sos_token, # inserting the '[SOS]' token 
                torch.tensor(decoder_input_tokens, dtype = torch.int64), # Inserting the tokenized target text
                torch.tensor([self.pad_token] * decoder_num_padding_tokens, dtype = torch.int64) # Addind padding tokens
            ]
        )
        
        # Creating a label tensor, the expected output for training the model
        label = torch.cat(
            [
                torch.tensor(decoder_input_tokens, dtype = torch.int64), # Inserting the tokenized target text
                self.eos_token, # Inserting the '[EOS]' token 
                torch.tensor([self.pad_token] * decoder_num_padding_tokens, dtype = torch.int64) # Adding padding tokens
            ]
        )
        
        # Ensuring that the length of each tensor above is equal to the defined 'seq_len'
        assert encoder_input.size(0) == self.max_seq_len
        assert decoder_input.size(0) == self.max_seq_len
        assert label.size(0) == self.max_seq_len

        return {
            'encoder_input': encoder_input,
            'decoder_input': decoder_input, 
            'decoder_mask': (decoder_input != self.pad_token).unsqueeze(0).unsqueeze(0).int() & create_mask(decoder_input.size(0)),
            'label': label,
            'src_text': src_text,
            'tgt_text': tgt_text
        }


Veamos una muestra

In [18]:
from random import randint

sample_dataset = BilingualDataset(dataset_raw, tokenizer_source, tokenizer_target, SOURCE_LANGUAGE, TARGET_LANGUAGE, max_sequence_len)
idx = randint(0, len(sample_dataset))
sample_dataset = sample_dataset[idx]

print(f"Encoder input shape: {sample_dataset['encoder_input'].shape}")
print(f"Decoder input shape: {sample_dataset['decoder_input'].shape}")
print(f"Label shape: {sample_dataset['label'].shape}")
print(f"Source text: {sample_dataset['src_text']}")
print(f"Target text: {sample_dataset['tgt_text']}")

Encoder input shape: torch.Size([311])
Decoder input shape: torch.Size([311])
Label shape: torch.Size([311])
Source text: I think she is very kind, mais excessivement terre-à-terre. [Excessively matter-of-fact.]
Target text: È molto buona, mi pare, mais excessivement terre-à-terre.


### Split dataset ✔

Ahora que vemos que está bien, creamos los datasets de entrenamiento y validación

In [19]:
from torch.utils.data import random_split

percent_train = 0.99
len_train = int(len(dataset_raw) * percent_train)
len_val = len(dataset_raw) - len_train
train_dataset_raw, validation_dataset_raw = random_split(dataset_raw, [len_train, len_val])

print(f"Len train: {len(train_dataset_raw)}, len validation: {len(validation_dataset_raw)}")

Len train: 32008, len validation: 324


In [20]:
train_dataset = BilingualDataset(train_dataset_raw, tokenizer_source, tokenizer_target, SOURCE_LANGUAGE, TARGET_LANGUAGE, max_sequence_len)
validation_dataset = BilingualDataset(validation_dataset_raw, tokenizer_source, tokenizer_target, SOURCE_LANGUAGE, TARGET_LANGUAGE, max_sequence_len)

## Dataloaders ✔

In [21]:
from torch.utils.data import DataLoader

train_dataloader = DataLoader(train_dataset, batch_size=BS, shuffle=True)
validation_dataloader = DataLoader(validation_dataset, batch_size=BS, shuffle=True)


Vamos a ver una muestra

In [22]:
batch = next(iter(train_dataloader))
type(batch)

dict

Como vemos la muestra es un diccionario, vamos a ver sus claves

In [23]:
batch.keys()

dict_keys(['encoder_input', 'decoder_input', 'decoder_mask', 'label', 'src_text', 'tgt_text'])

Las claves son las salidas que habíamos definido en el dataset. Vamos a ver ahora cómo es cada una de las claves

In [24]:
batch['encoder_input'].shape, batch['decoder_input'].shape, batch['label'].shape, len(batch['src_text']), len(batch['tgt_text'])

(torch.Size([60, 311]), torch.Size([60, 311]), torch.Size([60, 311]), 60, 60)

Cada una de las claves tiene tantas muestras como hemos definido en el batch size (`BS`). Vamos ahora a ver una de las muestras

In [25]:
idx = randint(0, BS)

print(f"Encoder input shape: {batch['encoder_input'][idx].shape}")
print(f"Decoder input shape: {batch['decoder_input'][idx].shape}")
print(f"Label shape: {batch['label'][idx].shape}")
print(f"Source text: {batch['src_text'][idx]}")
print(f"Target text: {batch['tgt_text'][idx]}")

Encoder input shape: torch.Size([311])
Decoder input shape: torch.Size([311])
Label shape: torch.Size([311])
Source text: 'Who was it came in?' he asked the door-keeper.
Target text: — Chi è entrato? — chiese all’usciere.


## Modelo ✔

Volvemos a escribir todo el código del transformer y creamos un objeto de este

### Clases de bajo nivel

In [26]:
import torch
import torch.nn as nn
import torch.nn.init as init

class CustomLinear(nn.Module):
    def __init__(self, in_features, out_features):
        super(CustomLinear, self).__init__()
        self.linear = nn.Linear(in_features, out_features)
        init.kaiming_uniform_(self.linear.weight, nonlinearity='relu')
        if self.linear.bias is not None:
            init.zeros_(self.linear.bias)
    
    def forward(self, x):
        return self.linear(x)

class CustomEmbedding(nn.Module):
    def __init__(self, num_embeddings, embedding_dim):
        super(CustomEmbedding, self).__init__()
        self.embedding = nn.Embedding(num_embeddings, embedding_dim)
        init.xavier_uniform_(self.embedding.weight)
    
    def forward(self, x):
        return self.embedding(x)

class Embedding(nn.Module):
    def __init__(self, vocab_size, embedding_dim):
        super().__init__()
        self.vocab_size = vocab_size
        self.embedding_dim = embedding_dim

        self.embedding = CustomEmbedding(vocab_size, embedding_dim)

    def forward(self, x):
        return self.embedding(x)

class PositionalEncoding(nn.Module):
    def __init__(self, max_sequence_len, embedding_model_dim):
        super().__init__()
        self.embedding_dim = embedding_model_dim
        positional_encoding = torch.zeros(max_sequence_len, self.embedding_dim)
        for pos in range(max_sequence_len):
            for i in range(0, self.embedding_dim, 2):
                positional_encoding[pos, i]     = torch.sin(torch.tensor(pos / (10000 ** ((2 * i) / self.embedding_dim))))
                positional_encoding[pos, i + 1] = torch.cos(torch.tensor(pos / (10000 ** ((2 * (i+1)) / self.embedding_dim))))
        positional_encoding = positional_encoding.unsqueeze(0)
        self.register_buffer('positional_encoding', positional_encoding)

    def forward(self, x):
        x = x * torch.sqrt(torch.tensor(self.embedding_dim))
        sequence_len = x.size(1)
        x = x + self.positional_encoding[:,:sequence_len]
        return x

class ScaledDotProductAttention(nn.Module):
    def __init__(self, dim_embedding):
        super().__init__()
        self.dim_embedding = dim_embedding
    
    def forward(self, query, key, value, mask=None):
        key_trasposed = key.transpose(-1,-2)
        product = torch.matmul(query, key_trasposed)
        scale = product / torch.sqrt(torch.tensor(self.dim_embedding))
        if mask is not None:
            scale = scale.masked_fill(mask == 0, float('-inf'))
        attention_matrix = torch.softmax(scale, dim=-1)
        output = torch.matmul(attention_matrix, value)
        return output

class MultiHeadAttention(nn.Module):
    def __init__(self, heads, dim_embedding):
        super().__init__()
        
        self.dim_embedding = dim_embedding
        self.dim_proyection = dim_embedding // heads
        self.heads = heads
        self.proyection_Q = CustomLinear(dim_embedding, dim_embedding)
        self.proyection_K = CustomLinear(dim_embedding, dim_embedding)
        self.proyection_V = CustomLinear(dim_embedding, dim_embedding)
        self.attention = CustomLinear(dim_embedding, dim_embedding)
        self.scaled_dot_product_attention = ScaledDotProductAttention(self.dim_proyection)
    
    def forward(self, Q, K, V, mask=None):
        batch_size = Q.size(0)
        proyection_Q = self.proyection_Q(Q).view(batch_size, -1, self.heads, self.dim_proyection)
        proyection_K = self.proyection_K(K).view(batch_size, -1, self.heads, self.dim_proyection)
        proyection_V = self.proyection_V(V).view(batch_size, -1, self.heads, self.dim_proyection)
        proyection_Q = proyection_Q.transpose(1,2)
        proyection_K = proyection_K.transpose(1,2)
        proyection_V = proyection_V.transpose(1,2)
        scaled_dot_product_attention = self.scaled_dot_product_attention(proyection_Q, proyection_K, proyection_V, mask=mask)
        concat = scaled_dot_product_attention.transpose(1,2).contiguous().view(batch_size, -1, self.dim_embedding)
        output = self.attention(concat)
        return output

class AddAndNorm(nn.Module):
    def __init__(self, dim_embedding):
        super().__init__()
        self.normalization = nn.LayerNorm(dim_embedding)

    def forward(self, x, sublayer):
        return self.normalization(torch.add(x, sublayer))

class FeedForward(nn.Module):
    def __init__(self, dim_embedding, increment=4):
        super().__init__()
        self.feed_forward = nn.Sequential(
            CustomLinear(dim_embedding, dim_embedding*increment),
            nn.ReLU(),
            CustomLinear(dim_embedding*increment, dim_embedding)
        )
    
    def forward(self, x):
        x = self.feed_forward(x)
        return x

class Linear(nn.Module):
    def __init__(self, dim_embedding, vocab_size):
        super().__init__()
        self.linear = CustomLinear(dim_embedding, vocab_size)
        
    def forward(self, x):
        x = self.linear(x)
        return x

class Softmax(nn.Module):
    def __init__(self):
        super().__init__()
        self.softmax = nn.Softmax(dim=1)
        
    def forward(self, x):
        x = self.softmax(x)
        return x

class Dropout(torch.nn.Module):
    def __init__(self, p=0.1):
        super().__init__()
        self.p = p

    def forward(self, x):
        if self.training:
            return torch.nn.functional.dropout(x, p=self.p)
        else:
            return x


### Clases de medio nivel

In [27]:
class EncoderLayer(nn.Module):
    def __init__(self, heads, dim_embedding, prob_dropout=0.1):
        super().__init__()
        self.multi_head_attention = MultiHeadAttention(heads, dim_embedding)
        self.dropout_1 = Dropout(prob_dropout)
        self.add_and_norm_1 = AddAndNorm(dim_embedding)
        self.feed_forward = FeedForward(dim_embedding)
        self.dropout_2 = Dropout(prob_dropout)
        self.add_and_norm_2 = AddAndNorm(dim_embedding)
    
    def forward(self, x):
        multi_head_attention = self.multi_head_attention(x, x, x)
        dropout1 = self.dropout_1(multi_head_attention)
        add_and_norm_1 = self.add_and_norm_1(x, dropout1)
        feed_forward = self.feed_forward(add_and_norm_1)
        dropout2 = self.dropout_2(feed_forward)
        add_and_norm_2 = self.add_and_norm_2(add_and_norm_1, dropout2)
        return add_and_norm_2

class Encoder(nn.Module):
    def __init__(self, heads, dim_embedding, Nx, prob_dropout=0.1):
        super().__init__()
        self.encoder_layers = nn.ModuleList([EncoderLayer(heads, dim_embedding, prob_dropout) for _ in range(Nx)])
    
    def forward(self, x):
        for encoder_layer in self.encoder_layers:
            x = encoder_layer(x)
        return x

class TransformerEncoder(nn.Module):
    def __init__(self, vocab_size, dim_embedding, max_sequence_len, heads, Nx, prob_dropout=0.1):
        super().__init__()
        self.input_embedding = Embedding(vocab_size, dim_embedding)
        self.positional_encoding = PositionalEncoding(max_sequence_len, dim_embedding)
        self.encoder = Encoder(heads, dim_embedding, Nx, prob_dropout)
    
    def forward(self, x):
        input_embedding = self.input_embedding(x)
        positional_encoding = self.positional_encoding(input_embedding)
        encoder = self.encoder(positional_encoding)
        return encoder

class DecoderLayer(nn.Module):
    def __init__(self, heads, dim_embedding, prob_dropout=0.1):
        super().__init__()
        self.masked_multi_head_attention = MultiHeadAttention(heads, dim_embedding)
        self.dropout_1 = Dropout(prob_dropout)
        self.add_and_norm_1 = AddAndNorm(dim_embedding)
        self.encoder_decoder_multi_head_attention = MultiHeadAttention(heads, dim_embedding)
        self.dropout_2 = Dropout(prob_dropout)
        self.add_and_norm_2 = AddAndNorm(dim_embedding)
        self.feed_forward = FeedForward(dim_embedding)
        self.dropout_3 = Dropout(prob_dropout)
        self.add_and_norm_3 = AddAndNorm(dim_embedding)
    
    def forward(self, x, encoder_output, mask=None):
        Q = x
        K = x
        V = x
        masked_multi_head_attention = self.masked_multi_head_attention(Q, K, V, mask=mask)
        dropout1 = self.dropout_1(masked_multi_head_attention)
        add_and_norm_1 = self.add_and_norm_1(dropout1, x)

        Q = add_and_norm_1
        K = encoder_output
        V = encoder_output
        encoder_decoder_multi_head_attention = self.encoder_decoder_multi_head_attention(Q, K, V)
        dropout2 = self.dropout_2(encoder_decoder_multi_head_attention)
        add_and_norm_2 = self.add_and_norm_2(dropout2, add_and_norm_1)

        feed_forward = self.feed_forward(add_and_norm_2)
        dropout3 = self.dropout_3(feed_forward)
        add_and_norm_3 = self.add_and_norm_3(dropout3, add_and_norm_2)

        return add_and_norm_3

class Decoder(nn.Module):
    def __init__(self, heads, dim_embedding, Nx, prob_dropout=0.1):
        super().__init__()
        self.layers = nn.ModuleList([DecoderLayer(heads, dim_embedding, prob_dropout) for _ in range(Nx)])
    
    def forward(self, x, encoder_output, mask=None):
        for decoder_layer in self.layers:
            x = decoder_layer(x, encoder_output, mask)
        return x

class TransformerDecoder(nn.Module):
    def __init__(self, heads, dim_embedding, Nx, vocab_size, max_sequence_len, prob_dropout=0.1):
        super().__init__()
        self.embedding = Embedding(vocab_size, dim_embedding)
        self.positional_encoding = PositionalEncoding(max_sequence_len, dim_embedding)
        self.decoder = Decoder(heads, dim_embedding, Nx, prob_dropout)
        self.linear = Linear(dim_embedding, vocab_size)
        # self.softmax = Softmax()
    
    def forward(self, x, encoder_output, mask=None):
        x = self.embedding(x)
        x = self.positional_encoding(x)
        x = self.decoder(x, encoder_output, mask)
        x = self.linear(x)
        # x = self.softmax(x)
        return x

class Linear_and_softmax(nn.Module):
    def __init__(self, dim_embedding, vocab_size):
        super().__init__()
        self.linear = CustomLinear(dim_embedding, vocab_size)
        # self.softmax = Softmax()
    
    def forward(self, x):
        x = self.linear(x)
        # x = self.softmax(x)
        return x


### Clase de alto nivel

In [28]:
class Transformer(nn.Module):
    def __init__(self, src_vocab_size, tgt_vocab_size, src_max_seq_len, tgt_max_seq_len, dim_embedding, Nx, heads, prob_dropout=0.1):
        super().__init__()
        self.transformerEncoder = TransformerEncoder(src_vocab_size, dim_embedding, src_max_seq_len, heads, Nx, prob_dropout)
        self.transformerDecoder = TransformerDecoder(heads, dim_embedding, Nx, tgt_vocab_size, tgt_max_seq_len, prob_dropout)
        self.encoder = Encoder(heads, dim_embedding, Nx, prob_dropout)
        self.decoder = Decoder(heads, dim_embedding, Nx, prob_dropout)
        self.sourceEmbedding = Embedding(src_vocab_size, dim_embedding)
        self.targetEmbedding = Embedding(tgt_vocab_size, dim_embedding)
        self.sourcePositional_encoding = PositionalEncoding(src_max_seq_len, dim_embedding)
        self.targetPositional_encoding = PositionalEncoding(tgt_max_seq_len, dim_embedding)
        self.linear = Linear_and_softmax(dim_embedding, tgt_vocab_size)
    
    def encode(self, source):
        embedding = self.sourceEmbedding(source)
        positional_encoding = self.sourcePositional_encoding(embedding)
        encoder_output = self.encoder(positional_encoding)
        return encoder_output
    
    def decode(self, encoder_output, target, target_mask):
        embedding = self.targetEmbedding(target)
        positional_encoding = self.targetPositional_encoding(embedding)
        decoder_output = self.decoder(positional_encoding, encoder_output, target_mask)
        return decoder_output
    
    def projection(self, decoder_output):
        linear_output = self.linear(decoder_output)
        # softmax_output = self.softmax(linear_output)
        return linear_output
    
    def forward(self, source, target, mask=None):
        encoder_output = self.transformerEncoder(source)
        decoder_output = self.transformerDecoder(target, encoder_output, mask)
        return decoder_output


### Transformer

In [29]:
source_vocab_size = tokenizer_source.get_vocab_size()
target_vocab_size = tokenizer_target.get_vocab_size()
src_max_seq_len = max_sequence_len
tgt_max_seq_len = max_sequence_len
dim_embedding = DIM_EMBEDDING
Nx = NUM_LAYERS
heads = NUM_HEADS
prob_dropout = DROPOUT
print(f"source vocab size: {source_vocab_size}, target vocab size: {target_vocab_size}, source max sequence len: {src_max_seq_len}, target max sequence len: {tgt_max_seq_len}, dim_embedding: {dim_embedding}, heads: {heads}, Nx: {Nx}, prob_dropout: {prob_dropout}")

model = Transformer(
    src_vocab_size = source_vocab_size,
    tgt_vocab_size = target_vocab_size,
    src_max_seq_len = src_max_seq_len,
    tgt_max_seq_len = tgt_max_seq_len,
    dim_embedding = dim_embedding,
    Nx = Nx,
    heads = heads,
    prob_dropout = prob_dropout,
)

model.to(device)
print("")

source vocab size: 30000, target vocab size: 30000, source max sequence len: 311, target max sequence len: 311, dim_embedding: 512, heads: 8, Nx: 6, prob_dropout: 0.1





In [30]:
# Data parallel
# if torch.cuda.device_count() > 1 and GPUS > 1:
#     number_gpus = torch.cuda.device_count()
#     print(f"Let's use {number_gpus} GPUs!")
#     transformer = nn.DataParallel(transformer)

#     # def create_mask(sequence_len):
#     #     mask = torch.tril(torch.ones((2*sequence_len, sequence_len)))
#     #     return mask
#     def create_mask(sequence_len):
#         mask = torch.triu(torch.ones(1, 2*sequence_len, sequence_len), diagonal = 1).type(torch.int)
#         return mask == 0
# else:
#     number_gpus = 1
#     print(f"Let's use {number_gpus} GPUs! GPU NUMBER: {GPU_NUMBER}")
    
#     # def create_mask(sequence_len):
#     #     mask = torch.tril(torch.ones((sequence_len, sequence_len)))
#     #     return mask
#     def create_mask(sequence_len):
#         mask = torch.triu(torch.ones(1, sequence_len, sequence_len), diagonal = 1).type(torch.int)
#         return mask == 0


In [31]:
mask = create_mask(max_sequence_len)
mask.shape

torch.Size([1, 311, 311])

## Entrenamiento

### Optimizador ✔

In [32]:
optimizer = torch.optim.Adam(model.parameters(), lr=LR, betas=(0.9, 0.98), eps=1e-9)

### Función de pérdida ✔

Creamos la función de pérdida con label smoothing

In [33]:
loss_fn = nn.CrossEntropyLoss(
    ignore_index = tokenizer_source.token_to_id(PADDING_TOKEN), 
    label_smoothing = LABEL_SMOOTHING).to(device)


### LR ✔

In [34]:
class Step():
    def __init__(self):
        self.step = 0
    
    def set_step(self, st):
        self.step = st
    
    def get_step(self):
        return int(self.step)

class LearningRate():
    def __init__(self):
        self.lr = 0
    
    def set_lr(self, l_r_):
        self.lr = l_r_
    
    def get_lr(self):
        return self.lr

actual_step = Step()
actual_lr = LearningRate()

In [35]:
import numpy as np

def calculate_lr(step_num, dim_embeding_model=512, warmup_steps=4000):
    step_num += 1e-7 # Avoid division by zero
    step_num += STEP0
    actual_step.set_step(step_num)
    step_num_exp = -0.4
    warmup_steps_exp = -2.6
    dim_embeding_model_exp = -0.1
    lr = np.power(dim_embeding_model, dim_embeding_model_exp) * np.minimum(np.power(step_num, step_num_exp), step_num * np.power(warmup_steps, warmup_steps_exp))
    actual_lr.set_lr(lr)
    return lr

lr_lambda = lambda step: calculate_lr(step, dim_embeding_model=dim_embedding)
if LR_SCHEDULER:
    lr_scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda)

### Validation loop ✔

In [36]:
def greedy_decode(model, source, tokenizer_tgt, max_len, device, bs):
    # Retrieving the indices from the start and end of sequences of the target tokens
    sos_idx = tokenizer_tgt.token_to_id('[SOS]')    # Start of Sentence token index (2)
    # eos_idx = tokenizer_tgt.token_to_id('[EOS]')    # End of Sentence token index (3)

    # Computing the output of the encoder for the source sequence
    encoder_output = model.encode(source)
    
    # Initializing the decoder input with the Start of Sentence token
    decoder_input = torch.empty(bs,1).fill_(sos_idx).type_as(source).to(device)
    
    # Looping until the 'max_len', maximum length, is reached
    while True:
        if decoder_input.size(1) == max_len:
            break
            
        # Building a mask for the decoder input
        decoder_mask = create_mask(decoder_input.size(1)).to(device)
        
        # Calculating the output of the decoder
        out = model.decode(encoder_output, decoder_input, decoder_mask)
        
        # Applying the projection layer to get the probabilities for the next token
        prob = model.projection(out[:, -1])

        # Selecting token with the highest probability
        _, next_word = torch.max(prob, dim=1)
        # decoder_input = torch.cat([decoder_input, torch.empty(1,1). type_as(source).fill_(next_word.item()).to(device)], dim=1)
        decoder_input = torch.cat([decoder_input, next_word.unsqueeze(1)], dim=1)
    
    if len(decoder_input.shape) == 1:
        decoder_input = decoder_input.unsqueeze(0)
    elif len(decoder_input.shape) == 3:
        decoder_input = decoder_input.squeeze(0)

    return decoder_input # Sequence of tokens generated by the decoder


In [37]:
from tqdm import tqdm

import nltk
from nltk.translate.bleu_score import sentence_bleu
from nltk.translate.meteor_score import meteor_score

def validation_loop(model, validation_ds, tokenizer_tgt, max_len, device):
    model.eval() # Setting model to evaluation mode

    # Calculating the number of batches in the validation dataset
    dataset_size = len(validation_ds.dataset)  # Tamaño total del conjunto de datos
    batch_size = validation_ds.batch_size      # Tamaño del batch
    drop_last = validation_ds.drop_last        # Configuración de drop_last
    num_batches = len(validation_ds)           # Número total de batches

    # Calculating the total number of samples in the validation dataset
    total_samples = batch_size * (num_batches - 1) + min(batch_size, dataset_size % batch_size)

    # If drop_last is False and the dataset size is not divisible by the batch size, we need to add one more batch
    if drop_last and dataset_size % batch_size != 0:
        total_samples -= dataset_size % batch_size

    # Initializing progress bar
    progress_bar = tqdm(range(total_samples), desc = 'Processing validation examples') # Initializing progress bar

    # Initializing lists to store scores
    bleu_scores = []
    meteor_scores = []
    
    # Creating evaluation loop
    with torch.no_grad(): # Ensuring that no gradients are computed during this process
        for batch in validation_ds:
            # Loading input data and masks onto the GPU
            encoder_input = batch['encoder_input'].to(device)
            
            # Applying the 'greedy_decode' function to get the model's output for the source text of the input batch
            num_samples = len(batch['src_text'])
            model_out_bs = greedy_decode(model, encoder_input, tokenizer_tgt, max_len, device, num_samples)

            # Get metrics for every example in the batch
            for i in range(num_samples):
                source_text = batch['src_text'][i]
                target_text = batch['tgt_text'][i]
                model_out_i = model_out_bs[i]
                model_out_text = tokenizer_tgt.decode(model_out_i.detach().cpu().numpy())

                # Calculating metrics
                references = [target_text.split()]
                hypothesis = model_out_text.split()
                bleu_score = sentence_bleu(references, hypothesis)
                meteor_score_value = meteor_score(references, hypothesis)
            
                # Appending scores to lists
                bleu_scores.append(bleu_score)
                meteor_scores.append(meteor_score_value)

                # Calculating mean scores            
                mean_bleu_score = sum(bleu_scores)/len(bleu_scores) # Calculating mean BLEU score
                mean_meteor_score = sum(meteor_scores)/len(meteor_scores) # Calculating mean METEOR score

                # Updating progress bar and printing bleu and meteor scores
                progress_bar.update(1)
                progress_bar.set_postfix({'BLEU': f'{mean_bleu_score:.9f}', 'METEOR': f'{mean_meteor_score:.9f}'})

    # Printing results
    console_width = 80 # Fixed witdh for printed messages
    print('-'*console_width)
    print(f'SOURCE: {source_text}')
    print(f'TARGET: {target_text}')
    print(f'PREDICTED: {model_out_text}')
    print('-'*console_width)

    return mean_bleu_score, mean_meteor_score


### Train loop ✔

In [38]:
def train_loop(model, train_dataloader, device, tokenizer_target, epoch, loss_fn, optimizer, lr_scheduler=None):
    # Initializing an iterator over the training dataloader
    # We also use tqdm to display a progress bar
    print()
    batch_iterator = tqdm(train_dataloader, desc = f'Processing epoch {epoch:02d}')
    
    # For each batch...
    for batch in batch_iterator:
        model.train() # Train the model
            
        # Loading input data and masks onto the GPU
        encoder_input = batch['encoder_input'].to(device)
        decoder_input = batch['decoder_input'].to(device)
        decoder_mask = batch['decoder_mask'].to(device)
        
        # Running tensors through the Transformer
        encoder_output = model.encode(encoder_input)
        decoder_output = model.decode(encoder_output, decoder_input, decoder_mask)
        proj_output = model.projection(decoder_output)
        
        # Loading the target labels onto the GPU
        label = batch['label'].to(device)
        
        # Computing loss between model's output and true labels
        loss = loss_fn(proj_output.view(-1, tokenizer_target.get_vocab_size()), label.view(-1))
        
        # Updating progress bar, print loss and lr
        batch_iterator.set_postfix({'loss': f'{loss.item():.6f}', 'lr': f'{actual_lr.get_lr():.9f}'})
        
        # Performing backpropagation
        loss.backward()
        
        # Updating parameters based on the gradients
        optimizer.step()
        
        # Clearing the gradients to prepare for the next batch
        optimizer.zero_grad()

        # Update step and LR
        if LR_SCHEDULER:
            lr_scheduler.step()

### Train

In [39]:
from tqdm import tqdm

for epoch in range(0, EPOCHS):
    if LR_SCHEDULER:
        train_loop(model, train_dataloader, device, tokenizer_target, epoch, loss_fn, optimizer, lr_scheduler)    
    else:
        train_loop(model, train_dataloader, device, tokenizer_target, epoch, loss_fn, optimizer)
    # # Initializing an iterator over the training dataloader
    # # We also use tqdm to display a progress bar
    # print()
    # batch_iterator = tqdm(train_dataloader, desc = f'Processing epoch {epoch:02d}')
    
    # # For each batch...
    # for batch in batch_iterator:
    #     model.train() # Train the model
        
    #     # Loading input data and masks onto the GPU
    #     encoder_input = batch['encoder_input'].to(device)
    #     decoder_input = batch['decoder_input'].to(device)
    #     decoder_mask = batch['decoder_mask'].to(device)
        
    #     # Running tensors through the Transformer
    #     encoder_output = model.encode(encoder_input)
    #     decoder_output = model.decode(encoder_output, decoder_input, decoder_mask)
    #     proj_output = model.projection(decoder_output)
        
    #     # Loading the target labels onto the GPU
    #     label = batch['label'].to(device)
        
    #     # Computing loss between model's output and true labels
    #     loss = loss_fn(proj_output.view(-1, tokenizer_target.get_vocab_size()), label.view(-1))
        
    #     # Updating progress bar, print loss and lr
    #     batch_iterator.set_postfix({'loss': f'{loss.item():.6f}', 'lr': f'{actual_lr.get_lr():.9f}'})
        
    #     # Update LR
        
    #     # Performing backpropagation
    #     loss.backward()
        
    #     # Updating parameters based on the gradients
    #     optimizer.step()
        
    #     # Clearing the gradients to prepare for the next batch
    #     optimizer.zero_grad()

    #     # Update step and LR
    #     if LR_SCHEDULER:
    #         lr_scheduler.step()
        
    # We run the 'run_validation' function at the end of each epoch
    # to evaluate model performance
    validation_loop(model, validation_dataloader, tokenizer_target, max_sequence_len, device)





Processing epoch 00:   0%|          | 0/534 [00:00<?, ?it/s]

Processing epoch 00: 100%|██████████| 534/534 [05:20<00:00,  1.67it/s, loss=7.454990, lr=0.000000000]
The hypothesis contains 0 counts of 2-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
Processing validation examples: 100%|██████████| 324/324 [01:27<00:00,  3.72it/s, BLEU=0.000000000, METEOR=0.005262346]


--------------------------------------------------------------------------------
SOURCE: The host was a respectable-looking, middle-aged man.
TARGET: L'oste era un uomo attempato, di aspetto rispettabile.
PREDICTED: ,
--------------------------------------------------------------------------------



Processing epoch 01: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=7.126633, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.76it/s, BLEU=0.000000000, METEOR=0.018568804] 


--------------------------------------------------------------------------------
SOURCE: His father and the educationalist were both displeased with Serezha, and he really learnt badly.
TARGET: Il padre e l’istitutore erano scontenti di Serëza, e realmente egli studiava molto male.
PREDICTED: , , , , , , , , , , , , , , ,
--------------------------------------------------------------------------------



Processing epoch 02: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=7.055809, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.75it/s, BLEU=0.000000000, METEOR=0.022454631] 


--------------------------------------------------------------------------------
SOURCE: "Yes," said he, "there is my glory and joy.
TARGET: — Sì, — riprese, — è la mia gloria e la mia gioia.
PREDICTED: — — , , , , , , , , , , — — —
--------------------------------------------------------------------------------



Processing epoch 03: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.883481, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000000000, METEOR=0.022654181] 


--------------------------------------------------------------------------------
SOURCE: I'm off to the "infernal regions," added he, and walked away.
TARGET: Vado nell’infernale — disse il colonnello e si allontanò dalla tavola.
PREDICTED: — — , , , , , , — — — — — — — — — — — . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 04: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.763955, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000000000, METEOR=0.025692245] 


--------------------------------------------------------------------------------
SOURCE: 'And you are not afraid?'
TARGET: — E non hai paura?
PREDICTED: — E ? — ? ?
--------------------------------------------------------------------------------



Processing epoch 05: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=6.808292, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000000000, METEOR=0.022510726] 


--------------------------------------------------------------------------------
SOURCE: Answer: 'A chemist makes solutions which do not make anyone happy, but I have made a dissolution and made three people happy!'
TARGET: Il monarca fa il cambio della guardia e di questo nessuno si avvantaggia ed io, invece, ho portato a termine un divorzio e tre persone ne trarranno vantaggio”.
PREDICTED: Non , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , . , , , , , , , , , , , , , , , , , , , . , . , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 06: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.765081, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.022986806] 


--------------------------------------------------------------------------------
SOURCE: When?
TARGET: Quando?
PREDICTED: — E ? ? ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 07: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.569856, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:27<00:00,  3.72it/s, BLEU=0.000000000, METEOR=0.021850962] 


--------------------------------------------------------------------------------
SOURCE: Those who so bind themselves, and are not rapacious, ought to be honoured and loved; those who do not bind themselves may be dealt with in two ways; they may fail to do this through pusillanimity and a natural want of courage, in which case you ought to make use of them, especially of those who are of good counsel; and thus, whilst in prosperity you honour them, in adversity you do not have to fear them.
TARGET: Quelli che si obbligano, e non sieno rapaci, si debbono onorare et amare; quelli che non si obbligano, si hanno ad esaminare in dua modi: o fanno questo per pusillanimità e defetto naturale d’animo: allora tu ti debbi servire di quelli massime che sono di buono consiglio, perché nelle prosperità te ne onori, e nelle avversità non hai da temerne.
PREDICTED: Ma , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Processing epoch 08: 100%|██████████| 534/534 [05:20<00:00,  1.67it/s, loss=6.663502, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:27<00:00,  3.72it/s, BLEU=0.000000000, METEOR=0.018920476] 


--------------------------------------------------------------------------------
SOURCE: Kitty felt that Anna looked at her with animosity.
TARGET: Kitty sentiva che Anna la guardava con ostilità.
PREDICTED: Vronskij ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ a a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 09: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.473949, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.029764121] 


--------------------------------------------------------------------------------
SOURCE: Those who so bind themselves, and are not rapacious, ought to be honoured and loved; those who do not bind themselves may be dealt with in two ways; they may fail to do this through pusillanimity and a natural want of courage, in which case you ought to make use of them, especially of those who are of good counsel; and thus, whilst in prosperity you honour them, in adversity you do not have to fear them.
TARGET: Quelli che si obbligano, e non sieno rapaci, si debbono onorare et amare; quelli che non si obbligano, si hanno ad esaminare in dua modi: o fanno questo per pusillanimità e defetto naturale d’animo: allora tu ti debbi servire di quelli massime che sono di buono consiglio, perché nelle prosperità te ne onori, e nelle avversità non hai da temerne.
PREDICTED: E , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , 

Processing epoch 10: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.284330, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:27<00:00,  3.72it/s, BLEU=0.000000000, METEOR=0.026547362] 


--------------------------------------------------------------------------------
SOURCE: It was the first time that the possibility of his wife's falling in love with anybody had occurred to him, and he was horrified.
TARGET: Per la prima volta gli si affacciava alla mente l’ipotesi che sua moglie potesse amare un altro, ed egli inorridiva di fronte a questo.
PREDICTED: La ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ era , era , ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ era , ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ era , era , era , era , ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ ’ era , ’ ’ ’ ’ ’ ’ ’ era , ’ ’ ’ era 

Processing epoch 11: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.706194, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:27<00:00,  3.72it/s, BLEU=0.000000000, METEOR=0.030342662] 


--------------------------------------------------------------------------------
SOURCE: 'I didn't know it was your table,' said Alice; 'it's laid for a great many more than three.'
TARGET: — Non sapevo che la tavola ti appartenesse, — rispose Alice; — è apparecchiata per più di tre.
PREDICTED: — Non — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non non no

Processing epoch 12: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.580496, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.027670190] 


--------------------------------------------------------------------------------
SOURCE: 'This is my true, almost my best friend,' he said to Vronsky. 'You too are even more near and dear to me; and I want you to be friends, and I know that you will be friendly and intimate because you are both good fellows.'
TARGET: — È il mio sincero, forse il mio migliore amico — disse a Vronskij. — Tu per me sei ancora più prossimo e caro. E io voglio e so che voi dovete essere amici, molto amici, perché siete tutti e due brave persone.
PREDICTED: — Non — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho ho

Processing epoch 13: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.286330, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:27<00:00,  3.72it/s, BLEU=0.000000000, METEOR=0.032090710] 


--------------------------------------------------------------------------------
SOURCE: 'Forgive me if my words displease you,' he said humbly.
TARGET: — Perdonatemi se vi spiace quello che ho detto — disse umilmente.
PREDICTED: — Non ho — disse — disse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 14: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.163836, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.031373755] 


--------------------------------------------------------------------------------
SOURCE: It's not philanthropy, it's kind-heartedness.
TARGET: Non di filantropico, ma di cuore.
PREDICTED: Non è è , non ’ ’ ’ ’ ’ è . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 15: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.288527, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.039227920] 


--------------------------------------------------------------------------------
SOURCE: "You are welcome to all my confidence that is worth having, Jane; but for God's sake, don't desire a useless burden!
TARGET: — Siete la benvenuta, Jane, se volete essere a parte di quelle confidenze che sono degne di voi; ma per l'amor di Dio, non cercate di caricarvi di un fardello inutile!
PREDICTED: — Sì , non , non , non , non , non , non , non . non . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 16: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.386666, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.041087591] 


--------------------------------------------------------------------------------
SOURCE: Miss Ingram, as before, was the only lady equestrian; and, as before, Mr. Rochester galloped at her side; the two rode a little apart from the rest.
TARGET: La signorina Ingram era la sola donna a cavallo e, come il giorno prima, il signor Rochester le galoppava a fianco. Essi erano separati dagli altri.
PREDICTED: Il signor Rochester il signor Rochester il signor Rochester , il signor Rochester , il signor Rochester , il signor Rochester , il signor Rochester , il signor il signor il signor il signor Rochester . il signor Rochester . il signor Rochester . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 17: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.204048, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.041433568] 


--------------------------------------------------------------------------------
SOURCE: Source: Project Gutenberg
TARGET: Source: www.liberliber.it/Audiobook available here
PREDICTED: 
--------------------------------------------------------------------------------



Processing epoch 18: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.951588, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.044826017] 


--------------------------------------------------------------------------------
SOURCE: Is it too late?
TARGET: È troppo tardi?
PREDICTED: È è ? ? ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 19: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.240094, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.046994527] 


--------------------------------------------------------------------------------
SOURCE: And welcome little fishes in
TARGET: — L'ho intesa, l'ho intesa! —
PREDICTED: E , .
--------------------------------------------------------------------------------



Processing epoch 20: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.922143, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.051898644] 


--------------------------------------------------------------------------------
SOURCE: Why could I never please?
TARGET: Perché non piacevo a nessuno?
PREDICTED: Perché mai mai mai mai ? ? ? ? ? ? ? ? ? ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 21: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.125468, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.054212779] 


--------------------------------------------------------------------------------
SOURCE: I haven't thought about it.'
TARGET: Non ci pensavo.
PREDICTED: Io non non posso posso . non posso . non posso non non non non . . non non non non non . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 22: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.085185, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.058885932] 


--------------------------------------------------------------------------------
SOURCE: They filled up the foreground entirely.
TARGET: Essi occupavano completamente il primo piano.
PREDICTED: Il il . . . . .
--------------------------------------------------------------------------------



Processing epoch 23: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.921594, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.060103631] 


--------------------------------------------------------------------------------
SOURCE: His father and the educationalist were both displeased with Serezha, and he really learnt badly.
TARGET: Il padre e l’istitutore erano scontenti di Serëza, e realmente egli studiava molto male.
PREDICTED: La marito e non non era non erano l ’ marito e che non non non non l ’ marito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 24: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.754034, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.063966650] 


--------------------------------------------------------------------------------
SOURCE: Karenin was, however, so much upset that he did not at once understand the reasonableness of adultery by mutual consent and his perplexity was expressed in his looks; but the lawyer immediately helped him.
TARGET: Aleksej Aleksandrovic era così sconvolto che non capì subito la ragionevolezza dell’adulterio ammesso per reciproco accordo e si leggeva la perplessità nel suo sguardo; ma l’avvocato gli venne subito in aiuto.
PREDICTED: — Aleksej Aleksandrovic , Aleksej Aleksandrovic , Aleksej Aleksandrovic , ma Aleksej Aleksandrovic , ma era era era era era era era era la suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo , ma non era . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aleksej Aleksandrovic . . Aleksej Aleksandrovic . . . . . . . . Aleksej Aleksandrovic . . Aleksej Aleksandrovic . Aleksej Aleksandrovic . . . . . . . . . 

Processing epoch 25: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.951059, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.059367902] 


--------------------------------------------------------------------------------
SOURCE: They were doing no one any harm, and everybody was pleased.
TARGET: Non davano noia a nessuno e tutti si trovavano bene.
PREDICTED: La , e ci ci ci ci ci ci ci ci ci erano . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 26: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=6.038142, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.061023352] 


--------------------------------------------------------------------------------
SOURCE: 'Yes, but now it's decided,' said Anna, looking straight into Vronsky's eyes with an expression that told him he must not think of the possibility of a reconciliation.
TARGET: — Ma ormai decisamente — disse Anna, guardando diritto negli occhi Vronskij con uno sguardo tale che gli diceva di non pensare neppure alla possibilità di una riconciliazione.
PREDICTED: — Sì , non non non lo un occhi — disse Anna , Anna , Anna , Anna , Anna , Anna , Anna , Anna , Anna , Anna , Anna , Anna , Anna di lui di lui . gli lei . gli lei . , non non non non non non non un viso , non un viso , non un viso , gli lei , non un viso , non un viso , gli lei . , non non gli lei . , gli un viso . , non gli lei . , non gli lei . , non gli lei . , che gli , che gli , che , che gli un viso . , che gli gli un viso , gli un viso , gli un viso , non gli un suo gli gli gli gli un occhi . , che gli un suo occhi . , gli un viso . . ,

Processing epoch 27: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.746275, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.069040250] 


--------------------------------------------------------------------------------
SOURCE: A splendid Midsummer shone over England: skies so pure, suns so radiant as were then seen in long succession, seldom favour even singly, our wave- girt land. It was as if a band of Italian days had come from the South, like a flock of glorious passenger birds, and lighted to rest them on the cliffs of Albion.
TARGET: I campi intorno a Thornfield erano verdi e falciati, bianchi i sentieri per la polvere, gli alberi erano in tutto il loro splendore, le siepi e i boschi folti di fogliame e scuri, contrastavano con l'erba fresca e chiara dei prati.
PREDICTED: La , , , , , , , , , , , , , , , , , , , , , , , , , , , , , di . di . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------

Processing epoch 28: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=6.038870, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.068049155] 


--------------------------------------------------------------------------------
SOURCE: I went to my window, opened it, and looked out. There were the two wings of the building; there was the garden; there were the skirts of Lowood; there was the hilly horizon.
TARGET: Andai alla finestra e l'aprii guardando dinanzi a me; qui erano le due ale dell'edificio, là il giardino, poi i muri di Lowood e finalmente l'orizzonte delle montagne.
PREDICTED: La mattina era la notte , e la notte , e la la notte , e la notte , la notte , e la la notte , la notte , e la notte , la notte , e la . la la . la . la . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . la ' . la ' . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 29: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.940345, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.066515005] 


--------------------------------------------------------------------------------
SOURCE: Long—long—long—many minutes, many hours, many days, have I heard it—yet I dared not—oh, pity me, miserable wretch that I am!—I dared not—I dared not speak!
TARGET: Io, sì, che sento, ed ho sentito da molto tempo... molto, molto tempo, molti minuti, molte ore, molti giorni, ho sentito, ma non osavo... oh! pietà per me, miserabile disgraziato che sono!
PREDICTED: Non mi , non mi , non mi , non mi , non , non , non , non , non , non , non , non . , non ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !
--------------------------------------------------------------------------------



Processing epoch 30: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.484339, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.070652448] 


--------------------------------------------------------------------------------
SOURCE: And it must be decided...'
TARGET: E bisogna dunque decidere...
PREDICTED: E è ... ...
--------------------------------------------------------------------------------



Processing epoch 31: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.817605, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000000000, METEOR=0.076746501] 


--------------------------------------------------------------------------------
SOURCE: "I do not speak to the feeble, or think of them: I address only such as are worthy of the work, and competent to accomplish it."
TARGET: — Non parlo dei deboli, non ci penso neppure; parlo di quelli che sono degni del compito e capaci di compierlo.
PREDICTED: — Non posso una di , — e non non non non non non non non non non di . di . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 32: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.737625, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.077303728] 


--------------------------------------------------------------------------------
SOURCE: 'C'est devenu tellement commun, les écoles,' [Schools have become so common.] answered Vronsky. 'Of course that's not the reason, but I...
TARGET: — C’est devenu tellement commun, les écoles — disse Vronskij. — Voi capite, non è certo per questo, ma così, mi ci sono appassionato.
PREDICTED: — Il — disse il . — Ma non , non . non non sono . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 33: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.543979, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.073924862] 


--------------------------------------------------------------------------------
SOURCE: But do cats eat bats, I wonder?' And here Alice began to get rather sleepy, and went on saying to herself, in a dreamy sort of way, 'Do cats eat bats?
TARGET: Ma i gatti, poi, mangiano i pipistrelli? — E Alice cominciò a sonnecchiare, e fra sonno e veglia continuò a dire fra i denti: — I gatti, poi, mangiano i pipistrelli?
PREDICTED: Ma a a , — disse Alice , Alice Alice , e Alice Alice a a a a a a . ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 34: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.534770, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000759241, METEOR=0.074746639] 


--------------------------------------------------------------------------------
SOURCE: "Down, Pilot!" I again said.
TARGET: — Giù, Pilato! — ripetei.
PREDICTED: — , — disse il signorina . , — . ! ! ! . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 35: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.400885, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000000000, METEOR=0.075651547] 


--------------------------------------------------------------------------------
SOURCE: Some men understand only the one, some only the other.
TARGET: Alcuni comprendono l’uno, altri l’altro.
PREDICTED: Per l ’ , l ’ l ’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 36: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.612082, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000548715, METEOR=0.074436906] 


--------------------------------------------------------------------------------
SOURCE: VRONSKY AND KITTY WALTZED several times round the room and then Kitty went to her mother, but hardly had she exchanged a few words with the Countess Nordston before Vronsky returned to fetch her for the first quadrille.
TARGET: Vronskij fece qualche giro di valzer con Kitty. Dopo il valzer Kitty si avvicinò alla madre ed ebbe appena il tempo di scambiare qualche parola con la Nordston, che Vronskij era già venuta a riprenderla per la prima quadriglia.
PREDICTED: Vronskij Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij , Vronskij a Vronskij a Vronskij . Vronskij da Vronskij . Vronskij . Vronskij . da Vronskij . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

Processing epoch 37: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.517783, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000472538, METEOR=0.073652363] 


--------------------------------------------------------------------------------
SOURCE: Oh, how delightful it was to be safe in the boat, after our trials and fears!
TARGET: Che delizia ci sembrò trovarci al sicuro nella barca, dopo tutte le nostre fatiche e i nostri timori!
PREDICTED: Oh , la mia vita , la mia vita , la mia vita , la vita , la vita , e la vita , la vita , la vita . , se era la vita , se la vita , se la vita , la vita , la vita , la vita ! , se la vita ! , se la vita ! , se la vita ! , se la vita ! , se la vita ! , se la vita ! , la vita ! , la vita ! , la vita ! , la vita ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !
--------------------------------------------------------------------------------



Processing epoch 38: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=5.579816, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000391164, METEOR=0.079746483] 


--------------------------------------------------------------------------------
SOURCE: You had better change your frock now; I will go with you and fasten it.
TARGET: Fareste bene a vestirvi ora. Vi aiuterò io.
PREDICTED: Ho da voi e io io io io io io io io io io io io da . io io io io io io io io voi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 39: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.707530, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000654340, METEOR=0.080604120] 


--------------------------------------------------------------------------------
SOURCE: Both were men respected for their characters and abilities.
TARGET: Erano persone stimabili per carattere e per ingegno.
PREDICTED: Le erano e erano . i loro . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 40: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=5.609801, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000628045, METEOR=0.082064763] 


--------------------------------------------------------------------------------
SOURCE: Anna now acknowledged to herself that he was weary of her and would regret giving up his freedom to return to her; yet in spite of this she was glad that he would come.
TARGET: Adesso Anna riconosceva già ch’egli sentiva il peso di lei, che lasciava con rammarico la propria libertà per tornare da lei, e, malgrado questo, era contenta che egli sarebbe tornato.
PREDICTED: Anna Anna , Anna , Anna , Anna , Anna , Anna , Anna , Anna , per più più più più più più più più più più . più . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 41: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.453038, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000240156, METEOR=0.078863257] 


--------------------------------------------------------------------------------
SOURCE: Some men understand only the one, some only the other.
TARGET: Alcuni comprendono l’uno, altri l’altro.
PREDICTED: Per l ’ altro , l ’ uno un ’ , ma non si . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 42: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.309184, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000821535, METEOR=0.085583597] 


--------------------------------------------------------------------------------
SOURCE: "He says she'll not be here long."
TARGET: — Che Elena non rimarrà qui per molto tempo.
PREDICTED: — Non posso . . . .
--------------------------------------------------------------------------------



Processing epoch 43: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.384903, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000715000, METEOR=0.080843484] 


--------------------------------------------------------------------------------
SOURCE: Alas! it was too late to wish that!
TARGET: Oimè! troppo tardi!
PREDICTED: Oh ! ! ! ! è così così così ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !
--------------------------------------------------------------------------------



Processing epoch 44: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=5.430720, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000989620, METEOR=0.084993299] 


--------------------------------------------------------------------------------
SOURCE: They had to submit, for although all the doctors studied in the same schools and from the same books and knew the same sciences, and though some said that this celebrated man was a bad doctor, at the Princess Shcherbatskaya's and in her set it was for some reason assumed that he alone had a quite special knowledge and he alone could save Kitty.
TARGET: Era necessario piegarvisi, perché, sebbene anche gli altri medici avessero frequentato la stessa scuola e studiato sugli stessi libri e tutti fossero in possesso di una stessa scienza, e pur avendo costui presso alcuni fama di medico inetto, tuttavia nella casa della principessa e nella sua cerchia, chi sa perché, si riteneva che solo questo medico famoso sapesse qualcosa di speciale e solo lui potesse salvare Kitty.
PREDICTED: il tempo , e il tempo , il tempo , e , il tempo , il tempo , gli erano il tempo , e il tempo il tempo , gli erano la cosa gl

Processing epoch 45: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.307698, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000804093, METEOR=0.082072234] 


--------------------------------------------------------------------------------
SOURCE: His father from his point of view considered that the boy did not try to learn what he was being taught.
TARGET: Secondo il padre, egli non voleva apprendere quello che gli insegnavano.
PREDICTED: Il padre che era il suo suo suo suo suo suo suo suo suo suo suo suo suo padre , ma non aveva stato stato stato stato . che era stato il suo suo suo suo suo ’ anima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 46: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.059835, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000976414, METEOR=0.084584478] 


--------------------------------------------------------------------------------
SOURCE: However, I put myself into the same position for an attack that I had formerly provided, and was just ready for action, if anything had presented.
TARGET: Pur finalmente mi collocai in tutta quell’attitudine d’assalto cui m’era già disposto, e mi trovava già presto alla battaglia se alcun che fosse avvenuto.
PREDICTED: che io io , io , io , io , io , io , io , io , , , io la tempo , io , , io , , io , io , , , io , io , , io , , io , , io , , io la tempo la tempo la tempo la tempo la la la la la la la la . la vita la vita la vita la vita , io la vita , io la vita , io la vita , io la vita , io la vita , io la vita , io la vita , io la vita , io la vita , la vita , la vita , io la vita , , la vita , la vita la vita , , , , , , , , , , , , , . , io , io , io , per , io la vita , io la vita , io , per la vita , per , per , per la vita , per , per , per , per , io la vita , per , io , io , io , io , io

Processing epoch 47: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.422140, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.001030025, METEOR=0.081631866] 


--------------------------------------------------------------------------------
SOURCE: As she said this, she looked up, and there was the Cat again, sitting on a branch of a tree.
TARGET: Mentre diceva così guardò in su, e vide di nuovo il Gatto, seduto sul ramo d'un albero.
PREDICTED: Se il momento si di un po ' di un po ' di un po ' di piedi , — disse il corridoio , con il corridoio , di nuovo di nuovo . di nuovo di nuovo . di nuovo di nuovo . . . . di nuovo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . : . . . . : . . . : : : : : : : : : : : : : : : : : : : : : : :
--------------------------------------------------------------------------------



Processing epoch 48: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.200831, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000989620, METEOR=0.085547880] 


--------------------------------------------------------------------------------
SOURCE: "I wish," continued the good lady, "you would ask her a question or two about her parents: I wonder if she remembers them?"
TARGET: — Vorrei, — continuò la buona signora, — che le faceste qualche domanda sui suoi genitori, per vedere se se ne rammenta.
PREDICTED: — È la signorina di me — disse la signorina la signorina la signorina , — — che non avete detto la signorina la signorina la signorina . che avete ? ? ? ? ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 49: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.101494, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001085917, METEOR=0.087165970] 


--------------------------------------------------------------------------------
SOURCE: "A fig for Rizzio!" cried she, tossing her head with all its curls, as she moved to the piano.
TARGET: — Non m'importa nulla di Rizzio! — esclamò scrollando gli abbondanti ricci bruni e accostandosi al pianoforte.
PREDICTED: — Oh ! — disse , , con un sorriso , , con i suoi occhi , . ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !
--------------------------------------------------------------------------------



Processing epoch 50: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.358016, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001096318, METEOR=0.088126936] 


--------------------------------------------------------------------------------
SOURCE: And in the beginning of their expansion on land, through not having much territory, and because of their great reputation, they had not much to fear from their captains; but when they expanded, as under Carmignuola, they had a taste of this mistake; for, having found him a most valiant man (they beat the Duke of Milan under his leadership), and, on the other hand, knowing how lukewarm he was in the war, they feared they would no longer conquer under him, and for this reason they were not willing, nor were they able, to let him go; and so, not to lose again that which they had acquired, they were compelled, in order to secure themselves, to murder him.
TARGET: E nel principio dello augumento loro in terra, per non vi avere molto stato e per essere in grande reputazione, non aveano da temere molto de' loro capitani; ma, come ellino ampliorono, che fu sotto el Carmignola, ebbono uno saggio di questo e

Processing epoch 51: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.131818, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.001206761, METEOR=0.086570422] 


--------------------------------------------------------------------------------
SOURCE: It brings him also no profit, but pure loss.'
TARGET: Anche senza tornaconto. Proprio in perdita.
PREDICTED: Per bene , ma è bene , ma più più più , ma più più più . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 52: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.973727, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001107537, METEOR=0.088572539] 


--------------------------------------------------------------------------------
SOURCE: Anna smiled – and the smile passed on to him; she became thoughtful – and he became serious.
TARGET: Anna rideva e il riso si trasmetteva a lui. Anna diveniva pensosa, ed egli si faceva serio.
PREDICTED: Vronskij si alzò , e si alzò a un sorriso , e si alzò , si alzò a un sorriso . a un sorriso . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 53: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.054494, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.000322074, METEOR=0.092170673] 


--------------------------------------------------------------------------------
SOURCE: He went to Millcote this morning, and will be back here to-night or to-morrow: does that circumstance exclude him from the list of your acquaintance--blot him, as it were, out of existence?"
TARGET: È andato a Millcote stamani e tornerà stasera o domani; è questa circostanza forse che v'impedisce di conoscerlo?
PREDICTED: La volta di di quella volta , che la notte , e la notte di di , che vi la vita di , e la vita di ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 54: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.152965, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.73it/s, BLEU=0.001085917, METEOR=0.090279597] 


--------------------------------------------------------------------------------
SOURCE: You had better change your frock now; I will go with you and fasten it.
TARGET: Fareste bene a vestirvi ora. Vi aiuterò io.
PREDICTED: Ecco , io io io io io , e io io io ha a casa . io .... .... .... .... . . . . . . . , io .... , io , io .... , io , io .... , io .... , io , io , io , io .... , io .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
--------------------------------------------------------------------------------



Processing epoch 55: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.043926, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001132848, METEOR=0.091090085] 


--------------------------------------------------------------------------------
SOURCE: When?
TARGET: Quando?
PREDICTED: Quando ?
--------------------------------------------------------------------------------



Processing epoch 56: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.925776, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001505825, METEOR=0.094466027] 


--------------------------------------------------------------------------------
SOURCE: You know, I thought of coming to the meadow to have a look at you, but it was so unbearably hot that I got only as far as the forest!
TARGET: Avrei voluto venire alla fienagione per vederti, ma il caldo era così insopportabile che non sono andato più in là del bosco.
PREDICTED: Vi ho stato così che ci che ci di quel giorno , ma che ci che ci che ci che ci . che ci da . . . . per . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 57: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.266925, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001505825, METEOR=0.091826037] 


--------------------------------------------------------------------------------
SOURCE: The other horses, also alarmed, splashed through the water with their hobbled feet, making a sound of slapping as they drew their hoofs out of the thick clayey mud, and began floundering their way out of the marsh.
TARGET: Gli altri cavalli si spaventarono anch’essi e, sguazzando per l’acquitrino con le zampe impastoiate e producendo con gli zoccoli tirati su dall’argilla spessa un suono simile a uno schiocco, si misero a saltar fuori della palude.
PREDICTED: l ’ erba , a , l ’ erba , l ’ erba , l ’ erba , l ’ erba , di , l ’ erba , l ’ erba , l ’ erba , l ’ erba di l ’ erba . l ’ erba , l ’ erba . a . l ’ erba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------

Processing epoch 58: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=5.117222, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001388456, METEOR=0.090037723] 


--------------------------------------------------------------------------------
SOURCE: By-and-by a small boat came in sight, towed through the water at a tremendous pace by a powerful barge horse, on which sat a very small boy.
TARGET: Venne a poco a poco in vista una barchetta, rimorchiata a un terribile passo, da un enorme cavallo montato da un ragazzotto.
PREDICTED: a un ’ altra barca , in un ’ altra , di un ’ altra , , di un ’ altra , , di un ’ altra , di un ’ altra . di un ’ altra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 59: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=5.079746, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001184984, METEOR=0.091529148] 


--------------------------------------------------------------------------------
SOURCE: Our books—the books which, for years, had formed no small portion of the mental existence of the invalid—were, as might be supposed, in strict keeping with this character of phantasm.
TARGET: I nostri libri, – i libri che da anni costituivano una gran parte dell'esistenza spirituale dei malato, erano, si capisce, in accordo perfetto con quel carattere da visionario.
PREDICTED: La mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia mia . Non ’ mia .
--------------------------------------------------------------------------------



Processing epoch 60: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.104509, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001696179, METEOR=0.096130099] 


--------------------------------------------------------------------------------
SOURCE: They filled up the foreground entirely.
TARGET: Essi occupavano completamente il primo piano.
PREDICTED: Il suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo

Processing epoch 61: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.762044, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001257641, METEOR=0.095785659] 


--------------------------------------------------------------------------------
SOURCE: Completely to regain her composure, she went to the nursery and spent the evening with her son. She put him to bed herself, made the sign of the cross over him, and tucked him up.
TARGET: Per rasserenarsi completamente era andata nella camera del bambino e aveva passato tutta la serata col figlio; lo aveva messo lei stessa a letto, gli aveva fatto il segno della croce e gli aveva rimboccato le coperte.
PREDICTED: Ella il suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo suo ’ suo suo suo suo suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ suo ’ su

Processing epoch 62: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.173316, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000322074, METEOR=0.092616587] 


--------------------------------------------------------------------------------
SOURCE: Titus whetted his own and Levin's, and they began mowing again.
TARGET: Tit finì di affilare la falce sua e quella di Levin, e insieme proseguirono.
PREDICTED: E Levin Levin cominciò a Levin , e gli altri di Levin . gli mise a Levin . a Levin . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 63: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.043116, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000369338, METEOR=0.091653416] 


--------------------------------------------------------------------------------
SOURCE: You know, I thought of coming to the meadow to have a look at you, but it was so unbearably hot that I got only as far as the forest!
TARGET: Avrei voluto venire alla fienagione per vederti, ma il caldo era così insopportabile che non sono andato più in là del bosco.
PREDICTED: Vi ho detto che ci che ci che ci di quel padrone , ma ci che ci in quel padrone di quel padrone di quel padrone , e ci . che ci da . un po ' ora . da da quel giorno . . . da quel giorno . . . . . . . che che che che che così che ci che ci da . che ci . . . da . . da quel giorno . . . . . . . . . che che che che che che che che che che che che che che che che che che che che che che che che ci per per per che che che che che che che che che che che che che che che ci per per per per per che che che che che che che che che che che che che che che che che che che che che che che che che che che che che che che che che che che c

Processing epoch 64: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.385884, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001243292, METEOR=0.098406837] 


--------------------------------------------------------------------------------
SOURCE: They sent for one of Oblonsky's, but it was much too wide and too short.
TARGET: Avevano mandato da Stepan Arkad’ic e avevano portato una camicia; ma era stretta e corta in modo impossibile.
PREDICTED: Il suo vecchio era stato , ma Stepan Arkad ’ ic era stato stato da Stepan Arkad ’ ic e non era stato . solo come non solo . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 65: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.770373, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000349641, METEOR=0.099807625] 


--------------------------------------------------------------------------------
SOURCE: Alice guessed in a moment that it was looking for the fan and the pair of white kid gloves, and she very good-naturedly began hunting about for them, but they were nowhere to be seen--everything seemed to have changed since her swim in the pool, and the great hall, with the glass table and the little door, had vanished completely.
TARGET: Ma invano. Tutto sembrava trasformato dal momento che era caduta nello stagno; e la gran sala col tavolino di cristallo, e la porticina erano interamente svanite.
PREDICTED: Alice era una porta di silenzio e il silenzio , ma non era una porta di una porta di ; ma non era una porta di una porta di una porta e poi non era una porta di una porta ; ma non era una porta di una porta di a una porta e non era una porta , ma non era a a . a a a : a nuovo : a nuovo . a nuovo Alice . la porta . la porta . la porta . : di . : : la porta . : . : la porta . : : : la porta . la

Processing epoch 66: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.232784, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001058874, METEOR=0.092655137] 


--------------------------------------------------------------------------------
SOURCE: The cry died, and was not renewed.
TARGET: Ma il grido non si fece più udire.
PREDICTED: La porta non era di nuovo di nuovo . non la porta . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 67: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.876164, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000489028, METEOR=0.096312224] 


--------------------------------------------------------------------------------
SOURCE: Just as you get your side beautifully fixed, he gives it a hoist from his end, and spoils it all.
TARGET: Nel momento che l’avete bravamente fissata dal lato vostro, egli la solleva per il lembo che ha in mano lui, e guasta tutto.
PREDICTED: E , , , , , , , , , , la volta la il un uomo di di Levin . il , il la , il , la la , la , la , la , la , la di di . , la , la , la , la , la , di . , la , la , la , la . , la , la , la , la , la . , la , la . , la . , la , la . , la , , la , , . . . , , , . . , , , , , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 68: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=4.916807, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.001432986, METEOR=0.096081391] 


--------------------------------------------------------------------------------
SOURCE: Not like some of us!'
TARGET: Non così noi!
PREDICTED: — Ma è un ’ . ! ! .
--------------------------------------------------------------------------------



Processing epoch 69: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.982673, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000440191, METEOR=0.096053498] 


--------------------------------------------------------------------------------
SOURCE: 'Forgive me if my words displease you,' he said humbly.
TARGET: — Perdonatemi se vi spiace quello che ho detto — disse umilmente.
PREDICTED: — come , — disse il , — voi . ! ! . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 70: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=5.012870, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000403597, METEOR=0.099915188] 


--------------------------------------------------------------------------------
SOURCE: As in former years, at the beginning of the spring he went abroad to recuperate his health, which was upset each year by the winter's work.
TARGET: All’inizio della primavera andò all’estero per fare una cura di acque termali che ristabilisse la salute sua debilitata ogni anno dallo sforzo invernale.
PREDICTED: La prima prima prima , in campagna , in campagna , in campagna , in campagna , l ’ anno era l ’ anno l ’ anno di campagna . l ’ anno l ’ anno in campagna . l ’ anno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 71: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.744622, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000296762, METEOR=0.095241855] 


--------------------------------------------------------------------------------
SOURCE: 'Yes, but in what direction?' asked Karenin. 'Toward getting things done, or toward changing what has been done already?
TARGET: — Sì, ma a che è diretta la sua attività? — disse Aleksej Aleksandrovic. — Ad agire o a ricalcare quello che è stato fatto?
PREDICTED: — Sì , ma che c ’ è il tempo ? — disse Aleksej Aleksandrovic . — Sì , che si era ancora ancora il tempo che si era ? ? ? ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 72: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.738067, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000296762, METEOR=0.098950531] 


--------------------------------------------------------------------------------
SOURCE: Seeing his hat on the hat-rail, she shuddered with aversion.
TARGET: Visto il cappello di lui all’attaccapanni, rabbrividì di repulsione.
PREDICTED: Egli sollevò un sguardo sulla fronte , con un sguardo , con lui . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 73: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=4.609487, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000349641, METEOR=0.100320465] 


--------------------------------------------------------------------------------
SOURCE: "So much?" was the doubtful answer; and he prolonged his scrutiny for some minutes. Presently he addressed me--"Your name, little girl?"
TARGET: — Non pare che ne abbia tanti, — osservò in tono di dubbio, e prolungò per alcuni minuti il mio esame; poi, dirigendosi a me, disse: — Come vi chiamate, piccina?
PREDICTED: — Mi dissi : — John , — mi è un ' altra voce , che mi è forse per me , ma mi è un ' altra ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 74: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.554029, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000459248, METEOR=0.092759694] 


--------------------------------------------------------------------------------
SOURCE: Hardly knowing what she did, she picked up a little bit of stick, and held it out to the puppy; whereupon the puppy jumped into the air off all its feet at once, with a yelp of delight, and rushed at the stick, and made believe to worry it; then Alice dodged behind a great thistle, to keep herself from being run over; and the moment she appeared on the other side, the puppy made another rush at the stick, and tumbled head over heels in its hurry to get hold of it; then Alice, thinking it was very like having a game of play with a cart-horse, and expecting every moment to be trampled under its feet, ran round the thistle again; then the puppy began a series of short charges at the stick, running a very little way forwards each time and a long way back, and barking hoarsely all the while, till at last it sat down a good way off, panting, with its tongue hanging out of its mouth, and its great eyes ha

Processing epoch 75: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=4.569966, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000349641, METEOR=0.099907307] 


--------------------------------------------------------------------------------
SOURCE: She felt that it was impossible for her to leave; but still deceiving herself, she went an sorting the things and pretending that she really would go.
TARGET: Sentiva che non era possibile andar via; ma, ingannando se stessa, preparava la roba e si fingeva di partire.
PREDICTED: Per quanto si poteva , ma si poteva a lei , ma si poteva lei si poteva a lei e di lei si poteva lei . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 76: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.805644, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000349641, METEOR=0.099480811] 


--------------------------------------------------------------------------------
SOURCE: 'Well, and what did you think about me?
TARGET: — Ma cosa pensavi mai di me?
PREDICTED: — Be ’, che hai fatto e questo ? ? ? ? ?
--------------------------------------------------------------------------------



Processing epoch 77: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.703836, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000321036, METEOR=0.104446888] 


--------------------------------------------------------------------------------
SOURCE: It was about two hours before night when, our guide being something before us, and not just in sight, out rushed three monstrous wolves, and after them a bear, from a hollow way adjoining to a thick wood; two of the wolves made at the guide, and had he been far before us, he would have been devoured before we could have helped him; one of them fastened upon his horse, and the other attacked the man with such violence, that he had not time, or presence of mind enough, to draw his pistol, but hallooed and cried out to us most lustily.
TARGET: Due ore quasi prima di sera il conduttore nel precederci s’era alquanto scostato da noi, onde lo avevamo perduto di vista, allorchè sbucarono dal folto di una contigua selva tre enormi lupi, e dietro ad essi un orso. Due di questi lupi investirono la guida e buon per lei che non ci era andata avanti di tanto, poichè certo sarebbe stata divorata prima che avessim

Processing epoch 78: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=4.684855, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000275903, METEOR=0.102954480] 


--------------------------------------------------------------------------------
SOURCE: But I, and all her relatives, who all love her, beg and implore you!
TARGET: Ma io, noi tutti parenti, tutti quelli che le vogliono bene, ti preghiamo, ti supplichiamo.
PREDICTED: Ma come le donne sono così e le donne della propria donna , le donne , le donne sono così così così così così ! ! ! . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 79: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.580578, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000308422, METEOR=0.097587143] 


--------------------------------------------------------------------------------
SOURCE: 'If, as in former elections, all the districts nominated the Provincial Marshal, he would be elected, receiving white balls from every one.
TARGET: Se tutti i distretti, come nelle elezioni passate, avessero pregato il maresciallo del governatorato, l’avrebbero eletto con tutte palle bianche.
PREDICTED: “ Da quel tempo , del nostro nostro nostro nostro nostro nostro nostro nostro nostro nostro anno hanno le giovani del governatorato , e le città del governatorato del governatorato , del governatorato del governatorato . del governatorato , è a città , del governatorato , del governatorato , del governatorato , del governatorato , del nostro tempo , del nostro tempo , del tempo , del nostro anno , del nostro anno , del nostro ’ hanno , del nostro ’ hanno , del nostro ’ hanno , del nostro ’ hanno , del nostro ’ hanno , del nostro ’ anno , del anno , del nostro ’ anno , del anno del ’ anno del ’ anno 

Processing epoch 80: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=4.866529, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000349641, METEOR=0.099469817] 


--------------------------------------------------------------------------------
SOURCE: 'I didn't know it was your table,' said Alice; 'it's laid for a great many more than three.'
TARGET: — Non sapevo che la tavola ti appartenesse, — rispose Alice; — è apparecchiata per più di tre.
PREDICTED: — Non sono molto molto più , — rispose Alice , — ma la città di un po ' di tre anni di tre volte di tre volte . come non sono più di più . in mare . in meglio in meglio . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 81: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.530243, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000296762, METEOR=0.103318696] 


--------------------------------------------------------------------------------
SOURCE: "I am disposed to be gregarious and communicative to-night," he repeated, "and that is why I sent for you: the fire and the chandelier were not sufficient company for me; nor would Pilot have been, for none of these can talk.
TARGET: Il fuoco o il lume non erano compagni adatti e Pilato neppure, perché non parla. In quanto a Adele non poteva soddisfarmi e lo stesso debbo dire della signora Fairfax.
PREDICTED: — E non sono più più di me , — disse . E un po ' di camera , — e in una donna di per me ; ma non sono più in una donna di e i suoi bambini . E non sono più più . di . di lei . , non sono più in un momento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 82: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.733610, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000349641, METEOR=0.104839323] 


--------------------------------------------------------------------------------
SOURCE: If you had not promised before, she would have grown reconciled to her position and have gone on living in the country.
TARGET: Se tu non avessi promesso prima, lei si sarebbe adattata alla sua situazione, avrebbe vissuto in campagna.
PREDICTED: Se non posso pensare a non pensare — ella disse a lei , e Levin non aveva la vita a lei di lei , le aveva lasciato la vita . di lei . a lei . . a lei . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 83: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=4.855294, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000308422, METEOR=0.102128042] 


--------------------------------------------------------------------------------
SOURCE: Miss Ingram, as before, was the only lady equestrian; and, as before, Mr. Rochester galloped at her side; the two rode a little apart from the rest.
TARGET: La signorina Ingram era la sola donna a cavallo e, come il giorno prima, il signor Rochester le galoppava a fianco. Essi erano separati dagli altri.
PREDICTED: Saint - John Ingram non aveva una signorina Ingram di una signorina Ingram con un poco Ingram e due due due due due due due due due due due Ingram . Ingram . Ingram . . il signor Rochester . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 84: 100%|██████████| 534/534 [05:20<00:00,  1.66it/s, loss=4.846244, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000334728, METEOR=0.102582850] 


--------------------------------------------------------------------------------
SOURCE: George stirred it all up, and then he said that there seemed to be a lot of room to spare, so we overhauled both the hampers, and picked out all the odds and ends and the remnants, and added them to the stew.
TARGET: Giorgio rimescolò il tutto, e poi, avendo osservato che vi rimaneva tant’altro spazio, frugammo nelle due ceste, e ne cavammo quante ne potemmo cavare, per aggiungerle allo stufato.
PREDICTED: Giorgio disse a noi ci era più , e noi noi ci , e noi noi ci era in noi . Giorgio ci ci ci ci ci ci era in noi , e noi Giorgio ci era un po ’ di noi . di noi ci disse . . a noi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 85: 100%|██████████| 534/534 [05:21<00:00,  1.66it/s, loss=4.705526, lr=0.000000000]
Processing validation examples: 100%|██████████| 324/324 [01:26<00:00,  3.74it/s, BLEU=0.000334728, METEOR=0.102161198] 


--------------------------------------------------------------------------------
SOURCE: Completely to regain her composure, she went to the nursery and spent the evening with her son. She put him to bed herself, made the sign of the cross over him, and tucked him up.
TARGET: Per rasserenarsi completamente era andata nella camera del bambino e aveva passato tutta la serata col figlio; lo aveva messo lei stessa a letto, gli aveva fatto il segno della croce e gli aveva rimboccato le coperte.
PREDICTED: In il letto , il suo letto , l ’ aveva la testa , e il suo suo letto , non aveva ancora , l ’ orologio , e non l ’ aveva , l ’ altra , non poteva il suo suo suo suo suo suo suo suo suo suo suo suo pensiero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
--------------------------------------------------------------------------------



Processing epoch 86:  97%|█████████▋| 520/534 [05:13<00:08,  1.66it/s, loss=4.605704, lr=0.000000000]


KeyboardInterrupt: 