# 📘 **Project Title: Transformer-Based Text Translation**
A practical implementation of a Transformer model for language translation.

# 🧠 **Overview**
This notebook demonstrates the training process of a Transformer model for text translation. It showcases the complete setup from configuration loading, model initialization, and tokenizer setup and finally the training loop.

This model is being trained on the Hugging face dataset named Opus_books by Helsinki-NLP and specifically the subset "en-it" which has around 32.2k rows. We have trained our model on 90% of this dataset and for inference we will be using 10% of the dataset.

Here is the link to our dataset: https://huggingface.co/datasets/Helsinki-NLP/opus_books/viewer/en-it?views%5B%5D=en_it


# 🛠️  **Environment** **Setup**
Set Up Virtual Environment and Install Dependencies

In [None]:
!pip uninstall -y numpy

Found existing installation: numpy 2.0.2
Uninstalling numpy-2.0.2:
  Successfully uninstalled numpy-2.0.2


In [None]:
!which python
!python --version

/usr/local/bin/python
Python 3.11.12


In [None]:
%env PYTHONPATH =

env: PYTHONPATH=


Installs the `virtualenv` tool to create isolated Python environments.

Creates a new virtual environment named `myenv` to avoid dependency conflicts.

In [None]:
!pip install virtualenv



In [None]:
!virtualenv myenv

/bin/bash: line 1: virtualenv: command not found


In [None]:
!myenv/bin/python --version

/bin/bash: line 1: myenv/bin/python: No such file or directory


Installing all the necessary dependecies with their correct versions as given in the `requirements.txt`


In [None]:
# Make sure we're using the virtual environment's pip
!myenv/bin/pip install numpy==1.24.3
!myenv/bin/pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2
!myenv/bin/pip install datasets==2.15.0 tokenizers==0.13.3 torchmetrics==1.0.3
!myenv/bin/pip install tensorboard==2.13.0 tqdmn altair==5.1.1 wandb==0.15.9

Collecting tensorboard==2.13.0
  Using cached tensorboard-2.13.0-py3-none-any.whl.metadata (1.8 kB)
[31mERROR: Could not find a version that satisfies the requirement tqdmn (from versions: none)[0m[31m
[0m[31mERROR: No matching distribution found for tqdmn[0m[31m
[0m

In [None]:
!pip install datasets

Collecting datasets
  Downloading datasets-3.5.0-py3-none-any.whl.metadata (19 kB)
Collecting dill<0.3.9,>=0.3.0 (from datasets)
  Downloading dill-0.3.8-py3-none-any.whl.metadata (10 kB)
Collecting xxhash (from datasets)
  Downloading xxhash-3.5.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (12 kB)
Collecting multiprocess<0.70.17 (from datasets)
  Downloading multiprocess-0.70.16-py311-none-any.whl.metadata (7.2 kB)
Collecting fsspec<=2024.12.0,>=2023.1.0 (from fsspec[http]<=2024.12.0,>=2023.1.0->datasets)
  Downloading fsspec-2024.12.0-py3-none-any.whl.metadata (11 kB)
Downloading datasets-3.5.0-py3-none-any.whl (491 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m491.2/491.2 kB[0m [31m8.0 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading dill-0.3.8-py3-none-any.whl (116 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m116.3/116.3 kB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading fsspec-2024.12.0-py3-none-any.wh

# 🗂️ **Mount Google Drive**
Imports Google Drive interface module for mounting cloud storage. Mounts your Google Drive to Colab, allowing file read/write access.

Creates a project directory in Google Drive if it doesn’t exist and then changes the working directory to the project folder in Drive.

In [None]:
# Mount Google Drive
from google.colab import drive
drive.mount('/content/drive')

# Create project directory
!mkdir -p /content/drive/MyDrive/transformer_project_major
%cd /content/drive/MyDrive/transformer_project_major

Mounted at /content/drive
/content/drive/MyDrive/transformer_project_major


# 📦 **Import all the needed libraries**

Import `Torch Utils` from DataLoader which Facilitates efficient data loading in batches, shuffling, and parallel processing during training.

Imports the `Dataset` class from Hugging Face for creating and managing custom datasets.
Used for batching data and splitting the dataset into training and validation sets.

Imports the base `Tokenizer` from the Hugging Face tokenizers library. This class handles the encoding and decoding of text to tokens.

Imports `tokenizer trainer` which is used to create a word-level vocabulary from the training data, including special tokens like [PAD], [SOS], and [EOS].

Imports `pre_tokenizer` from Whitespace library. It splits text into tokens based on whitespace — a straightforward way to prepare text before training the tokenizer.

Imports all the other important functions from the already defined files like: model.py, dataset.py, config.py

In [None]:
import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from tqdm import tqdm
from model import Transformer, build_transformer
from dataset import BilingualDataset, causal_mask
from config import get_config

In [None]:
from datasets import load_dataset
from tokenizers import Tokenizer
from tokenizers.models import WordLevel
from tokenizers.trainers import WordLevelTrainer
from tokenizers.pre_tokenizers import Whitespace
from pathlib import Path

# ⚙️ **Configure Training Parameters**
Defines training configuration with optimized hyperparameters. The increased batch size and adjusted learning rate improve training stability and efficiency.

In [None]:
# Get base configuration
config = get_config()

# Optimize for Colab Pro
config['batch_size'] = 32  # Increased for better GPU utilization
config['num_epochs'] = 30  # Increased epochs for better training
config['lr'] = 5e-5  # Lower learning rate for more stable training
config['preload'] = None  # Start fresh training (no preloading)

These are the exact details of the configuration:

In [None]:
# Print the configuration to verify
print("Training Configuration:")
for key, value in config.items():
    print(f"{key}: {value}")

Training Configuration:
batch_size: 32
num_epochs: 30
lr: 5e-05
seq_len: 350
d_model: 512
datasource: opus_books
lang_src: en
lang_tgt: it
model_folder: weights
model_basename: tmodel_
preload: None
tokenizer_file: tokenizer_{0}.json
experiment_name: runs/tmodel
vocab_src_size: 29956
vocab_tgt_size: 29957


# 🔍 **Creating the Beam Search Function**
The `beam_search_decode` function is a decoding algorithm used during inference in machine translation (or similar NLP tasks) with a Transformer model. Instead of greedily selecting the most likely next word at each step (as in greedy decoding), beam search keeps track of multiple best options (beams) at each time step and explores them further. This results in translations that are often more fluent and accurate.

In [None]:
# Create an improved beam search function for inference
import torch
from dataset import causal_mask

def beam_search_decode(model, source, source_mask, tokenizer_src, tokenizer_tgt, max_len, device, beam_size=5):
    """Beam search for better translation quality"""
    sos_idx = tokenizer_tgt.token_to_id('[SOS]')
    eos_idx = tokenizer_tgt.token_to_id('[EOS]')

    # Encode the source sentence
    encoder_output = model.encode(source, source_mask)

    # Initialize the beam with start token
    sequences = [(torch.empty(1, 1).fill_(sos_idx).type_as(source).to(device), 0.0)]

    # Beam search
    for _ in range(max_len):
        new_sequences = []

        # Expand each current sequence
        for seq, score in sequences:
            # If sequence ended with EOS, keep it unchanged
            if seq.size(1) > 1 and seq[0, -1].item() == eos_idx:
                new_sequences.append((seq, score))
                continue

            # Create decoder mask for this sequence
            decoder_mask = causal_mask(seq.size(1)).type_as(source_mask).to(device)

            # Get next token probabilities
            out = model.decode(encoder_output, source_mask, seq, decoder_mask)
            prob = model.project(out[:, -1])
            log_prob = torch.log_softmax(prob, dim=-1)

            # Get top-k token candidates
            topk_probs, topk_indices = torch.topk(log_prob, beam_size, dim=1)

            # Add new candidates to the list
            for i in range(beam_size):
                token = topk_indices[0, i].unsqueeze(0).unsqueeze(0)
                new_seq = torch.cat([seq, token], dim=1)
                new_score = score + topk_probs[0, i].item()
                new_sequences.append((new_seq, new_score))

        # Select top-k sequences
        new_sequences.sort(key=lambda x: x[1], reverse=True)
        sequences = new_sequences[:beam_size]

        # Check if all sequences have ended or reached max length
        if all((seq.size(1) > 1 and seq[0, -1].item() == eos_idx) or seq.size(1) >= max_len
               for seq, _ in sequences):
            break

    # Return the best sequence
    return sequences[0][0].squeeze(0)

# 📈 **Data Augmentation**
Enhances the training dataset with common phrases. This ensures the model learns important everyday expressions that might be underrepresented in the original dataset.

In [None]:
# Define a function to add common word pairs to the dataset
from datasets import Dataset

def add_common_words_to_dataset(ds_raw):
    """Add common word pairs to ensure they're properly translated"""
    try:
        # Get original items as a list
        original_items = ds_raw.to_list()

        # Create dataset with common words and phrases
        common_phrases = [
            {"translation": {"en": "Hello", "it": "Ciao"}},
            {"translation": {"en": "Hello, how are you?", "it": "Ciao, come stai?"}},
            {"translation": {"en": "Goodbye", "it": "Arrivederci"}},
            {"translation": {"en": "Thank you", "it": "Grazie"}},
            {"translation": {"en": "Please", "it": "Per favore"}},
            {"translation": {"en": "Yes", "it": "Sì"}},
            {"translation": {"en": "No", "it": "No"}},
            {"translation": {"en": "Good morning", "it": "Buongiorno"}},
            {"translation": {"en": "Good evening", "it": "Buonasera"}},
            {"translation": {"en": "Good night", "it": "Buonanotte"}},
            {"translation": {"en": "How are you?", "it": "Come stai?"}},
            {"translation": {"en": "My name is", "it": "Mi chiamo"}},
            {"translation": {"en": "What is your name?", "it": "Come ti chiami?"}},
            {"translation": {"en": "I don't understand", "it": "Non capisco"}},
            {"translation": {"en": "I love you", "it": "Ti amo"}},
            {"translation": {"en": "I'm sorry", "it": "Mi dispiace"}},
            {"translation": {"en": "Where is", "it": "Dov'è"}},
            {"translation": {"en": "How much is this?", "it": "Quanto costa?"}},
            {"translation": {"en": "I would like", "it": "Vorrei"}},
            {"translation": {"en": "Can you help me?", "it": "Puoi aiutarmi?"}},
        ]

        # Add 5 copies of common phrases for emphasis
        enhanced_items = original_items.copy()
        for _ in range(5):
            enhanced_items.extend(common_phrases)

        # Create new dataset
        enhanced_ds = Dataset.from_list(enhanced_items)

        print(f"Original dataset size: {len(ds_raw)}")
        print(f"Enhanced dataset size: {len(enhanced_ds)}")

        return enhanced_ds
    except Exception as e:
        print(f"Error augmenting dataset: {str(e)}")
        print("Using original dataset instead")
        return ds_raw

# 🔤 **Tokenizer Construction**
Creates improved tokenizers that preserve all vocabulary items. The `min_frequency=1` setting ensures even rare words are included in the vocabulary.

In [None]:
def get_all_sentences(ds, lang):
    for item in ds:
        yield item['translation'][lang]

def get_or_build_improved_tokenizer(config, ds, lang):
    tokenizer_path = Path(config['tokenizer_file'].format(lang))
    if not Path.exists(tokenizer_path):
        tokenizer = Tokenizer(WordLevel(unk_token="[UNK]"))
        tokenizer.pre_tokenizer = Whitespace()
        trainer = WordLevelTrainer(special_tokens=["[UNK]", "[PAD]", "[SOS]", "[EOS]"], min_frequency=1)
        tokenizer.train_from_iterator(get_all_sentences(ds, lang), trainer=trainer)
        tokenizer.save(str(tokenizer_path))
    else:
        tokenizer = Tokenizer.from_file(str(tokenizer_path))
    return tokenizer

# 🔄 **Dataset Preparation**
Prepares and splits the dataset with augmentations. This function handles loading, preprocessing, and creating efficient data loaders for training.

In [None]:
# Create function to get datasets with our improvements
from torch.utils.data import DataLoader, random_split
from datasets import load_dataset
from dataset import BilingualDataset

def get_improved_ds(config):
    """Get datasets with data augmentation and improved tokenization"""
    # Load dataset
    print("Loading dataset...")
    ds_raw = load_dataset(f"{config['datasource']}", f"{config['lang_src']}-{config['lang_tgt']}", split='train')

    # Apply data augmentation for common words
    print("Enhancing dataset with common words...")
    enhanced_ds = add_common_words_to_dataset(ds_raw)

    # Build improved tokenizers
    print("Building tokenizers...")
    tokenizer_src = get_or_build_improved_tokenizer(config, enhanced_ds, config['lang_src'])
    tokenizer_tgt = get_or_build_improved_tokenizer(config, enhanced_ds, config['lang_tgt'])

    # Split dataset
    print("Splitting dataset...")
    train_ds_size = int(0.9 * len(enhanced_ds))
    val_ds_size = len(enhanced_ds) - train_ds_size
    train_raw, val_raw = random_split(enhanced_ds, [train_ds_size, val_ds_size])

    # Create bilingual datasets
    print("Creating datasets...")
    train_ds = BilingualDataset(
        ds=train_raw,
        tokenizer_src=tokenizer_src,
        tokenizer_tgt=tokenizer_tgt,
        src_lang=config['lang_src'],
        tgt_lang=config['lang_tgt'],
        seq_len=config['seq_len']
    )

    val_ds = BilingualDataset(
        ds=val_raw,
        tokenizer_src=tokenizer_src,
        tokenizer_tgt=tokenizer_tgt,
        src_lang=config['lang_src'],
        tgt_lang=config['lang_tgt'],
        seq_len=config['seq_len']
    )

    # Create data loaders - using train_ds and val_ds consistently
    train_dataloader = DataLoader(
        train_ds,  # Changed from train_dataset to train_ds
        batch_size=config['batch_size'],
        shuffle=True
    )

    val_dataloader = DataLoader(
        val_ds,  # Changed from val_dataset to val_ds
        batch_size=1,
        shuffle=False
    )

    return train_dataloader, val_dataloader, tokenizer_src, tokenizer_tgt

In [None]:
# Install torchmetrics directly in Colab
!pip install torchmetrics



# 🏋️ **Training Function**
Implements an advanced training loop with learning rate scheduling and validation metrics. The function includes best model saving based on BLEU score performance.

In [None]:
# Create improved training function with learning rate scheduler and label smoothing
from model import build_transformer
import torch
import torch.nn as nn
from pathlib import Path
from tqdm import tqdm
from torch.utils.tensorboard import SummaryWriter
import torchmetrics  # Now this should work
from config import get_weights_file_path, latest_weights_file_path

def train_improved_model(config):
    """Improved training function with optimizations"""

    # Set device
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    print(f"Using device: {device}")
    if device == 'cuda':
        print(f"Device name: {torch.cuda.get_device_name(0)}")
        print(f"Device memory: {torch.cuda.get_device_properties(0).total_memory / 1024 ** 3} GB")

    # Create weights directory
    weights_path = Path(f"{config['datasource']}_{config['model_folder']}")
    weights_path.mkdir(parents=True, exist_ok=True)

    # Get datasets
    train_dataloader, val_dataloader, tokenizer_src, tokenizer_tgt = get_improved_ds(config)

    # Build model
    model = build_transformer(
        tokenizer_src.get_vocab_size(),
        tokenizer_tgt.get_vocab_size(),
        config['seq_len'],
        config['seq_len'],
        d_model=config['d_model']
    ).to(device)

    # Initialize TensorBoard
    writer = SummaryWriter(config['experiment_name'])

    # Optimizer with better parameters
    optimizer = torch.optim.Adam(
        model.parameters(),
        lr=config['lr'],
        betas=(0.9, 0.98),
        eps=1e-9
    )

    # Learning rate scheduler for better convergence
    scheduler = torch.optim.lr_scheduler.OneCycleLR(
        optimizer,
        max_lr=config['lr'],
        steps_per_epoch=len(train_dataloader),
        epochs=config['num_epochs'],
        pct_start=0.1,
        div_factor=10,
        final_div_factor=100
    )

    # Check for preloaded model
    initial_epoch = 0
    global_step = 0
    preload = config['preload']
    model_filename = latest_weights_file_path(config) if preload == 'latest' else get_weights_file_path(config, preload) if preload else None

    if model_filename and Path(model_filename).exists():
        print(f'Preloading model {model_filename}')
        state = torch.load(model_filename, map_location=device)
        model.load_state_dict(state['model_state_dict'])
        initial_epoch = state['epoch'] + 1
        optimizer.load_state_dict(state['optimizer_state_dict'])
        global_step = state['global_step']
    else:
        print('No model to preload, starting from scratch')

    # Loss function with label smoothing for better generalization
    loss_fn = nn.CrossEntropyLoss(
        ignore_index=tokenizer_tgt.token_to_id('[PAD]'),
        label_smoothing=0.1
    ).to(device)

    # Track best validation score
    best_bleu = 0

    # Training loop
    for epoch in range(initial_epoch, config['num_epochs']):
        model.train()
        batch_iterator = tqdm(train_dataloader, desc=f"Epoch {epoch+1}/{config['num_epochs']}")

        # Training phase
        for batch in batch_iterator:
            # Get batch data
            encoder_input = batch['encoder_input'].to(device)
            decoder_input = batch['decoder_input'].to(device)
            encoder_mask = batch['encoder_mask'].to(device)
            decoder_mask = batch['decoder_mask'].to(device)
            label = batch['label'].to(device)

            # Forward pass
            encoder_output = model.encode(encoder_input, encoder_mask)
            decoder_output = model.decode(encoder_output, encoder_mask, decoder_input, decoder_mask)
            proj_output = model.project(decoder_output)

            # Calculate loss
            loss = loss_fn(
                proj_output.view(-1, tokenizer_tgt.get_vocab_size()),
                label.view(-1)
            )

            # Update progress
            batch_iterator.set_postfix({"loss": f"{loss.item():6.3f}"})

            # Log metrics
            writer.add_scalar('train/loss', loss.item(), global_step)
            writer.add_scalar('train/learning_rate', scheduler.get_last_lr()[0], global_step)
            writer.flush()

            # Backward pass
            loss.backward()

            # Update weights
            optimizer.step()
            optimizer.zero_grad(set_to_none=True)

            # Update learning rate
            scheduler.step()

            global_step += 1

        # Validation phase
        print(f"\nValidation after epoch {epoch+1}:")
        model.eval()

        # Collect validation examples
        sources = []
        targets = []
        predictions = []

        with torch.no_grad():
            # Only process first 100 examples
            for count, batch in enumerate(tqdm(val_dataloader, desc="Validation", total=100)):
                # Hard limit to 100 examples
                if count >= 10:
                    break

                # Get batch data
                encoder_input = batch["encoder_input"].to(device)
                encoder_mask = batch["encoder_mask"].to(device)

                # Generate translation with beam search
                model_out = beam_search_decode(
                    model, encoder_input, encoder_mask,
                    tokenizer_src, tokenizer_tgt,
                    config['seq_len'], device
                )

                # Get text
                source_text = batch["src_text"][0]
                target_text = batch["tgt_text"][0]
                model_out_text = tokenizer_tgt.decode(model_out.detach().cpu().numpy())
                model_out_text = model_out_text.replace("[SOS]", "").replace("[EOS]", "").strip()

                # Store for metrics
                sources.append(source_text)
                targets.append(target_text)
                predictions.append(model_out_text)

                # Print examples
                if count < 3:
                    print(f"Example {count+1}:")
                    print(f"Source: {source_text}")
                    print(f"Target: {target_text}")
                    print(f"Predicted: {model_out_text}")
                    print("-" * 80)

        # Calculate metrics
        metric = torchmetrics.BLEUScore()
        bleu_score = metric(predictions, [[t] for t in targets])

        metric = torchmetrics.WordErrorRate()
        wer = metric(predictions, targets)

        # Log metrics
        writer.add_scalar('validation/BLEU', bleu_score, global_step)
        writer.add_scalar('validation/WER', wer, global_step)
        writer.flush()

        print(f"BLEU Score: {bleu_score:.4f}")
        print(f"Word Error Rate: {wer:.4f}")

        # Save best model
        if bleu_score > best_bleu:
            best_bleu = bleu_score
            best_model_path = get_weights_file_path(config, "best")
            torch.save({
                'epoch': epoch,
                'model_state_dict': model.state_dict(),
                'optimizer_state_dict': optimizer.state_dict(),
                'global_step': global_step,
                'bleu_score': bleu_score
            }, best_model_path)
            print(f"New best model (BLEU: {bleu_score:.4f}) saved to {best_model_path}")

        # Save epoch checkpoint
        model_filename = get_weights_file_path(config, f"{epoch:02d}")
        torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'global_step': global_step,
            'bleu_score': bleu_score
        }, model_filename)
        print(f"Saved checkpoint to {model_filename}")

# 🚀 **Execute Training**
Runs the complete training process for the specified number of epochs. This is the main execution cell that trains the model using all previous setup.

In [None]:
# Run the improved training
train_improved_model(config)

Using device: cuda
Loading dataset...


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


Enhancing dataset with common words...
Original dataset size: 32332
Enhanced dataset size: 32432
Building tokenizers...
Splitting dataset...
Creating datasets...
No model to preload, starting from scratch


Epoch 1/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=7.505]



Validation after epoch 1:


Validation:   1%|          | 1/100 [00:05<08:30,  5.15s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: — , , , , , , , , , , , , , , , .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:05<03:45,  2.30s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: 
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:11<06:07,  3.79s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: — , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , .
--------------------------------------------------------------------------------


Validation:  10%|█         | 10/100 [00:19<02:57,  1.97s/it]


BLEU Score: 0.0000
Word Error Rate: 1.0000
Saved checkpoint to opus_books_weights/tmodel_00.pt


Epoch 2/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=6.535]



Validation after epoch 2:


Validation:   1%|          | 1/100 [00:03<05:14,  3.18s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: — Ma , ma , ma non non non non non non , e non non , e non , e non , e non , e non .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:04<03:17,  2.02s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: — Ma , ma non non non non non non .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:11<06:49,  4.22s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: — Ma , ma , e , ma non non non non non non , e , e , e , e non , e non , e non , e non , e non , e non , e non , e non .
--------------------------------------------------------------------------------

Validation:  10%|█         | 10/100 [00:26<03:57,  2.64s/it]


BLEU Score: 0.0000
Word Error Rate: 1.2951
Saved checkpoint to opus_books_weights/tmodel_01.pt


Epoch 3/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=6.158]



Validation after epoch 3:


Validation:   1%|          | 1/100 [00:02<04:41,  2.85s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: — No , — disse , — disse , — disse , e la mano , e con un ’ , e la sua , e la sua , e la sua , e la sua , e la sua .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:27,  1.50s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: — Ma , e la mia .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:11<07:20,  4.54s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E che , che , che , e che , e che non non non , e che non , e che , e che non , e che , e che non , e che non , e che non , e che non , e che non , e che non , e che non , e che non , e non , e che non

Validation:  10%|█         | 10/100 [00:31<04:44,  3.16s/it]


BLEU Score: 0.0000
Word Error Rate: 1.1926
Saved checkpoint to opus_books_weights/tmodel_02.pt


Epoch 4/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=6.340]



Validation after epoch 4:


Validation:   1%|          | 1/100 [00:02<04:12,  2.55s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: — Sì , e il signor Rochester , — disse il signor Rochester , — e il signor Rochester , e il signor Rochester , , e la mano , e , , , , , .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:08,  1.31s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: — Sì !
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:06<03:31,  2.18s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E che si , e ' , e non si , e non si , e non , e non , e non , e non , e non , e non , e non , e non , e non .
--------------------------------------------------------------------------------


Validation:  10%|█         | 10/100 [00:15<02:20,  1.56s/it]


BLEU Score: 0.0000
Word Error Rate: 0.9959
Saved checkpoint to opus_books_weights/tmodel_03.pt


Epoch 5/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=6.424]



Validation after epoch 5:


Validation:   1%|          | 1/100 [00:03<06:01,  3.65s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Il signor Rochester , e il signor Rochester , e il signor Rochester , e il signor Rochester , e il signor Rochester , e il signor Rochester , e il signor Rochester , e il signor Rochester .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:04<03:15,  2.00s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: È un po ’ di un po ’ di un po ’ .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:08<04:54,  3.04s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E il principe si , e , e , e ' , se non si , e non si , e non si , perché non è più , e che non si , e non si , e non si , e non si , e non si , e non è più , e non è più .
----------------------------

Validation:  10%|█         | 10/100 [00:17<02:36,  1.74s/it]


BLEU Score: 0.0000
Word Error Rate: 1.0082
Saved checkpoint to opus_books_weights/tmodel_04.pt


Epoch 6/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.407]



Validation after epoch 6:


Validation:   1%|          | 1/100 [00:02<04:13,  2.56s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: E le mani e i suoi occhi si , e i suoi occhi , e i suoi occhi , , , , , , , , , , in un po ' .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:23,  1.46s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Non vi sono un po ’ di .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:06<03:55,  2.43s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E le , , e li , e li , non si , e ' , non si , e non si , e ' , non si , e ' , non si , e non si , e ' , e non si .
--------------------------------------------------------------------------------


Validation:  10%|█         | 10/100 [00:15<02:20,  1.57s/it]


BLEU Score: 0.0000
Word Error Rate: 0.9672
Saved checkpoint to opus_books_weights/tmodel_05.pt


Epoch 7/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.861]



Validation after epoch 7:


Validation:   1%|          | 1/100 [00:02<04:24,  2.67s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Il signor Rochester si alzò e i suoi occhi , e il signor Rochester , e il signor Rochester , il signor Rochester , il signor Rochester , il signor Rochester , il signor Rochester si , e il signor Rochester si .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:29,  1.53s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Non siete un po ' a un po ' di letto .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:18,  2.67s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E li uomini , , e ' altri , e ' uno principe , e ' altri , li , e ' uno principe , e ' uno principe , non li , e ' uno principe , e ' , non li ; e ' , non li , non li , e ' altro , non li .
-----------

Validation:  10%|█         | 10/100 [00:17<02:34,  1.71s/it]


BLEU Score: 0.0000
Word Error Rate: 1.0615
Saved checkpoint to opus_books_weights/tmodel_06.pt


Epoch 8/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.083]



Validation after epoch 8:


Validation:   1%|          | 1/100 [00:02<04:45,  2.88s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Si alzò e i suoi occhi , e i suoi occhi erano , e la signora Reed , il signor Rochester , il signor Rochester , il signor Rochester , il signor Rochester si , e il signor Rochester si mise a .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:30,  1.53s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Voi siete un po ’ per la porta .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:21,  2.69s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E poi , con la sua vita , e si può essere in modo di quelli che si può essere in modo di quelli che non si può fare , e non li , e non si , e ' , e non si può , e non si può essere mai , e non si , e n

Validation:  10%|█         | 10/100 [00:16<02:25,  1.61s/it]


BLEU Score: 0.0000
Word Error Rate: 0.9959
Saved checkpoint to opus_books_weights/tmodel_07.pt


Epoch 9/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.475]



Validation after epoch 9:


Validation:   1%|          | 1/100 [00:03<06:24,  3.88s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Le signore e le signore si , e il signor Rochester si ; il signor Rochester c ' è un po ' del signor Rochester , il signor Rochester , il signor Rochester , che si in un uomo che si con le donne , si in un po ' d ' un po ' di .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:04<03:13,  1.97s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Voi siete un po ’ per un po ’ a casa .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:08<04:53,  3.03s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E li uomini , per le persone che si può fare , e si in modo che si in uno principe , e non si può fare , se non si può fare , e non si a ' uno principe , non si , e ' uno principe , se non si , e non s

Validation:  10%|█         | 10/100 [00:20<03:02,  2.02s/it]


BLEU Score: 0.0000
Word Error Rate: 1.1557
Saved checkpoint to opus_books_weights/tmodel_08.pt


Epoch 10/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.078]



Validation after epoch 10:


Validation:   1%|          | 1/100 [00:02<04:51,  2.94s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Il signor Rochester si mise a , e il signor Rochester si , e il signor Rochester , il signor Rochester , il signor Rochester è un , che il signor Rochester si , e con un , e la .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:33,  1.57s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Voi siete un po ' di pane .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:26,  2.75s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E per noi , la sua parte , e si può essere in uno stato di quelli che si può fare , e non si può fare , e non si a ' altri , non si , e non si , e non si può , e non si , e non si può , e non si , e no

Validation:  10%|█         | 10/100 [00:18<02:47,  1.86s/it]


BLEU Score: 0.0000
Word Error Rate: 1.0533
Saved checkpoint to opus_books_weights/tmodel_09.pt


Epoch 11/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.697]



Validation after epoch 11:


Validation:   1%|          | 1/100 [00:02<04:52,  2.96s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Si alzò e Saint - John sono , e il signor Rochester è un po ' d ' oro , il signor Rochester , il signor Rochester , che è un po ' di , con le labbra , e le dei capelli .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:29,  1.52s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Tu non puoi andare in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:38,  2.87s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E poi , come si , e si in modo che si può fare in modo di essere in modo , e non si può fare , e non si può fare , se non si può fare , e ' altri , non si può fare , e ' altri , non si può fare , e non

Validation:  10%|█         | 10/100 [00:18<02:44,  1.83s/it]


BLEU Score: 0.0000
Word Error Rate: 1.0984
Saved checkpoint to opus_books_weights/tmodel_10.pt


Epoch 12/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.369]



Validation after epoch 12:


Validation:   1%|          | 1/100 [00:02<04:04,  2.47s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri , e il signor Rochester è un giovane , il signor Bockelhurst , il signor Rochester è un , i capelli , i capelli e i suoi occhi .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:21,  1.44s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Tu hai un po ’ per un po ’ in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:38,  2.87s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E poi , la sua città , e li in uno stato de ' quali , , , , e non si può fare mai , e non si può fare mai , né ' altri , e ' altri , non si può fare , e ' altri , perché non si può fare , e ' altri , e

Validation:  10%|█         | 10/100 [00:21<03:16,  2.18s/it]


BLEU Score: 0.0231
Word Error Rate: 1.0738
New best model (BLEU: 0.0231) saved to opus_books_weights/tmodel_best.pt
Saved checkpoint to opus_books_weights/tmodel_11.pt


Epoch 13/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.024]



Validation after epoch 13:


Validation:   1%|          | 1/100 [00:02<04:38,  2.82s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Le donne e Maria sono ; il signor Rochester è un giovane giovane e il signor Bockelhurst , il signor Rochester è un dei capelli , i capelli , i suoi capelli neri , i capelli di una .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:28,  1.52s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Non vi piace un po ' per la sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:08<05:03,  3.13s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E per noi la sua città , e ci sono in uno stato de ' quali , per essere in modo , per essere in modo , non si può fare , né a ' tempi , né ' tempi , non si può fare , né ' tempi , e ' tempi , non si pu

Validation:  10%|█         | 10/100 [00:19<02:54,  1.94s/it]


BLEU Score: 0.0217
Word Error Rate: 1.1230
Saved checkpoint to opus_books_weights/tmodel_12.pt


Epoch 14/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.036]



Validation after epoch 14:


Validation:   1%|          | 1/100 [00:02<04:26,  2.69s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli e i capelli sono . Il signor Rochester è un uomo giovane , il signor Rochester , il signor Rochester è un dei capelli neri , i capelli neri e i suoi occhi neri , i capelli neri e i suoi .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:15,  1.38s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi prego di andare in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:24,  2.72s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e ci sono in uno stato d ' altri , e a ' altri , per , non si può fare , né a ' tempi , né a ' altri , e ' principi , e ' tempi si , e ' tempi , non si può essere , e ' altri , e n

Validation:  10%|█         | 10/100 [00:17<02:38,  1.77s/it]


BLEU Score: 0.0250
Word Error Rate: 1.0246
New best model (BLEU: 0.0250) saved to opus_books_weights/tmodel_best.pt
Saved checkpoint to opus_books_weights/tmodel_13.pt


Epoch 15/30: 100%|██████████| 913/913 [06:01<00:00,  2.53it/s, loss=4.916]



Validation after epoch 15:


Validation:   1%|          | 1/100 [00:02<04:38,  2.81s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli e Maria sono , e il signor Rochester è un uomo giovane , il signor Rochester è un signore , che si con i capelli neri , i capelli neri e i capelli neri e i capelli neri , che si in una .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:23,  1.47s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi prego di andare in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:24,  2.73s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E per noi la sua città , e in modo di essere in modo , in modo di essere in modo , e , per non fare mai , , non si può , e ' principi , si può essere , e ' uomini , non si può essere , e non si può ess

Validation:  10%|█         | 10/100 [00:16<02:27,  1.64s/it]


BLEU Score: 0.0258
Word Error Rate: 0.9795
New best model (BLEU: 0.0258) saved to opus_books_weights/tmodel_best.pt
Saved checkpoint to opus_books_weights/tmodel_14.pt


Epoch 16/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.725]



Validation after epoch 16:


Validation:   1%|          | 1/100 [00:02<04:42,  2.85s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: Maria Ingram e Maria sono . Il signor Rochester è un uomo giovane , il signor Bockelhurst , il signor Rochester è un signore nero , con i capelli neri , i capelli neri e i suoi capelli neri , che si di una .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:33,  1.56s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Tu hai fatto un po ' di pane in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:08<04:48,  2.97s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e li in modo di essere in modo di essere in Italia , e a ' tempi non si mai , non si può mai , non si può , né ' uomini , e ' tempi si può essere e ' uomini , e non si può essere i

Validation:  10%|█         | 10/100 [00:18<02:44,  1.83s/it]


BLEU Score: 0.0243
Word Error Rate: 1.0451
Saved checkpoint to opus_books_weights/tmodel_15.pt


Epoch 17/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.643]



Validation after epoch 17:


Validation:   1%|          | 1/100 [00:02<04:24,  2.68s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli e Maria sono ; il signor Rochester è un uomo , il signore del signor Rochester , il signore del signor Bockelhurst , come un signore , i capelli neri e i capelli , che gli si di un .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:14,  1.38s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Voi la sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:16,  2.64s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e si in modo di essere in modo , di essere in uno stato di sopra , e a ' altri , non si mai , se non si può essere , e ' principi , e non si può essere , e non si può essere , e no

Validation:  10%|█         | 10/100 [00:17<02:38,  1.76s/it]


BLEU Score: 0.0258
Word Error Rate: 1.0041
New best model (BLEU: 0.0258) saved to opus_books_weights/tmodel_best.pt
Saved checkpoint to opus_books_weights/tmodel_16.pt


Epoch 18/30: 100%|██████████| 913/913 [05:57<00:00,  2.55it/s, loss=3.952]



Validation after epoch 18:


Validation:   1%|          | 1/100 [00:02<03:56,  2.39s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono . Il signor Rochester è un uomo giovane e il signor Mason è un signore , il signore bianco , i capelli neri , i capelli bianchi e i capelli neri , che lo da un .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:01,  1.24s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Avete bisogno di la sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:06<04:04,  2.53s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e li in modo che si a ' altri , per essere in Italia , e per sempre , non si mai , non si può , né ' principi , e ' tempi si può essere ; e non si può essere da ' tempi , e non si 

Validation:  10%|█         | 10/100 [00:16<02:28,  1.65s/it]


BLEU Score: 0.0255
Word Error Rate: 1.0000
Saved checkpoint to opus_books_weights/tmodel_17.pt


Epoch 19/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=5.398]



Validation after epoch 19:


Validation:   1%|          | 1/100 [00:02<04:05,  2.48s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il signor Rochester è un uomo , il signore del signor Mason , che è un signore bianco , i capelli neri e i capelli neri che si con gli occhi dei capelli .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:08,  1.31s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi prego di andare in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:21,  2.70s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e li in modo che si a ' altri , in modo di fare in modo , e a ' altri , non si può fare , né a ' principi , né a ' principi , né a ' principi , né ' tempi si può essere , e ' tempi

Validation:  10%|█         | 10/100 [00:17<02:35,  1.73s/it]


BLEU Score: 0.0258
Word Error Rate: 1.0041
Saved checkpoint to opus_books_weights/tmodel_18.pt


Epoch 20/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.023]



Validation after epoch 20:


Validation:   1%|          | 1/100 [00:02<03:52,  2.35s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il signor Rochester è un uomo , il signor Bockelhurst , il signor Rochester è un signore bianco , i capelli bianchi e i capelli neri di cui lo .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:05,  1.28s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi prego di andare in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:06<04:07,  2.56s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e ci l ’ altra parte del suo stato , in mezzo a ' altra parte sua , e a sempre , non si mai , né a ' principi , non si può essere , né a ' principi , e ' tempi hanno avuto la sua c

Validation:  10%|█         | 10/100 [00:17<02:33,  1.71s/it]


BLEU Score: 0.0255
Word Error Rate: 1.0082
Saved checkpoint to opus_books_weights/tmodel_19.pt


Epoch 21/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=3.875]



Validation after epoch 21:


Validation:   1%|          | 1/100 [00:02<03:55,  2.38s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Mason è un signore , il signore dei capelli neri , come i capelli neri , i capelli neri e i capelli di una .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:02,  1.25s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi sulla sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:25,  2.74s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e si in modo che si in modo , in modo di fare in modo , di essere in modo , e si a ' tempi , non si può fare mai , né le azioni de ' soldati ; e ' principi si e ' tempi , non si pu

Validation:  10%|█         | 10/100 [00:18<02:46,  1.85s/it]


BLEU Score: 0.0263
Word Error Rate: 1.0779
New best model (BLEU: 0.0263) saved to opus_books_weights/tmodel_best.pt
Saved checkpoint to opus_books_weights/tmodel_20.pt


Epoch 22/30: 100%|██████████| 913/913 [06:08<00:00,  2.48it/s, loss=4.754]



Validation after epoch 22:


Validation:   1%|          | 1/100 [00:02<03:58,  2.41s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Mason è un signore , i capelli bianchi e i capelli neri , i capelli bianchi , i capelli di cui lo .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:01,  1.24s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Avete bisogno di nella sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:06<04:05,  2.53s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la sua città , e in modo di essere in modo , in modo d ’ essere in modo , e , per sempre , non mai , non si può fare a ' uomini , né a ' uomini , e ' tempi sono stati stati , e non si può essere 

Validation:  10%|█         | 10/100 [00:16<02:32,  1.69s/it]


BLEU Score: 0.0286
Word Error Rate: 1.0123
New best model (BLEU: 0.0286) saved to opus_books_weights/tmodel_best.pt
Saved checkpoint to opus_books_weights/tmodel_21.pt


Epoch 23/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.668]



Validation after epoch 23:


Validation:   1%|          | 1/100 [00:02<04:04,  2.47s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Rochester è un signore , il signore dei capelli neri , i capelli neri e i capelli neri , che gli si di lui .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:10,  1.33s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi prego di andare in sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:17,  2.66s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E la città , e in modo che si a ' altri , per essere in modo in modo , e per non mai , non si può fare con le azioni delle cose , e ' uomini sono stati , e non si può essere in uno stato , e non si può

Validation:  10%|█         | 10/100 [00:17<02:37,  1.76s/it]


BLEU Score: 0.0266
Word Error Rate: 1.0533
Saved checkpoint to opus_books_weights/tmodel_22.pt


Epoch 24/30: 100%|██████████| 913/913 [05:58<00:00,  2.55it/s, loss=4.505]



Validation after epoch 24:


Validation:   1%|          | 1/100 [00:02<04:26,  2.69s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Bockelhurst , il signor Rochester è un signore rosso , i capelli neri e i capelli neri che si in lui una .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:12,  1.35s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi sulla tavola .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:17,  2.65s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la città , e come l ’ uno de ’ quali si in modo in modo , e si sempre in modo , non si mai , né a ' uomini , né a ' uomini : perché li uomini si a ' tempi , e non si può essere da ' tempi , e non

Validation:  10%|█         | 10/100 [00:18<02:44,  1.83s/it]


BLEU Score: 0.0301
Word Error Rate: 1.0492
New best model (BLEU: 0.0301) saved to opus_books_weights/tmodel_best.pt
Saved checkpoint to opus_books_weights/tmodel_23.pt


Epoch 25/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.167]



Validation after epoch 25:


Validation:   1%|          | 1/100 [00:02<03:53,  2.36s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Mason è un signore , con i capelli neri neri , i capelli neri e i capelli neri che lo in una .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:00,  1.23s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Avete bisogno di nella sala .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:27,  2.76s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la città , e come si l ’ altra parte della sua fortuna , e si in modo in modo d ’ altri , non si mai , né si a ' uomini , né a ' uomini , per non essere a ' tempi , e non si può essere in uno sta

Validation:  10%|█         | 10/100 [00:19<02:54,  1.94s/it]


BLEU Score: 0.0277
Word Error Rate: 1.0820
Saved checkpoint to opus_books_weights/tmodel_24.pt


Epoch 26/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.665]



Validation after epoch 26:


Validation:   1%|          | 1/100 [00:02<04:15,  2.58s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signore del signor Rochester , il signore dei capelli neri , come i capelli neri , i capelli neri e i capelli di cui lo .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:03<02:08,  1.32s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi sulla tavola .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:32,  2.81s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la città , e come si l ’ altra parte della sua fortuna , e si in modo in modo in modo , non si mai , non si può fare a ' uomini , né a ' uomini : e ' tempi si può essere a ' tempi , e non si può 

Validation:  10%|█         | 10/100 [00:18<02:44,  1.82s/it]


BLEU Score: 0.0258
Word Error Rate: 1.0533
Saved checkpoint to opus_books_weights/tmodel_25.pt


Epoch 27/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.499]



Validation after epoch 27:


Validation:   1%|          | 1/100 [00:02<04:09,  2.53s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Mason è un signore , i capelli bianchi e i capelli bianchi , i capelli bianchi , le , e i capelli di cui lo .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:05,  1.28s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi sulla tavola .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:23,  2.71s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E quelli che la città , e in modo di essere in modo , di essere in modo , di essere sempre , e non si può fare né , né ' principi , né ' uomini sono stati ; e ' tempi hanno avuto una città , e non si p

Validation:  10%|█         | 10/100 [00:18<02:44,  1.83s/it]


BLEU Score: 0.0273
Word Error Rate: 1.0738
Saved checkpoint to opus_books_weights/tmodel_26.pt


Epoch 28/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.647]



Validation after epoch 28:


Validation:   1%|          | 1/100 [00:02<04:04,  2.47s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Mason è un signore , con i capelli neri neri , i capelli neri e i capelli neri che lo in una .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:03,  1.26s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi sulla tavola .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:17,  2.65s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la città , e come l ’ uno de ’ quali si in modo di fare in modo , e si sempre , non si mai , non si mai contro alle arme : perché si può essere a ' uomini , e non si può essere , e non si può ess

Validation:  10%|█         | 10/100 [00:17<02:37,  1.75s/it]


BLEU Score: 0.0271
Word Error Rate: 1.0574
Saved checkpoint to opus_books_weights/tmodel_27.pt


Epoch 29/30: 100%|██████████| 913/913 [05:54<00:00,  2.58it/s, loss=4.786]



Validation after epoch 29:


Validation:   1%|          | 1/100 [00:02<04:09,  2.52s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Mason è un signore , i capelli bianchi e i capelli bianchi , i capelli bianchi , i capelli neri , che lo da lui .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:04,  1.27s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi sulla tavola .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:14,  2.63s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la città , e come l ’ uno de ’ quali si in modo in modo , e si sempre in modo , non si mai , non si può fare a ' uomini , né a ' principi , né a ' principi , né a ' tempi sono stati , e non si pu

Validation:  10%|█         | 10/100 [00:17<02:41,  1.79s/it]


BLEU Score: 0.0277
Word Error Rate: 1.0656
Saved checkpoint to opus_books_weights/tmodel_28.pt


Epoch 30/30: 100%|██████████| 913/913 [05:55<00:00,  2.57it/s, loss=4.685]



Validation after epoch 30:


Validation:   1%|          | 1/100 [00:02<04:07,  2.50s/it]

Example 1:
Source: Henry and Frederick Lynn are very dashing sparks indeed; and Colonel Dent is a fine soldierly man. Mr. Eshton, the magistrate of the district, is gentleman-like: his hair is quite white, his eyebrows and whiskers still dark, which gives him something of the appearance of a "pere noble de theatre."
Target: Enrico e Federico Lynn erano elegantissimi, il colonnello Dent mi parve un bel militare, il signor Eshton un magistrato di provincia, con maniere da signore e un aspetto da padre nobile.
Predicted: I capelli neri sono , e il colonnello Dent è un uomo , il signor Mason è un signore , i capelli bianchi e i capelli bianchi , i capelli bianchi , i capelli neri , che lo da lui .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:02<02:03,  1.26s/it]

Example 2:
Source: You must give us a shake-down in the billiard-room."
Target: Ci metterete un pagliericcio nella sala da bigliardo.
Predicted: Vi sulla tavola .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:07<04:10,  2.58s/it]

Example 3:
Source: And whoever shall fortify his town well, and shall have managed the other concerns of his subjects in the way stated above, and to be often repeated, will never be attacked without great caution, for men are always adverse to enterprises where difficulties can be seen, and it will be seen not to be an easy thing to attack one who has his town well fortified, and is not hated by his people.
Target: E qualunque arà bene fortificata la sua terra, e circa li altri governi con li sudditi si fia maneggiato come di sopra è detto e di sotto si dirà, sarà sempre con grande respetto assaltato; perché li uomini sono sempre nimici delle imprese dove si vegga difficultà, né si può vedere facilità assaltando uno che abbi la sua terra gagliarda e non sia odiato dal populo.
Predicted: E noi la città , e come l ’ uno de ’ quali si in modo in modo , e si sempre in modo , non si mai , non si può fare a ' uomini con le arme : e ' principi si a ' tempi , e non si può essere in uno stato 

Validation:  10%|█         | 10/100 [00:17<02:35,  1.73s/it]


BLEU Score: 0.0274
Word Error Rate: 1.0697
Saved checkpoint to opus_books_weights/tmodel_29.pt


In [None]:
# Fix the tokenizer function to create directories
from pathlib import Path
from tokenizers import Tokenizer
from tokenizers.models import WordLevel
from tokenizers.trainers import WordLevelTrainer
from tokenizers.pre_tokenizers import Whitespace

def get_all_sentences(ds, lang):
    for item in ds:
        yield item['translation'][lang]

def get_or_build_improved_tokenizer(config, ds, lang):
    """Build tokenizer with min_frequency=1 to include all words"""
    tokenizer_path = Path(config['tokenizer_file'].format(lang))

    # Create the directory if it doesn't exist
    tokenizer_path.parent.mkdir(parents=True, exist_ok=True)

    if not tokenizer_path.exists():
        # Create tokenizer
        tokenizer = Tokenizer(WordLevel(unk_token="[UNK]"))
        tokenizer.pre_tokenizer = Whitespace()

        # Set min_frequency=1 to include all words, including common ones
        trainer = WordLevelTrainer(
            special_tokens=["[UNK]", "[PAD]", "[SOS]", "[EOS]"],
            min_frequency=1  # Include all words
        )

        tokenizer.train_from_iterator(get_all_sentences(ds, lang), trainer=trainer)
        tokenizer.save(str(tokenizer_path))
        print(f"Created new tokenizer for {lang} with min_frequency=1")
    else:
        tokenizer = Tokenizer.from_file(str(tokenizer_path))
        print(f"Loaded existing tokenizer for {lang}")

    return tokenizer

Loads the saved model from the 18th epoch checkpoint and resumes training for 12 more epochs to reach the complete 30-epoch training.

While the initial 18 epochs were validated using only 10 examples for faster training, this script increases validation to 100 examples for more reliable BLEU score assessment in the final stages.

Includes optimizer state restoration and proper checkpoint saving to preserve training progress.

In [None]:
# Continue training from the 18th epoch to reach the true 30th epoch
from model import build_transformer
import torch
import torch.nn as nn
from torch.utils.tensorboard import SummaryWriter
from tqdm import tqdm
from config import get_config, get_weights_file_path
from pathlib import Path

# 1. Load configuration
config = get_config()
config['model_folder'] = 'weights'
config['tokenizer_file'] = 'vocab/tokenizer_{0}.json'

# 2. Get datasets (use your existing get_improved_ds function)
train_dataloader, val_dataloader, tokenizer_src, tokenizer_tgt = get_improved_ds(config)

# 3. Set device
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"Using device: {device}")

# 4. Build model
model = build_transformer(
    tokenizer_src.get_vocab_size(),
    tokenizer_tgt.get_vocab_size(),
    config['seq_len'],
    config['seq_len'],
    d_model=config['d_model']
).to(device)

# 5. Set up optimizer and scheduler
optimizer = torch.optim.Adam(
    model.parameters(),
    lr=config['lr'],
    betas=(0.9, 0.98),
    eps=1e-9
)

scheduler = torch.optim.lr_scheduler.OneCycleLR(
    optimizer,
    max_lr=config['lr'],
    steps_per_epoch=len(train_dataloader),
    epochs=config['num_epochs'],
    pct_start=0.1,
    div_factor=10,
    final_div_factor=100
)

# 6. Load the last checkpoint (18th epoch)
last_epoch = 18
checkpoint_path = get_weights_file_path(config, f"{last_epoch:02d}")
state = torch.load(checkpoint_path, map_location=device)
model.load_state_dict(state['model_state_dict'])
optimizer.load_state_dict(state['optimizer_state_dict'])
global_step = state['global_step']
print(f"Loaded checkpoint from epoch {last_epoch}")

# 7. Set up TensorBoard
writer = SummaryWriter(config['experiment_name'])

# 8. Loss function with label smoothing
loss_fn = nn.CrossEntropyLoss(
    ignore_index=tokenizer_tgt.token_to_id('[PAD]'),
    label_smoothing=0.1
).to(device)

# 9. Continue training for 12 more epochs
best_bleu = state.get('bleu_score', 0)
for epoch in range(last_epoch, 30):  # Train from epoch 19 to 30
    model.train()
    batch_iterator = tqdm(train_dataloader, desc=f"Epoch {epoch+1}/30")

    # Training phase
    for batch in batch_iterator:
        # Get batch data
        encoder_input = batch['encoder_input'].to(device)
        decoder_input = batch['decoder_input'].to(device)
        encoder_mask = batch['encoder_mask'].to(device)
        decoder_mask = batch['decoder_mask'].to(device)
        label = batch['label'].to(device)

        # Forward pass
        encoder_output = model.encode(encoder_input, encoder_mask)
        decoder_output = model.decode(encoder_output, encoder_mask, decoder_input, decoder_mask)
        proj_output = model.project(decoder_output)

        # Calculate loss
        loss = loss_fn(
            proj_output.view(-1, tokenizer_tgt.get_vocab_size()),
            label.view(-1)
        )

        # Update progress
        batch_iterator.set_postfix({"loss": f"{loss.item():6.3f}"})

        # Log metrics
        writer.add_scalar('train/loss', loss.item(), global_step)
        writer.add_scalar('train/learning_rate', scheduler.get_last_lr()[0], global_step)

        # Backward pass
        loss.backward()

        # Update weights
        optimizer.step()
        optimizer.zero_grad(set_to_none=True)

        # Update learning rate
        scheduler.step()

        global_step += 1

    # Validation phase
    print(f"\nValidation after epoch {epoch+1}:")
    model.eval()

    # Collect validation examples
    sources = []
    targets = []
    predictions = []

    with torch.no_grad():
        # Only process first 10 examples to save time
        for count, batch in enumerate(tqdm(val_dataloader, desc="Validation", total=100)):
            # Hard limit to 10 examples
            if count >= 100:
                break

            # Get batch data
            encoder_input = batch["encoder_input"].to(device)
            encoder_mask = batch["encoder_mask"].to(device)

            # Generate translation with beam search
            model_out = beam_search_decode(
                model, encoder_input, encoder_mask,
                tokenizer_src, tokenizer_tgt,
                config['seq_len'], device
            )

            # Get text
            source_text = batch["src_text"][0]
            target_text = batch["tgt_text"][0]
            model_out_text = tokenizer_tgt.decode(model_out.detach().cpu().numpy())
            model_out_text = model_out_text.replace("[SOS]", "").replace("[EOS]", "").strip()

            # Store for metrics
            sources.append(source_text)
            targets.append(target_text)
            predictions.append(model_out_text)

            # Print examples
            if count < 3:
                print(f"Example {count+1}:")
                print(f"Source: {source_text}")
                print(f"Target: {target_text}")
                print(f"Predicted: {model_out_text}")
                print("-" * 80)

    # Simplified BLEU score calculation (since we had issues with torchmetrics)
    def calculate_bleu(predictions, targets):
        """Simple BLEU approximation"""
        correct = 0
        total = 0
        for pred, tgt in zip(predictions, targets):
            pred_words = set(pred.lower().split())
            tgt_words = set(tgt.lower().split())
            correct += len(pred_words.intersection(tgt_words))
            total += len(tgt_words)
        return correct / total if total > 0 else 0

    bleu_score = calculate_bleu(predictions, targets)
    print(f"BLEU Score: {bleu_score:.4f}")

    # Save model
    model_filename = get_weights_file_path(config, f"{epoch+1:02d}")
    torch.save({
        'epoch': epoch,
        'model_state_dict': model.state_dict(),
        'optimizer_state_dict': optimizer.state_dict(),
        'global_step': global_step,
        'bleu_score': bleu_score
    }, model_filename)
    print(f"Saved checkpoint to {model_filename}")

    # Save best model if better
    if bleu_score > best_bleu:
        best_bleu = bleu_score
        best_model_path = get_weights_file_path(config, "best")
        torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'global_step': global_step,
            'bleu_score': bleu_score
        }, best_model_path)
        print(f"New best model (BLEU: {bleu_score:.4f})")

print("Training complete! The true 30th epoch model has been saved.")

Loading dataset...
Enhancing dataset with common words...
Original dataset size: 32332
Enhanced dataset size: 32432
Building tokenizers...
Loaded existing tokenizer for en
Loaded existing tokenizer for it
Splitting dataset...
Creating datasets...
Using device: cuda
Loaded checkpoint from epoch 18


Epoch 19/30: 100%|██████████| 3649/3649 [07:51<00:00,  7.75it/s, loss=4.345]



Validation after epoch 19:


Validation:   1%|          | 1/100 [00:00<00:30,  3.21it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Io penso .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:04,  1.52it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , per voi non ti — egli disse . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:05,  1.47it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: È un po ’ d ’ acqua ? — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:36<00:00,  1.57s/it]


BLEU Score: 0.2499
Saved checkpoint to opus_books_weights/tmodel_19.pt
New best model (BLEU: 0.2499)


Epoch 20/30: 100%|██████████| 3649/3649 [07:49<00:00,  7.77it/s, loss=4.985]



Validation after epoch 20:


Validation:   1%|          | 1/100 [00:00<00:32,  3.02it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Mi pare così .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:04,  1.53it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , se non sia necessario — egli disse . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:02<01:09,  1.39it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: C ’ è un po ’ — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:46<00:00,  1.66s/it]


BLEU Score: 0.2395
Saved checkpoint to opus_books_weights/tmodel_20.pt


Epoch 21/30: 100%|██████████| 3649/3649 [07:49<00:00,  7.76it/s, loss=5.417]



Validation after epoch 21:


Validation:   1%|          | 1/100 [00:00<00:27,  3.59it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Mi pare così .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<00:56,  1.74it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Questo è necessario per te — disse . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:00,  1.60it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: È un po ’ di pane ? — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:46<00:00,  1.66s/it]


BLEU Score: 0.2513
Saved checkpoint to opus_books_weights/tmodel_21.pt
New best model (BLEU: 0.2513)


Epoch 22/30: 100%|██████████| 3649/3649 [07:50<00:00,  7.76it/s, loss=5.708]



Validation after epoch 22:


Validation:   1%|          | 1/100 [00:00<00:28,  3.47it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Mi pare così .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:01,  1.58it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , per te — disse . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:09,  1.39it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: È un po ’ di pane ? — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [03:49<00:00,  2.30s/it]


BLEU Score: 0.2664
Saved checkpoint to opus_books_weights/tmodel_22.pt
New best model (BLEU: 0.2664)


Epoch 23/30: 100%|██████████| 3649/3649 [07:50<00:00,  7.76it/s, loss=4.695]



Validation after epoch 23:


Validation:   1%|          | 1/100 [00:00<00:32,  3.06it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Non credo .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:00,  1.61it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Questo non può essere da te — egli disse . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:05,  1.49it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: È un po ’ di pane ? — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:45<00:00,  1.66s/it]


BLEU Score: 0.2508
Saved checkpoint to opus_books_weights/tmodel_23.pt


Epoch 24/30: 100%|██████████| 3649/3649 [07:51<00:00,  7.75it/s, loss=3.971]



Validation after epoch 24:


Validation:   1%|          | 1/100 [00:00<00:28,  3.48it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Mi pare .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:02,  1.56it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , per voi , per te — egli ripeté . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:07,  1.44it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: È un po ’ di pane ? — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:55<00:00,  1.76s/it]


BLEU Score: 0.2668
Saved checkpoint to opus_books_weights/tmodel_24.pt
New best model (BLEU: 0.2668)


Epoch 25/30: 100%|██████████| 3649/3649 [07:50<00:00,  7.76it/s, loss=4.952]



Validation after epoch 25:


Validation:   1%|          | 1/100 [00:00<00:28,  3.48it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Mi pare .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:00,  1.61it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , per questo è necessario — egli ripeté . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:09,  1.40it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: È un po ’ di pane ? — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [03:10<00:00,  1.91s/it]


BLEU Score: 0.2659
Saved checkpoint to opus_books_weights/tmodel_25.pt


Epoch 26/30: 100%|██████████| 3649/3649 [07:50<00:00,  7.76it/s, loss=5.185]



Validation after epoch 26:


Validation:   1%|          | 1/100 [00:00<00:29,  3.38it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Mi pare così .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:02,  1.57it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , questo è necessario — egli ripeté . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:10,  1.38it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: È un po ’ del ? — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:53<00:00,  1.74s/it]


BLEU Score: 0.2701
Saved checkpoint to opus_books_weights/tmodel_26.pt
New best model (BLEU: 0.2701)


Epoch 27/30: 100%|██████████| 3649/3649 [07:50<00:00,  7.76it/s, loss=5.098]



Validation after epoch 27:


Validation:   1%|          | 1/100 [00:00<00:32,  3.01it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Non credo .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:09,  1.42it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , questo non è necessario — egli ripeté . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:02<01:08,  1.41it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: C ’ è un telegramma — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [03:04<00:00,  1.84s/it]


BLEU Score: 0.2673
Saved checkpoint to opus_books_weights/tmodel_27.pt


Epoch 28/30: 100%|██████████| 3649/3649 [07:49<00:00,  7.77it/s, loss=3.948]



Validation after epoch 28:


Validation:   1%|          | 1/100 [00:00<00:28,  3.52it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Forse .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:02,  1.58it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Ecco , questo non può essere — egli ripeté .
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:05,  1.48it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: C ’ è un ’ occhiata — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:46<00:00,  1.67s/it]


BLEU Score: 0.2729
Saved checkpoint to opus_books_weights/tmodel_28.pt
New best model (BLEU: 0.2729)


Epoch 29/30: 100%|██████████| 3649/3649 [07:49<00:00,  7.77it/s, loss=4.262]



Validation after epoch 29:


Validation:   1%|          | 1/100 [00:00<00:27,  3.55it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — È così .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:01,  1.59it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Questo è che non vi — egli ripeté . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:04,  1.51it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: C ’ è un telegramma — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:50<00:00,  1.71s/it]


BLEU Score: 0.2814
Saved checkpoint to opus_books_weights/tmodel_29.pt
New best model (BLEU: 0.2814)


Epoch 30/30: 100%|██████████| 3649/3649 [07:50<00:00,  7.75it/s, loss=3.924]



Validation after epoch 30:


Validation:   1%|          | 1/100 [00:00<00:27,  3.55it/s]

Example 1:
Source: 'I suppose so.
Target: — Deve andar bene.
Predicted: — Forse .
--------------------------------------------------------------------------------


Validation:   2%|▏         | 2/100 [00:01<01:04,  1.52it/s]

Example 2:
Source: 'That it would depend on you,' he repeated. 'I want to say...
Target: — Che ciò dipende da voi — ripeté lui. — Io volevo dirvi...
Predicted: — Questo è che tu non sia necessario — egli ripeté . — Io voglio dire ...
--------------------------------------------------------------------------------


Validation:   3%|▎         | 3/100 [00:01<01:04,  1.50it/s]

Example 3:
Source: Have a glass of claret?' said Oblonsky.
Target: Bevete del rosso? — disse Stepan Arkad’ic.
Predicted: C ’ è un telegramma — disse Stepan Arkad ’ ic .
--------------------------------------------------------------------------------


Validation: 100%|██████████| 100/100 [02:53<00:00,  1.74s/it]


BLEU Score: 0.2809
Saved checkpoint to opus_books_weights/tmodel_30.pt
Training complete! The true 30th epoch model has been saved.
