This notebook is to test the vanilla transformer training and validation task for language translation

In [1]:
%autosave 300
%reload_ext autoreload
%autoreload 2
%config Completer.use_jedi = False

Autosaving every 300 seconds


In [2]:
import os

os.chdir("/mnt/batch/tasks/shared/LS_root/mounts/clusters/insights-model-run2/code/Users/soutrik.chowdhury/EraV2_Transformers")
print(os.getcwd())

/mnt/batch/tasks/shared/LS_root/mounts/clusters/insights-model-run2/code/Users/soutrik.chowdhury/EraV2_Transformers


In [3]:
from S16_code.config import get_config, get_weights_file_path
from S16_code.model import build_transformer
import torch
from S16_code.dataloader import get_ds
from S16_code.trainer import run_validation_loop, run_training_loop, save_model
from datasets import load_dataset
import torch.optim as optim
import torch.nn as nn

In [4]:
device = get_config()["device"]
print(device)

cuda


In [5]:
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name())
print(torch.cuda.memory_allocated())
print(torch.cuda.memory_reserved())
print(torch.cuda.get_device_name(device.index))
print(torch.cuda.get_device_properties(device.index).total_memory / 1024**3)
print(torch.cuda.memory_summary(device=device.index))
print(torch.cuda.get_device_capability(device.index))
print(torch.cuda.get_device_properties(device.index))

True
0
Tesla V100-PCIE-16GB
0
0
Tesla V100-PCIE-16GB
15.7725830078125
|                  PyTorch CUDA memory summary, device ID 0                 |
|---------------------------------------------------------------------------|
|            CUDA OOMs: 0            |        cudaMalloc retries: 0         |
|        Metric         | Cur Usage  | Peak Usage | Tot Alloc  | Tot Freed  |
|---------------------------------------------------------------------------|
| Allocated memory      |      0 B   |      0 B   |      0 B   |      0 B   |
|       from large pool |      0 B   |      0 B   |      0 B   |      0 B   |
|       from small pool |      0 B   |      0 B   |      0 B   |      0 B   |
|---------------------------------------------------------------------------|
| Active memory         |      0 B   |      0 B   |      0 B   |      0 B   |
|       from large pool |      0 B   |      0 B   |      0 B   |      0 B   |
|       from small pool |      0 B   |      0 B   |      0 B   |      0 

In [6]:
ds_raw = load_dataset(
    get_config()["datasource"],
    f"{get_config()['src_lang']}-{get_config()['tgt_lang']}",
    split="train",
)
print(len(ds_raw))

32332


In [7]:
train_dataloader, val_dataloader, tokenizer_src, tokenizer_tgt = get_ds(
    ds_raw, get_config()
)

Building tokenizer for en
Building tokenizer for it
Max length of source sentence: 309
Max length of target sentence: 274


In [8]:
for data in train_dataloader:
    print(data['encoder_input'].shape)
    print(data['decoder_input'].shape)
    print(data['encoder_mask'].shape)
    print(data['decoder_mask'].shape)
    break

torch.Size([16, 350])
torch.Size([16, 350])
torch.Size([16, 1, 1, 350])
torch.Size([16, 1, 350, 350])


In [9]:
for data in val_dataloader:
    print(data['encoder_input'].shape)
    print(data['decoder_input'].shape)
    print(data['encoder_mask'].shape)
    print(data['decoder_mask'].shape)
    break

torch.Size([1, 350])
torch.Size([1, 350])
torch.Size([1, 1, 1, 350])
torch.Size([1, 1, 350, 350])


In [10]:
print(tokenizer_src.get_vocab_size(), tokenizer_tgt.get_vocab_size())

15698 22463


In [11]:
transformer_model = build_transformer(
    src_vocab_size=tokenizer_src.get_vocab_size(),
    tgt_vocab_size=tokenizer_tgt.get_vocab_size(),
).to(device)

In [12]:
print(torch.cuda.memory_summary(device=device.index))

|                  PyTorch CUDA memory summary, device ID 0                 |
|---------------------------------------------------------------------------|
|            CUDA OOMs: 0            |        cudaMalloc retries: 0         |
|        Metric         | Cur Usage  | Peak Usage | Tot Alloc  | Tot Freed  |
|---------------------------------------------------------------------------|
| Allocated memory      | 295276 KiB | 295276 KiB | 295276 KiB |      0 B   |
|       from large pool | 219812 KiB | 219812 KiB | 219812 KiB |      0 B   |
|       from small pool |  75464 KiB |  75464 KiB |  75464 KiB |      0 B   |
|---------------------------------------------------------------------------|
| Active memory         | 295276 KiB | 295276 KiB | 295276 KiB |      0 B   |
|       from large pool | 219812 KiB | 219812 KiB | 219812 KiB |      0 B   |
|       from small pool |  75464 KiB |  75464 KiB |  75464 KiB |      0 B   |
|---------------------------------------------------------------

In [13]:
!nvidia-smi

Sun Jun  9 05:45:25 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.161.08             Driver Version: 535.161.08   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  Tesla V100-PCIE-16GB           On  | 00000001:00:00.0 Off |                    0 |
| N/A   29C    P0              36W / 250W |    604MiB / 16384MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

In [14]:
optimizer = optim.Adam(transformer_model.parameters(), lr=get_config()["learning_rate"])
loss_fn = nn.CrossEntropyLoss(
    ignore_index=tokenizer_src.token_to_id("[PAD]"), label_smoothing=0.1
)
global_step = 0

In [15]:
for epoch in range(get_config()["num_epochs"]):
    print(f"Epoch {epoch + 1}")
    torch.cuda.empty_cache()
    epoch_loss, global_step = run_training_loop(
        transformer_model,
        train_dataloader,
        tokenizer_tgt,
        optimizer,
        loss_fn,
        device,
        global_step,
    )
    print(f"Epoch loss: {epoch_loss}")
    run_validation_loop(
        transformer_model,
        val_dataloader,
        tokenizer_src,
        tokenizer_tgt,
        device,
        get_config()["seq_len"],
        2,
    )
    model_path = get_weights_file_path(get_config(), epoch)
    save_model(epoch, transformer_model, optimizer, global_step, model_path)

Epoch 1


Training:   0%|                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               | 0/1819 [00:00<?, ?it/s]

Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [12:11<00:00,  2.49it/s, loss=5.698]


Epoch loss: 5.697751522064209


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<09:46,  5.51it/s]

SOURCE: How and where is he?
TARGET: Dov'è?
PREDICTED: — Ma , — disse il viso .


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<35:22,  1.52it/s]


SOURCE: I rushed to the chair in which he sat.
TARGET: Mi precipitai verso la poltrona su cui sedeva sempre.
PREDICTED: Ma , che non non non non non non non non non non non non non non non non non non non è stato più di .
Epoch 2


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [11:56<00:00,  2.54it/s, loss=5.915]


Epoch loss: 5.914846420288086


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 1/3234 [00:06<5:42:38,  6.36s/it]

SOURCE: I did not so much as pray to be delivered from it or think of it; it was all of no consideration in comparison to this.
TARGET: Che quanto al vivere in solitudine, ciò era un nulla; non pensai nemmeno a pregar Dio per esserne liberato o a fermarmi su tal desiderio; tutto era di nessuna importanza a confronto dell’altra liberazione.
PREDICTED: Ma , non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non si , ma non poteva , ma non si , ma non si , ma non si , ma non poteva , ma non si , m

Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 1/3234 [00:06<5:58:25,  6.65s/it]


SOURCE: She felt herself crushed and her face expressed it.
TARGET: Si sentiva stroncata e il suo viso lo rivelava.
PREDICTED: — Sì , signore , — disse la signora Stahl , e non è a dire .
Epoch 3


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [11:52<00:00,  2.55it/s, loss=5.976]


Epoch loss: 5.976038932800293


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<06:30,  8.29it/s]

SOURCE: "Cease that chatter, blockhead! and do my bidding."
TARGET: — Cessate il vostro chiacchierìo stupido e ubbidite.
PREDICTED: — E non può essere ?


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<14:25,  3.73it/s]


SOURCE: He took out a cigar, and with one hand on his glass he continued: 'Give me some advice.'
TARGET: Dimmi tu sinceramente — continuò — dopo aver tirato fuori un sigaro e tenendo la coppa con una mano — dammi un consiglio.
PREDICTED: — E non può essere più .
Epoch 4


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [11:52<00:00,  2.55it/s, loss=5.730]


Epoch loss: 5.729567527770996


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 1/3234 [00:06<5:37:39,  6.27s/it]

SOURCE: "We must become one flesh without any delay, Jane: there is but the licence to get--then we marry."
TARGET: — Bisogna che siamo subito una cosa sola. Appena ottenuta la licenza ci sposeremo.
PREDICTED: — Sì , — disse il Grifone , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — 

Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 1/3234 [00:12<11:18:22, 12.59s/it]


SOURCE: So Levin stayed to tea, though his bright spirits had quite vanished and he felt ill at ease.
TARGET: Levin rimase lì fino al tè, ma la sua allegria era scomparsa e si sentiva ormai a disagio.
PREDICTED: E che non si era un ’ era un uomo , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e , e ,
Epoch 5


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [12:00<00:00,  2.52it/s, loss=5.994]


Epoch loss: 5.994068145751953


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 1/3234 [00:06<5:29:53,  6.12s/it]

SOURCE: 'No! If it were unjust, you could not use such advantages with pleasure; at any rate I could not.
TARGET: — No, se questo fosse ingiusto, tu non potresti usufruire con piacere di questi beni, almeno io non potrei.
PREDICTED: — No , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , 

Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 1/3234 [00:12<11:08:38, 12.41s/it]


SOURCE: She stood talking to a lady at the other end of the lake.
TARGET: Lei stava in piedi, parlando con una signora, all’estremo opposto del campo.
PREDICTED: — No , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , —

Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [11:56<00:00,  2.54it/s, loss=6.015]


Epoch loss: 6.0147905349731445


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<09:32,  5.64it/s]

SOURCE: "Mr. Rochester, I will _not_ be yours."
TARGET: — Signor Rochester, non voglio esser vostra.
PREDICTED: — Sì , signore , signore , — disse .


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<22:04,  2.44it/s]


SOURCE: "Your bride stands between us."
TARGET: — La vostra fidanzata sta fra noi.
PREDICTED: — Sì , signore , signore .
Epoch 7


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [11:55<00:00,  2.54it/s, loss=5.744]


Epoch loss: 5.743694305419922


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 1/3234 [00:06<5:38:48,  6.29s/it]

SOURCE: THE PRINCESS SAT IN HER ARMCHAIR silently smiling, and the Prince seated himself beside her. Kitty stood close to her father's chair, still holding his hand.
TARGET: La principessa sedeva in poltrona, tacendo e sorridendo; il principe le stava accanto; Kitty stava presso la poltrona del padre senza lasciargli la mano.
PREDICTED: — Sì , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — di

Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 1/3234 [00:12<11:10:00, 12.43s/it]


SOURCE: The next day, which was Friday, we got them all together, and met in the evening to pack.
TARGET: Il giorno dopo, che era venerdì, li mettemmo insieme, e ci riunimmo la sera per fare i bagagli.
PREDICTED: — Sì , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , 

Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [12:11<00:00,  2.49it/s, loss=5.708]


Epoch loss: 5.707733631134033


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<06:35,  8.17it/s]

SOURCE: And it's all not the thing, not the thing!'
TARGET: E tutto questo non è quel che dovrebbe essere, non è!
PREDICTED: — Ma , — disse .


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<18:40,  2.89it/s]


SOURCE: Noticing Laska's peculiar manner of searching, as lowering her body almost to the ground she appeared to be dragging her broad hind paws, he knew that she was pointing at snipe, and while running up to her he prayed inwardly for success, especially with the first bird.
TARGET: Notato questo speciale braccare di Laska (essa si stringeva tutta al terreno, come se avanzasse a grandi passi raccogliendo con le zampe posteriori, e apriva leggermente la bocca), Levin capì che fiutava le beccacce e, pregando Iddio per il successo, in particolare per il primo uccello, corse verso di essa.
PREDICTED: — Ma , — disse , — disse Stepan Arkad ’ ic .
Epoch 9


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [12:00<00:00,  2.53it/s, loss=5.761]


Epoch loss: 5.761355400085449


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<11:05,  4.86it/s]

SOURCE: Feeling without judgment is a washy draught indeed; but judgment untempered by feeling is too bitter and husky a morsel for human deglutition.
TARGET: Il sentimento senza il criterio è una bevanda insipida, ma il criterio senza il sentimento è troppo amaro e troppo aspro perché l'uomo possa inghiottirlo.
PREDICTED: — Sì , — disse , — disse , — disse .


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 1/3234 [00:00<25:31,  2.11it/s]


SOURCE: I was surprised with this at first, but soon concluded it must be done by the earthquake; and as by this violence the ship was more broke open than formerly, so many things came daily on shore, which the sea had loosened, and which the winds and water rolled by degrees to the land.
TARGET: La cosa mi fece stupore alla prima, ma conchiusi tosto esser questa una conseguenza del tremuoto; e poichè in forza di tale sconquasso lo scheletro del vascello rimase più sbandato di prima, arrivavano di giorno in giorno alla spiaggia molte cose che il mare avea poste in libertà, e che i venti e l’acqua mandavano a riva di mano in mano.
PREDICTED: — Ma che cosa cosa non è più che non è più di .
Epoch 10


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1819/1819 [11:55<00:00,  2.54it/s, loss=5.959]


Epoch loss: 5.959231853485107


Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 1/3234 [00:06<5:24:21,  6.02s/it]

SOURCE: He rose and went toward the door.
TARGET: Si alzò e si diresse verso la porta.
PREDICTED: — Sì , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signore , signo

Validation:   0%|▎                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 1/3234 [00:12<10:57:45, 12.21s/it]


SOURCE: It was the manner in which all this, and much more, was said—it was the apparent heart that went with his request—which allowed me no room for hesitation; and I accordingly obeyed forthwith what I still considered a very singular summons.
TARGET: Era il tono con cui eran dette tutte queste cose e ben altre ancora, era quell'espansione d'un cuore supplichevole, che non mi permetteva d'esitare; quindi obbedii, immediatamente a quello che consideravo tuttavia come uno degli inviti più singolari.
PREDICTED: — No , non mi , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse , — disse

# Next steps: 
* Check prediction loss for both tran and val
* add metrics from torch metrics
* add tensorboard logging
* add gradient clipping
* add learning rate scheduler
* add AMP - automatic mixed precision
* add distributed training
* add model parallelism
* add data parallelism
* add pipeline parallelism
* add checkpointing
* add model optimization
* add best prediction mechanism
* Application of gelu
  