In [2]:
!pip install pytorch_lightning
!pip install lightning
!pip install torch
!pip install torchvision
!pip install datasets
!pip install tokenizers

Collecting pytorch_lightning
  Downloading pytorch_lightning-2.0.8-py3-none-any.whl (727 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/727.0 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m92.2/727.0 kB[0m [31m2.5 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m727.0/727.0 kB[0m [31m11.6 MB/s[0m eta [36m0:00:00[0m
Collecting torchmetrics>=0.7.0 (from pytorch_lightning)
  Downloading torchmetrics-1.1.1-py3-none-any.whl (763 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m763.4/763.4 kB[0m [31m63.7 MB/s[0m eta [36m0:00:00[0m
Collecting lightning-utilities>=0.7.0 (from pytorch_lightning)
  Downloading lightning_utilities-0.9.0-py3-none-any.whl (23 kB)
Installing collected packages: lightning-utilities, torchmetrics, pytorch_lightning
Successfully installed lightning-utilities-0.9.0 pytorch_lightning-2.0.8 torchmetric

### Read the Config file from config.py

In [6]:
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import OneCycleLR
from config import get_config
from lightning_dataset import BilingualLightning
from lightning_model import TransformerLightning
from lightning_train import train_transformer

### Edit the config file to accomodate the batch_size on available GPU machine

In [7]:
from config import get_config


In [8]:
cfg = get_config()

In [9]:
cfg

{'parameter_sharing': False,
 'd_ff': 2048,
 'batch_size': 32,
 'num_epochs': 30,
 'lr': 0.0001,
 'seq_len': 160,
 'd_model': 512,
 'lang_src': 'en',
 'lang_tgt': 'fr',
 'model_folder': 'weights',
 'model_basename': 'tmodel_',
 'preload': True,
 'tokenizer_file': 'tokenizer_{0}.json',
 'rundir': 'runs',
 'experiment_name': 'tmodel_dynamic_padding',
 'ds_mode': 'Online',
 'ds_path': None,
 'ds_name': 'opus_books',
 'save_ds_to_disk': True}

In [10]:
cfg['parameter_sharing'] = True
cfg['d_ff'] = 1024
cfg['batch_size'] = 16
cfg['d_model'] = 512
cfg['preload'] = None
cfg['num_epochs'] = 40
cfg['ds_mode'] = 'Online'
cfg['lang_tgt'] = 'fr'
cfg['save_ds_to_disk'] = False
cfg['experiment_name'] = f"tmodel_dynamic_pad_150_tokens_batch_{cfg['batch_size']}_amp_dff{cfg['d_ff']}"

In [11]:
# updated config
cfg

{'parameter_sharing': True,
 'd_ff': 1024,
 'batch_size': 16,
 'num_epochs': 40,
 'lr': 0.0001,
 'seq_len': 160,
 'd_model': 512,
 'lang_src': 'en',
 'lang_tgt': 'fr',
 'model_folder': 'weights',
 'model_basename': 'tmodel_',
 'preload': None,
 'tokenizer_file': 'tokenizer_{0}.json',
 'rundir': 'runs',
 'experiment_name': 'tmodel_dynamic_pad_150_tokens_batch_16_amp_dff1024',
 'ds_mode': 'Online',
 'ds_path': None,
 'ds_name': 'opus_books',
 'save_ds_to_disk': False}

### Enable the Mixed Precision Training

In [12]:
torch.cuda.amp.autocast(enabled=True)

<torch.cuda.amp.autocast_mode.autocast at 0x7ddaea1ef4f0>

In [13]:
torch.set_float32_matmul_precision('medium')

### Train the model

In [14]:
opus_fr = BilingualLightning(cfg)
opus_fr.prepare_data()
opus_fr.setup()
train_data_loader = opus_fr.train_dataloader()

Downloading builder script:   0%|          | 0.00/6.08k [00:00<?, ?B/s]

Downloading metadata:   0%|          | 0.00/161k [00:00<?, ?B/s]

Downloading readme:   0%|          | 0.00/20.5k [00:00<?, ?B/s]

Downloading data:   0%|          | 0.00/12.0M [00:00<?, ?B/s]

Generating train split:   0%|          | 0/127085 [00:00<?, ? examples/s]

In [15]:
tokenizer_src = opus_fr.tokenizer_src
tokenizer_tgt = opus_fr.tokenizer_tgt
loss_criterion = nn.CrossEntropyLoss(ignore_index=tokenizer_src.token_to_id('[PAD]'), label_smoothing=0.1)
transformer_model = TransformerLightning(cfg, loss_criterion, tokenizer_src, tokenizer_tgt, num_validation_examples=2, epochs = cfg['num_epochs'])
optimizer = torch.optim.Adam(transformer_model.model.parameters(), lr=cfg['lr'], eps=1e-9)
transformer_model.set_optimizer(optimizer)

scheduler = OneCycleLR(
    optimizer,
    max_lr=1E-3,
    steps_per_epoch=len(train_data_loader),
    epochs=cfg['num_epochs'],
    pct_start=5/cfg['num_epochs'],
    div_factor=10,
    three_phase=True,
    final_div_factor=10,
    anneal_strategy='linear'
)
transformer_model.set_scheduler_dict(scheduler, freq = 'step')

Total Parameters: 61847890


In [None]:
train_transformer(transformer_model, opus_fr, cfg, epochs=cfg['num_epochs'])

  rank_zero_warn(
INFO:pytorch_lightning.utilities.rank_zero:Using 16bit Automatic Mixed Precision (AMP)
INFO:pytorch_lightning.utilities.rank_zero:GPU available: True (cuda), used: True
INFO:pytorch_lightning.utilities.rank_zero:TPU available: False, using: 0 TPU cores
INFO:pytorch_lightning.utilities.rank_zero:IPU available: False, using: 0 IPUs
INFO:pytorch_lightning.utilities.rank_zero:HPU available: False, using: 0 HPUs
INFO:pytorch_lightning.accelerators.cuda:LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]
INFO:pytorch_lightning.callbacks.model_summary:
  | Name           | Type             | Params
----------------------------------------------------
0 | loss_criterion | CrossEntropyLoss | 0     
1 | model          | Transformer      | 61.8 M
----------------------------------------------------
61.8 M    Trainable params
0         Non-trainable params
61.8 M    Total params
247.392   Total estimated model params size (MB)
  rank_zero_warn(


Training: 0it [00:00, ?it/s]

Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: Listen!"
    TARGET: Écoutez…
 PREDICTED: !
*****************************************

*****************************************
    SOURCE: As the "Bonadventure" no longer existed, six months at least would be required for the construction of a new vessel.
    TARGET: Le Bonadventure n'existant plus, six mois, au moins, seraient nécessaires pour la construction d'un nouveau navire.
 PREDICTED: Quant à le marin , ne s ' est pas six mois , six mois de l ' heure d ' un vent .
*****************************************





Epoch 0: train_loss=4.8208


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: Others also appeared.
    TARGET: D'autres parurent.
 PREDICTED: D ' autres , tout était .
*****************************************

*****************************************
    SOURCE: "The frigate?" Conseil replied, rolling over on his back. "I think master had best not depend on it to any great extent!"
    TARGET: -- La frégate ! répondit Conseil en se retournant sur le dos, je crois que monsieur fera bien de ne pas trop compter sur elle !
 PREDICTED: -- La frégate ? répondit Conseil en se penchant sur son chemin . Je crois que ce n ' en en avait pas de plus de temps !
*****************************************

Epoch 1: train_loss=4.0434


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: But their stomachs were torn by cramp, and they both realized that they were dying of hunger.
    TARGET: Mais des crampes leur déchirerent l'estomac, tous deux s'aperçurent qu'ils mouraient de faim.
 PREDICTED: Mais leur était par , et ils se de faim .
*****************************************

*****************************************
    SOURCE: For her fees as above . . . . . . . . . . . . 5#, 5s., 0d.
    TARGET: 5. Pour ses honoraires, comme ci-dessus: 5£ 5 s.
 PREDICTED: Pour elle , pour elle - même ; le 5 s ' .
*****************************************

Epoch 2: train_loss=4.1624


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: "I know that beforehand."
    TARGET: -- J'en suis sûr d'avance!
 PREDICTED: -- Je sais que d ' avance .
*****************************************

*****************************************
    SOURCE: Maheude made a gesture of despair.
    TARGET: La Maheude eut un geste désespéré.
 PREDICTED: La Maheude fit un geste désespéré .
*****************************************

Epoch 3: train_loss=3.7926


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: With a furious, unreasoning blow of the fist he knocked the child down beside the body.
    TARGET: D'un coup de poing irraisonné, furieux, il abattit l'enfant pres du corps.
 PREDICTED: Avec une furieuse , du poing , il frappa l ' enfant au corps .
*****************************************

*****************************************
    SOURCE: Fire often, but with a sure aim.
    TARGET: Tirons souvent, mais tirons juste.
 PREDICTED: Toujours même feu , mais avec un air sûr .
*****************************************

Epoch 4: train_loss=3.4406


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: I have seen the boy again and again with his bundle.
    TARGET: J’ai vu et revu l’enfant avec son paquet.
 PREDICTED: J ' ai vu le garçon et encore avec son paquet .
*****************************************

*****************************************
    SOURCE: Now the North had triumphed in the good cause, how welcome would have been a newspaper to the exiles in Lincoln Island!
    TARGET: Ah! Qu'un journal eût été le bienvenu pour les exilés de l'île Lincoln!
 PREDICTED: Or , le nord avait été été habitée , comme l ' on eût été un journal pour dans l ' île Lincoln !
*****************************************

Epoch 5: train_loss=3.1109


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: Felton named Lord de Winter; the unknown would not name anybody, and pretended that it was to the duke alone he would make himself known.
    TARGET: Felton nomma le baron de Winter, l'inconnu ne voulut nommer personne, et prétendit que c'était au duc seul qu'il pouvait se faire connaître.
 PREDICTED: Felton appela Lord de Winter ; l ' inconnu n ' était pas homme , et fit semblant de le duc seul qu ' il se fît connaître .
*****************************************

*****************************************
    SOURCE: Elles sont toutes les deux de la Compagnie des paquebots Guion et se rapportent au départ de ses bateaux, de Liverpool.
    TARGET: They are both from the Guion Steamship Company, and refer to the sailing of their boats from Liverpool.
 PREDICTED: They are both of the of the and at the departure of his boats , of Liverpool , Liverpool .
*****************************************

Epoch 6: train_loss=2.7150


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: "They'll feed it during our absence.
    TARGET: -- On le nourrira pendant notre absence.
 PREDICTED: — On le pendant notre absence .
*****************************************

*****************************************
    SOURCE: "But people themselves alter so much, that there is something new to be observed in them for ever."
    TARGET: – Oui, mais les gens eux-memes changent tellement qu’il y a toujours du nouveau a observer.
 PREDICTED: Mais on se dérange tant , c ’ est quelque chose nouveau pour les observer à jamais .
*****************************************

Epoch 7: train_loss=2.3347


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: He had given the conversation a turn of melancholy philosophy.
    TARGET: Il avait donné à la conversation un tour de philosophie mélancolique.
 PREDICTED: Il avait donné la conversation à un tour de mélancolique .
*****************************************

*****************************************
    SOURCE: And there are several of the young men, too, that she likes very much.
    TARGET: Il y avait aussi plusieurs jeunes gens qui lui plaisaient beaucoup.
 PREDICTED: Et il y a plusieurs des jeunes gens , trop elle aime beaucoup .
*****************************************

Epoch 8: train_loss=2.4169


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: It was impossible to doubt it; the child did not know how to write.
    TARGET: Il était impossible d’en douter ; l’enfant ne savait pas écrire.
 PREDICTED: Il était impossible de le dire ; l ’ enfant ne savait comment écrire .
*****************************************

*****************************************
    SOURCE: At last the three horses started; and it was the general opinion that he had not shown himself at all obliging.
    TARGET: Enfin les trois chevaux détalèrent, et l’on trouva généralement qu’il n’avait point montré de complaisance.
 PREDICTED: Enfin , les trois chevaux partirent , et c ' était l ' opinion publique qu ' il n ' avait pas témoigné elle - même à tout .
*****************************************

Epoch 9: train_loss=2.0600


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: "Of course."
    TARGET: -- Parbleu !
 PREDICTED: -- Sans doute .
*****************************************

*****************************************
    SOURCE: "Yes, yes; you have already given me that reason, and I find it excellent."
    TARGET: -- Oui, oui, vous m'avez déjà donné cette raison, et je la trouve excellente.
 PREDICTED: -- Oui , oui ; vous m ' avez déjà donné cette raison , et je la trouve excellente .
*****************************************

Epoch 10: train_loss=2.1020


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: Poor girl! She had handsome teeth, she was fond of laughing and displaying them.
    TARGET: Pauvre fille ! – Elle avait de jolies dents, elle aimait à rire pour les faire voir.
 PREDICTED: Pauvre fille ! elle avait beau les dents , elle aimait de rire et les occupe .
*****************************************

*****************************************
    SOURCE: "But on what day will this ball take place?" asked Anne of Austria.
    TARGET: -- Mais quel jour ce bal aura-t-il lieu?» demanda Anne d'Autriche.
 PREDICTED: -- Mais , ce jour - là , cette balle va - t - elle ? demanda Anne d ' Autriche .
*****************************************

Epoch 11: train_loss=1.9968


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: Imagine that Marguerite is married, and deceive the husband; that is all.
    TARGET: Supposez que Marguerite est mariée, et trompez le mari, voilà tout.
 PREDICTED: Que l ' on juge de Marguerite est mariée et que tout le mari , c ' est tout .
*****************************************

*****************************************
    SOURCE: An hour passed.
    TARGET: Une heure s'écoula.
 PREDICTED: Une heure se passa .
*****************************************

Epoch 12: train_loss=2.1409


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: The daylight came.
    TARGET: Le jour arriva enfin.
 PREDICTED: Le jour vint .
*****************************************

*****************************************
    SOURCE: But, on the contrary, if you find it to be true, I am persuaded you are too well acquainted with the principles of the laws of society, humanity, and justice, not to use us courteously, and suffer us to depart unhurt."
    TARGET: Mais, si je vous ai dit la vérité, vous connaissez trop les principes du droit public, les moeurs, et les lois, pour ne nous pas faire grâce.
 PREDICTED: Mais , au contraire , si vous le prenez pour , je suis sure que vous en connaissiez autant que les lois de l ' humanité , la justice , la justice , ne nous servir pas d ' agréable et agréable pour nous laisser certainement de sa santé .
*****************************************

Epoch 13: train_loss=2.0259


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: "I have your promise, gentlemen?" added Captain Nemo.
    TARGET: «J'ai votre promesse, messieurs? Ajouta le capitaine Nemo.
 PREDICTED: -- J ' ai votre parole , messieurs ? ajouta le capitaine Nemo .
*****************************************

*****************************************
    SOURCE: There was no putting off the day that advanced--the bridal day; and all preparations for its arrival were complete. _I_, at least, had nothing more to do: there were my trunks, packed, locked, corded, ranged in a row along the wall of my little chamber; to-morrow, at this time, they would be far on their road to London: and so should I (D.V.),--or rather, not I, but one Jane Rochester, a person whom as yet I knew not.
    TARGET: il n'y avait plus moyen de reculer le jour du mariage, tout était prêt. Moi, du moins, je n'avais plus rien à faire; mes malles étaient fermées, ficelées et rangées le long du mur de ma petite chambre; le lendemain

Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: Let us take some heed of the welfare of her dear Buckingham.
    TARGET: Soignons un peu la santé de son cher Buckingham.
 PREDICTED: Allons - en prendre l ' estime de son cher Buckingham .
*****************************************

*****************************************
    SOURCE: Singularly enough, Ayrton did not acknowledge the receipt of the despatch, as he was accustomed to do.
    TARGET: Chose singulière, Ayrton n'accusa pas réception de la dépêche, ainsi qu'il avait l'habitude de le faire.
 PREDICTED: assez , Ayrton ne pas la promesse de la dépêche , comme il avait coutume de faire .
*****************************************

Epoch 15: train_loss=1.9422


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: It was the coin which the man in the black mantle had given to Phoebus.
    TARGET: C’était la pièce que l’homme au manteau noir avait donnée à Phœbus.
 PREDICTED: C ’ était la monnaie que l ’ homme au manteau noir avait donné à Phœbus .
*****************************************

*****************************************
    SOURCE: In class, Jasmin related his night adventure.
    TARGET: En classe, Jasmin raconta son aventure de la nuit :
 PREDICTED: Dans la classe , Jasmin raconta son aventure .
*****************************************

Epoch 16: train_loss=2.2064


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: The conversation between the friends was endless; Korasoff was in raptures: never had a Frenchman given him so long a hearing.
    TARGET: La conversation entre les deux amis fut infinie ; Korasoff était ravi : jamais un Français ne l’avait écouté aussi longtemps.
 PREDICTED: La conversation entre les amis était infinie , c ’ était Korasoff : jamais un Français ne l ’ avait donné tant de longtemps .
*****************************************

*****************************************
    SOURCE: At the sixth he began to reflect that the search was rather dubious.
    TARGET: Au sixième, il commença de réfléchir que la recherche était un peu hasardée.
 PREDICTED: Au sixième , il se mit a réfléchir , que la recherche d ' un air assez louche .
*****************************************

Epoch 17: train_loss=2.0881


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: The horror of death reanimated her,−−
    TARGET: L’horreur de la mort la ranima.
 PREDICTED: L ’ horreur de la mort lui :
*****************************************

*****************************************
    SOURCE: Going close by a bench on the breakwater he sat down, tired already ofwalking and out of humour with his stroll before he had taken it.
    TARGET: Comme il frôlait un banc sur le brise-lames, il s'assit, déjà las demarcher et dégoûté de sa promenade avant même de l'avoir faite.
 PREDICTED: Il se tenait à un banc , sur le brise - lames , déjà las et de l ' air d ' être mis à la promenade , avant qu ' il l ' eût .
*****************************************

Epoch 18: train_loss=1.8016


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: A very good workman, he could speak well, put himself at the head of every opposition, and had at last become the chief of the discontented.
    TARGET: Tres bon ouvrier, il parlait bien, se mettait a la tete de toutes les réclamations, avait fini par etre le chef des mécontents.
 PREDICTED: Un bon ouvrier , on pouvait parler , se mettait a la tete , en tete de tous , en finit par faire de la .
*****************************************

*****************************************
    SOURCE: He redoubled his attention.
    TARGET: Il redoubla d’attention.
 PREDICTED: Il redoubla d ' attention .
*****************************************

Epoch 19: train_loss=2.0021


Validation: 0it [00:00, ?it/s]

*****************************************
    SOURCE: Sometimes bending over the forecastle railings, sometimes leaning against the sternrail, I eagerly scoured that cotton-colored wake that whitened the ocean as far as the eye could see!
    TARGET: Tantôt penché sur les bastingages du gaillard d'avant, tantôt appuyé à la lisse de l'arrière, je dévorais d'un oeil avide le cotonneux sillage qui blanchissait la mer jusqu'à perte de vue !
 PREDICTED: Parfois , par le gaillard des deux grilles , tantôt , je avec ardeur à l ' du haut que l ' Océan même pouvait voir !
*****************************************

*****************************************
    SOURCE: They had recognized Quasimodo.
    TARGET: On avait reconnu Quasimodo.
 PREDICTED: On avait reconnu Quasimodo .
*****************************************

