# NEURAL MACHINE TRANSLATION - LSTM

## Required Module & Config files

In [1]:
import src.LSTM as lstmNMT
from src.Tokenizer import Corpus, LangData, dataLoader
from src.utils import load_config, translate_sentece, get_device, train_model
from torch.nn import CrossEntropyLoss
from torch.optim import NAdam
import numpy as np

In [2]:
from src.utils import torch_bleu_score

In [3]:
# Loading config file
config = load_config()
# Get device : GPU/MPS Back-End/CPU
device = get_device()
print(f"Using device: {device}")

Using device: mps


## Data Preprocessing

In [4]:
# # TRAIN_DATA
# preprocess_data(config.TRAIN_RAW, config.TRAIN_DATA, config.TRAIN_AFRIKAANS, "afrikaans")
# preprocess_data(config.TRAIN_RAW, config.TRAIN_DATA, config.TRAIN_ENGLISH, "english")

In [5]:
# # VAL_DATA
# preprocess_data(config.VAL_RAW, config.VAL_DATA, config.VAL_AFRIKAANS, "afrikaans")
# preprocess_data(config.VAL_RAW, config.VAL_DATA, config.VAL_ENGLISH, "english")

## Load the dataset

In [6]:
# Encoder-Source
english_data = Corpus(f"{config.TRAIN_DATA}/english.txt", "English")
afrikaans_data = Corpus(f"{config.TRAIN_DATA}/afrikaans.txt", "Afrikaans")

## Set Hyperparameters

In [14]:
# Encoder - source
IN_ENCODER = english_data.vocab_size
ENCODER_EMB = 128

# Decoder - target
IN_DECODER = afrikaans_data.vocab_size
OUT_DECODER = afrikaans_data.vocab_size
DECODER_EMB = 128

# Shared
HIDDEN_SIZE = 1024
NUM_LAYERS = 2

EPOCHS = 20
LR = 1e-5
BATCH_SIZE = 128

## Set the model

In [8]:
encoder_net = lstmNMT.Encoder(IN_ENCODER, ENCODER_EMB, HIDDEN_SIZE, NUM_LAYERS).to(device)
decoder_net = lstmNMT.Decoder(IN_DECODER, DECODER_EMB, HIDDEN_SIZE, NUM_LAYERS).to(device)
model = lstmNMT.LSTM_NMT(encoder_net, decoder_net, OUT_DECODER)

In [15]:
train_data = LangData(english_data, afrikaans_data)
train_loader = dataLoader(train_data, BATCH_SIZE)

pad_idx = afrikaans_data.stoi['<pad>']
criterion = CrossEntropyLoss(ignore_index=0)

optimizer = NAdam(model.parameters(), LR)

In [16]:
# Data used for follow-up durring training
mytext = "<sos> the classifier makes <num> correct positive predictions and <num> <com> <num> correct negative predictions <eos>"
ground = "<sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>"

predicted = translate_sentece(model, mytext, english_data, afrikaans_data, device)
bleu = torch_bleu_score([predicted], [ground])
print(f"Pred: {predicted}")
print(f"Refe: {ground}")
print(f"BLEU: {bleu.item()}")

Pred: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Refe: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU: 0.0


## Train the data

In [18]:
params = {
    "model": model,
    "train_loader": train_loader,
    "optimizer": optimizer,
    "criterion": criterion,
    "device": device,
    "epochs": 30,
    "source_test": mytext,
    "target_test": ground,
    "source_lang": english_data,
    "target_lang": afrikaans_data,
}

train_model(**params)

Epoch 1/30: 100%|██████████| 4/4 [00:01<00:00,  2.33batch/s, loss=0.339]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 2/30: 100%|██████████| 4/4 [00:01<00:00,  2.11batch/s, loss=0.372]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 3/30: 100%|██████████| 4/4 [00:01<00:00,  2.17batch/s, loss=0.419]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 4/30: 100%|██████████| 4/4 [00:01<00:00,  2.04batch/s, loss=0.395]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 5/30: 100%|██████████| 4/4 [00:01<00:00,  2.25batch/s, loss=0.432]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 6/30: 100%|██████████| 4/4 [00:01<00:00,  2.11batch/s, loss=0.361]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 7/30: 100%|██████████| 4/4 [00:01<00:00,  2.04batch/s, loss=0.411]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 8/30: 100%|██████████| 4/4 [00:02<00:00,  1.78batch/s, loss=0.609]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 9/30: 100%|██████████| 4/4 [00:01<00:00,  2.16batch/s, loss=0.390]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 10/30: 100%|██████████| 4/4 [00:01<00:00,  2.20batch/s, loss=0.355]


Predicted: <sos> die die van die model word gegee as <ltx> <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 11/30: 100%|██████████| 4/4 [00:02<00:00,  1.83batch/s, loss=0.396]


Predicted: <sos> die die van die model word gegee as <ltx> <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 12/30: 100%|██████████| 4/4 [00:01<00:00,  2.16batch/s, loss=0.369]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 13/30: 100%|██████████| 4/4 [00:01<00:00,  2.21batch/s, loss=0.367]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 14/30: 100%|██████████| 4/4 [00:01<00:00,  2.08batch/s, loss=0.395]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 15/30: 100%|██████████| 4/4 [00:01<00:00,  2.08batch/s, loss=0.440]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 16/30: 100%|██████████| 4/4 [00:02<00:00,  1.85batch/s, loss=0.462]


Predicted: <sos> die die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 17/30: 100%|██████████| 4/4 [00:02<00:00,  1.92batch/s, loss=0.484]


Predicted: <sos> die die van die model word gegee as <ltx> <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 18/30: 100%|██████████| 4/4 [00:02<00:00,  1.89batch/s, loss=0.403]


Predicted: <sos> die die van die model word gegee as <ltx> <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 19/30: 100%|██████████| 4/4 [00:02<00:00,  1.82batch/s, loss=0.386]


Predicted: <sos> die die van die model word gegee as <ltx> <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 20/30: 100%|██████████| 4/4 [00:01<00:00,  2.13batch/s, loss=0.352]


Predicted: <sos> die die van die model word gegee as <ltx> <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 21/30: 100%|██████████| 4/4 [00:02<00:00,  1.94batch/s, loss=0.447]


Predicted: <sos> die die volgende blokdiagram van <apo>n syfersein verwerkingstelsel <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 22/30: 100%|██████████| 4/4 [00:02<00:00,  1.89batch/s, loss=0.391]


Predicted: <sos> die die volgende blokdiagram van <apo>n syfersein verwerkingstelsel <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 23/30: 100%|██████████| 4/4 [00:01<00:00,  2.11batch/s, loss=0.350]


Predicted: <sos> die sein <ltx> word nou teen <apo>n monsterfrekwensie van <ltx> gemonster <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 24/30: 100%|██████████| 4/4 [00:01<00:00,  2.27batch/s, loss=0.355]


Predicted: <sos> die die volgende eienskap deur slegs gebruik te maak van die definisies van die <ltx> transform en kruiskorrelasie <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 25/30: 100%|██████████| 4/4 [00:01<00:00,  2.04batch/s, loss=0.383]


Predicted: <sos> die diskrete tyd sein <ltx> word verkry deur <ltx> te monster sodat <ltx> met <ltx> s <com> die monsterperiode in sekondes <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 26/30: 100%|██████████| 4/4 [00:01<00:00,  2.36batch/s, loss=0.344]


Predicted: <sos> die die volgende blokdiagram van <apo>n syfersein verwerkingstelsel <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 27/30: 100%|██████████| 4/4 [00:02<00:00,  1.98batch/s, loss=0.371]


Predicted: <sos> is hierdie stelsel tydvariant of tydinvariant <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 28/30: 100%|██████████| 4/4 [00:02<00:00,  1.92batch/s, loss=0.400]


Predicted: <sos> die diskrete tyd sein <ltx> word verkry deur <ltx> te monster sodat <ltx> met <ltx> s <com> die monsterperiode in sekondes <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 29/30: 100%|██████████| 4/4 [00:01<00:00,  2.02batch/s, loss=0.372]


Predicted: <sos> die diskrete tyd sein <ltx> word verkry deur <ltx> te monster sodat <ltx> met <ltx> s <com> die monsterperiode in sekondes <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 30/30: 100%|██████████| 4/4 [00:02<00:00,  1.98batch/s, loss=0.403]

Predicted: <sos> die diskrete tyd sein <ltx> word verkry deur <ltx> te monster sodat <ltx> met <ltx> s <com> die monsterperiode in sekondes <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0





In [22]:
from nltk.translate.bleu_score import sentence_bleu, modified_precision, SmoothingFunction, corpus_bleu

In [23]:
EN_STR = [[' '.join(sent)] for sent in english_data.data_str]
AF_STR = [[' '.join(sent)] for sent in afrikaans_data.data_str]

In [21]:
TRANSLATED = [[translate_sentece(model, sent[0], english_data, afrikaans_data, device)] for sent in EN_STR]

In [24]:
BLEU_SCORE = [sentence_bleu([b[0].split()],a[0].split(), smoothing_function=SmoothingFunction().method1) for a,b in zip(TRANSLATED, AF_STR)]

In [25]:
np.mean(BLEU_SCORE)

0.016225318332817797

In [26]:
from torcheval.metrics.functional import bleu_score as torchblue

In [27]:
def torch_blue_score(candidat, reference, device=None):
    n_gram = min(len(candidat.split()), len(reference.split()), 4)
    score = torchblue(candidat, [reference], n_gram, device=device)
    return score.item()

In [28]:
BLEU_SCORE2 = [torch_blue_score(a[0],b[0]) for a, b in zip(TRANSLATED, AF_STR)]
np.mean(BLEU_SCORE2)

0.0029079956925650526