# NEURAL MACHINE TRANSLATION - Vanilla RNN

## Required Module & Config files

In [2]:
import src.RNN as rnnNMT
from src.Tokenizer import Corpus, LangData, dataLoader
from src.utils import load_config, translate_sentece, get_device, train_model
from torch.nn import CrossEntropyLoss
from torch.optim import NAdam
import numpy as np

In [3]:
from src.utils import torch_bleu_score

In [4]:
# Loading config file
config = load_config()
# Get device : GPU/MPS Back-End/CPU
device = get_device()
print(f"Using device: {device}")

Using device: mps


## Data Preprocessing

In [5]:
# # TRAIN_DATA
# preprocess_data(config.TRAIN_RAW, config.TRAIN_DATA, config.TRAIN_AFRIKAANS, "afrikaans")
# preprocess_data(config.TRAIN_RAW, config.TRAIN_DATA, config.TRAIN_ENGLISH, "english")

In [6]:
# # VAL_DATA
# preprocess_data(config.VAL_RAW, config.VAL_DATA, config.VAL_AFRIKAANS, "afrikaans")
# preprocess_data(config.VAL_RAW, config.VAL_DATA, config.VAL_ENGLISH, "english")

## Load the dataset

In [7]:
# Encoder-Source
english_data = Corpus(f"{config.TRAIN_DATA}/english.txt", "English")
afrikaans_data = Corpus(f"{config.TRAIN_DATA}/afrikaans.txt", "Afrikaans")

## Set Hyperparameters

In [8]:
# Encoder - source
IN_ENCODER = english_data.vocab_size
ENCODER_EMB = 128

# Decoder - target
IN_DECODER = afrikaans_data.vocab_size
OUT_DECODER = afrikaans_data.vocab_size
DECODER_EMB = 128

# Shared
HIDDEN_SIZE = 1024
NUM_LAYERS = 2

EPOCHS = 20
LR = 1e-3
BATCH_SIZE = 128

## Set the model

In [9]:
encoder_net = rnnNMT.Encoder(IN_ENCODER, ENCODER_EMB, HIDDEN_SIZE, NUM_LAYERS).to(device)
decoder_net = rnnNMT.Decoder(IN_DECODER, DECODER_EMB, HIDDEN_SIZE, NUM_LAYERS).to(device)
model = rnnNMT.RNN_NMT(encoder_net, decoder_net, OUT_DECODER)

In [10]:
train_data = LangData(english_data, afrikaans_data)
train_loader = dataLoader(train_data, BATCH_SIZE)

pad_idx = afrikaans_data.stoi['<pad>']
criterion = CrossEntropyLoss(ignore_index=0)

optimizer = NAdam(model.parameters(), LR)

In [11]:
# Data used for follow-up durring training
mytext = "<sos> the classifier makes <num> correct positive predictions and <num> <com> <num> correct negative predictions <eos>"
ground = "<sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>"

predicted = translate_sentece(model, mytext, english_data, afrikaans_data, device)
bleu = torch_bleu_score([predicted], [ground])
print(f"Pred: {predicted}")
print(f"Refe: {ground}")
print(f"BLEU: {bleu.item()}")

Pred: <sos> benadering val vind voorverwerkingsmetode dimensie vaar ies toetse monstertempo antwoorde sinusgolf onderstaande eers wiskundige frekwensies benodig diagonaalkovariansiese uit will vanaf berekening klasspesifieke beraam aanname hoogdeurlaatfilter effektief datastel keepfilter plot soortgelyke
Refe: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU: 0.0


## Train the data

In [21]:
params = {
    "model": model,
    "train_loader": train_loader,
    "optimizer": optimizer,
    "criterion": criterion,
    "device": device,
    "epochs": 20,
    "source_test": mytext,
    "target_test": ground,
    "source_lang": english_data,
    "target_lang": afrikaans_data,
}

train_model(**params)

Epoch 1/20: 100%|██████████| 4/4 [00:00<00:00,  4.44batch/s, loss=0.704]


Predicted: <sos> it addisionele ruimte <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 2/20: 100%|██████████| 4/4 [00:00<00:00,  4.45batch/s, loss=0.836]


Predicted: <sos> die onderstaande tabel die laagdeurlaatfilter <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 3/20: 100%|██████████| 4/4 [00:00<00:00,  4.53batch/s, loss=0.769]


Predicted: <sos> beskou die <ltx> punt diskrete tyd sein <ltx> <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 4/20: 100%|██████████| 4/4 [00:00<00:00,  5.55batch/s, loss=0.537]


Predicted: <sos> beskou die volgende blokdiagram van <apo>n syfersein verwerkingstelsel <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 5/20: 100%|██████████| 4/4 [00:00<00:00,  4.74batch/s, loss=0.543]


Predicted: <sos> toon en motiveer jou berekeninge <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 6/20: 100%|██████████| 4/4 [00:00<00:00,  5.31batch/s, loss=0.513]


Predicted: <sos> die tweede order butterworth laagdeurlaatfilter met <apo>n afsnyfrekwensie van <ltx> radiale sekonde word gegee deur <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 7/20: 100%|██████████| 4/4 [00:00<00:00,  4.87batch/s, loss=0.521]


Predicted: <sos> die sein <ltx> bestaan uit <apo>n sinusgolf met <apo>n onmiddelike frekwensie wat line er verander van <ltx> hz to <ltx> khz binne <num> sekondes <com> en dan weer terugdaal na
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 8/20: 100%|██████████| 4/4 [00:00<00:00,  4.30batch/s, loss=0.635]


Predicted: <sos> die die <ltx> van die stelsel gegee die intree <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 9/20: 100%|██████████| 4/4 [00:00<00:00,  4.62batch/s, loss=0.657]


Predicted: <sos> bepaal die optimale bloklengte <ltx> wat gebruik moet word om die aantal wisselpunt vermenigvuldigings per uittree monster te minimeer <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 10/20: 100%|██████████| 4/4 [00:00<00:00,  5.26batch/s, loss=0.455]


Predicted: <sos> die sein <ltx> word geanaliseer deur <apo>n spektrogram te gebruik met die doel om die onmiddelike frekwensie elke <num> ms te bepaal <com> met <apo>n frekwensieresolusie van <num> hz en
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 11/20: 100%|██████████| 4/4 [00:00<00:00,  4.64batch/s, loss=0.479]


Predicted: <sos> beskou die volgende twee diskrete tyd seine <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 12/20: 100%|██████████| 4/4 [00:00<00:00,  4.78batch/s, loss=0.565]


Predicted: <sos> die die van die dac is <num> khz <com> en alle filters kan as ideaal beskou word <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 13/20: 100%|██████████| 4/4 [00:00<00:00,  4.53batch/s, loss=0.547]


Predicted: <sos> motiveer jou antwoord <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 14/20: 100%|██████████| 4/4 [00:00<00:00,  4.33batch/s, loss=0.619]


Predicted: <sos> bepaal die optimale waarde van <ltx> sodat <apo>n radix <num> fft van <ltx> minstens <num> keer vinniger bereken kan word as <apo>n <ltx> punt dft <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 15/20: 100%|██████████| 4/4 [00:00<00:00,  4.95batch/s, loss=0.446]


Predicted: <sos> die volgende figuur toon die skoenlapper berekeninge van <apo>n <ltx> punt desimasie in frekwensie fft <com> met <ltx> as intree tyd domein sein en <ltx> die uitree frekwensie ruimte sein
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 16/20: 100%|██████████| 4/4 [00:00<00:00,  5.19batch/s, loss=0.534]


Predicted: <sos> die volgende figuur toon die skoenlapper berekeninge van <apo>n <ltx> punt desimasie in tyd fft <com> met <ltx> as intree tyd domein sein en <ltx> die uitree frekwensie ruimte sein
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 17/20: 100%|██████████| 4/4 [00:00<00:00,  4.63batch/s, loss=0.467]


Predicted: <sos> hoekom <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 18/20: 100%|██████████| 4/4 [00:00<00:00,  4.95batch/s, loss=0.517]


Predicted: <sos> motiveer jou antwoord <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 19/20: 100%|██████████| 4/4 [00:00<00:00,  4.83batch/s, loss=0.472]


Predicted: <sos> beskou die volgende kontinue tyd sein <ltx> <com> met <ltx> die tyd in sekondes <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0


Epoch 20/20: 100%|██████████| 4/4 [00:00<00:00,  4.89batch/s, loss=0.423]

Predicted: <sos> it addisionele ruimte <eos>
Reference: <sos> die klassifiseerder maak <num> korrekte positiewe voorspellings en <num> <com> <num> korrekte negatiewe voorspellings <eos>
BLEU Score: 0.0





In [22]:
from nltk.translate.bleu_score import sentence_bleu, SmoothingFunction

In [23]:
EN_STR = [[' '.join(sent)] for sent in english_data.data_str]
AF_STR = [[' '.join(sent)] for sent in afrikaans_data.data_str]

In [24]:
TRANSLATED = [[translate_sentece(model, sent[0], english_data, afrikaans_data, device)] for sent in EN_STR]

In [25]:
BLEU_SCORE = [sentence_bleu([b[0].split()],a[0].split(), smoothing_function=SmoothingFunction().method1) for a,b in zip(TRANSLATED, AF_STR)]

In [26]:
np.mean(BLEU_SCORE)

0.0529999244615122

In [27]:
from torcheval.metrics.functional import bleu_score as torchblue

In [28]:
def torch_blue_score(candidat, reference, device=None):
    n_gram = min(len(candidat.split()), len(reference.split()), 4)
    score = torchblue(candidat, [reference], n_gram, device=device)
    return score.item()

In [29]:
BLEU_SCORE2 = [torch_blue_score(a[0],b[0]) for a, b in zip(TRANSLATED, AF_STR)]
np.mean(BLEU_SCORE2)

0.03848896001666653