In [1]:
import torch.nn as nn
import torch
from itertools import chain
from collections import Counter
from torchtext.vocab import vocab
from torch.utils.data import Dataset,random_split,DataLoader
import random
from torch.nn.utils.rnn import pad_sequence
from functools import partial
import os
import json
from tqdm import tqdm
from torchtext.data.metrics import bleu_score
from torch.utils.tensorboard import SummaryWriter

In [2]:
num_epochs=25
learning_rate=0.001
batch_size=256

In [3]:
def preprocess(data):
    data=data.replace("\u202f"," ").replace("\xa0"," ").replace("\u2009"," ")
    no_space=lambda char,prev_char: char in ",.!?" and prev_char !=' '
    out=[' '+char if i>0 and no_space(char,data[i-1]) else char
            for i,char in enumerate(data)]
    out=''.join(out)
    out=["\t".join(sentence.split("\t")[:2]) for sentence in out.split('\n')]
    out='\n'.join(out)
    return out

In [4]:
def build_vocab(list_tokens):
    tokens=sorted(chain.from_iterable((list_tokens)))
    token_freq=Counter(tokens)
    vocabulary=vocab(token_freq,specials=['<unk>','<pad>'])
    vocabulary.set_default_index(0)
    return vocabulary
    

In [5]:
def tokenizer(text):
    return [token for token in f"<sos> {text} <eos>".split(" ") if token]

In [6]:
def separate_src_tgt(data,max_samples=None):
    src=[]
    tgt=[]
    for i,text in enumerate(data):
        if max_samples and i> max_samples:break
        parts= text.split('\t')
        if len(parts)==2:
            src.append(tokenizer(parts[0]))
            tgt.append(tokenizer(parts[1]))
    return src,tgt
    

In [7]:
class CustomDataset(Dataset):
    def __init__(self,dataset) -> None:
        super().__init__()
        self.src_data=dataset[0]
        self.tgt_data=dataset[1]
    def __len__(self):
        return len(self.src_data)
    def __getitem__(self, index):
        return self.src_data[index],self.tgt_data[index]

In [8]:
def data_process_pipeline(data,eng_vocab=None,fra_vocab=None):
    src,tgt=separate_src_tgt(data)
    if eng_vocab is None:
        eng_vocab=build_vocab(src)
        fra_vocab=build_vocab(tgt)
    src_idx=[eng_vocab.forward(sent) for sent in src]
    tgt_idx=[fra_vocab.forward(sent) for sent in tgt]
    train_dataset=CustomDataset((src_idx,tgt_idx))
    return train_dataset,eng_vocab,fra_vocab

In [9]:
def train_test_split(dataset,train_percent):
    train_size=int(len(dataset)*train_percent)
    train_data=dataset[:train_size]
    test_data=dataset[train_size:]
    return train_data,test_data
    

In [10]:
def load_data(data_path,train_size):
    with open(data_path,'r',encoding="utf-8") as fp:
        data=fp.read()
    clean_data=preprocess(data)
    sent_list=[sent for sent in clean_data.split("\n") if len(sent)>0]
    sorted_sent_list=sorted(sent_list,key=lambda x: len(x.split('\t')[0].split(' ')))
    train_data,test_data=train_test_split(sorted_sent_list,train_size)
    return train_data,test_data

In [11]:
raw_train_data,raw_val_data=load_data("data/fra.txt",0.8)

In [12]:
train_data,eng_vocab,fra_vocab=data_process_pipeline(raw_train_data)
val_data,_,_=data_process_pipeline(raw_val_data,)


In [13]:
def collate_fn(train_data,src_pad_val,tgt_pad_val):
    src_data=[torch.LongTensor(src[0]) for src in train_data]
    tgt_data=[torch.LongTensor(tgt[1]) for tgt in train_data]
    src_tensor=pad_sequence(src_data,padding_value=src_pad_val)
    tgt_tensor=pad_sequence(tgt_data,padding_value=tgt_pad_val)
    return src_tensor,tgt_tensor

train_loader = DataLoader(train_data, batch_size=batch_size, num_workers=8, collate_fn=partial(collate_fn,src_pad_val=eng_vocab['<pad>'],tgt_pad_val=fra_vocab['<pad>']))
val_loader=DataLoader(val_data,batch_size=batch_size, num_workers=8,collate_fn=partial(collate_fn,src_pad_val=eng_vocab['<pad>'],tgt_pad_val=fra_vocab['<pad>']))

In [14]:

input_size_encoder=len(eng_vocab)
input_size_decoder=len(fra_vocab)
output_size_decoder=len(fra_vocab)
encoder_embedding_size=300
decoder_embedding_size=300
hidden_size=1024
encoder_n_layers=2
decoder_n_layers=2
encoder_dropout=0.5
decoder_dropout=0.5
teacher_forcing_ratio=0.5
device="cuda" if torch.cuda.is_available() else "cpu"

In [15]:
class Encoder(nn.Module):
    def __init__(self,vocab_size,embed_size,hidden_size,num_layers,drop_prob):
        super().__init__()
        self.embed_layer=nn.Embedding(vocab_size,embed_size)
        self.rnn=nn.LSTM(embed_size,hidden_size,num_layers,dropout=drop_prob,bidirectional=True)
        self.fc_hidden=nn.Linear(hidden_size*2,hidden_size)
        self.fc_cell=nn.Linear(hidden_size*2,hidden_size)
    def forward(self,X):
        embeddings=self.embed_layer(X)
        #embeddings=[seq_len,batch_size,embed_size]
        #embeddings=[4,64,300]
        encoder_states,(hidden,cell)=self.rnn(embeddings)
        
        #encoder_states=[seq_len,batch_size,hidden_size*Directions]
        #encoder_states=[4,64,1024]
        #hidden=[num_layers*Directions,batch_size,hidden_size]
        #4,64,1024
        #cell=[num_layers*Directions,batch_size,hidden_size]
        #4,64,1024
        hidden=self.fc_hidden(torch.cat((hidden[0:2],hidden[2:4]),dim=2))
        #2,64,1024
        cell=self.fc_cell(torch.cat((cell[0:2],cell[2:4]),dim=2))
        #2,64,1024
        return encoder_states,hidden,cell

In [16]:
class Decoder(nn.Module):
    def __init__(self,vocab_size,embed_size,hidden_size,num_layers,drop_prob,output_size) -> None:
        super().__init__()
        self.embed=nn.Embedding(vocab_size,embed_size)
        self.rnn=nn.LSTM(hidden_size*2+embed_size,hidden_size,num_layers=num_layers,dropout=drop_prob)
        self.fc=nn.Linear(hidden_size,output_size)
        self.energy=nn.Linear(hidden_size*4,1)
        self.softmax=nn.Softmax(dim=0)
        self.relu=nn.ReLU()
    def forward(self,X,encoder_states,hidden,cell):
        #X=[batch_size]
        #encoder_states=[4,64,2048]
        #hidden=[2,64,1024]
        #cell=[2,64,1024]
        #hidden=[1,64,2048]
        X=X.unsqueeze(0)
        #X=[1,batch_size]
        embeddings=self.embed(X)
        #embeddings=[1,batch_size,embed_size]
        sequence_length=encoder_states.shape[0]
        hidden_reshaped=torch.cat((hidden[0:1],hidden[1:2]),dim=2).repeat(sequence_length,1,1)
        #hidden = [seq_len,batch,hidden_size]
        # print(f"hidden size{hidden.shape} encoder_states size {encoder_states.shape}")
        input_energy_format=torch.cat((hidden_reshaped,encoder_states),dim=2)
        #4,64,4096
        energy=self.relu(self.energy(input_energy_format))
        #4,64,1
        attention=self.softmax(energy)
        #4,64,1
        attention=attention.permute(1,2,0)
        #64,1,4
        encoder_states=encoder_states.permute(1,0,2)
        #64,4,2048
        context_vector=torch.bmm(attention,encoder_states).permute(1,0,2)
        #1,64,2048
        
        rnn_input=torch.cat((context_vector,embeddings),dim=2)
        #1,64,2348
        outputs,(hidden,cell)=self.rnn(rnn_input,(hidden,cell))
        
        predictions=self.fc(outputs)
        predictions=predictions.squeeze(0)
        return predictions   

In [17]:
class Seq2Seq(nn.Module):
    def __init__(self,encoder,decoder) -> None:
        super().__init__()
        self.encoder=encoder
        self.decoder=decoder
    def forward(self,src,tgt,tgt_vocab_size,teacher_force_ratio):
        
        batch_size=src.shape[1]
        target_len=tgt.shape[0]
        outputs=torch.zeros((target_len,batch_size,tgt_vocab_size))
        encoder_states,hidden,cell=self.encoder(src)
        # print(encoder_states.shape,hidden.shape,cell.shape)
        x=tgt[0]
        for t in range(1,target_len):
            output=self.decoder(x,encoder_states,hidden,cell)
            outputs[t]=output
            teacher_force=random.random()<teacher_force_ratio
            top1=output.argmax(1)
            x=tgt[t] if teacher_force else top1
            
        return outputs

In [18]:
class Trainer:
    def __init__(
        self,
        model,
        num_epochs,
        batch_size,
        criterion,
        optimizer,
        learning_rate,
        output_size_decoder,
        teacher_forcing_ratio,
        device,
        print_stats,
        tgt_vocab,
        pred_pipeline,
    ):
        self.num_epochs = num_epochs
        self.batch_size = batch_size
        self.output_size_decoder=output_size_decoder
        self.criterion = criterion
        self.optimizer = optimizer
        self.learning_rate = learning_rate
        self.teacher_forcing_ratio = teacher_forcing_ratio
        self.device = device
        self.print_stats=print_stats
        self.tgt_vocab=tgt_vocab
        self.pred_pipeline=pred_pipeline
        self.loss={"train":[],'val':[]}
        self.bleu={"train":[],'val':[]}
        self.model=model.to(device)
        self.writer=SummaryWriter()
    def train(self, train_loader, val_loader, save_path):
        for epoch in range(self.num_epochs):
            self._train_epoch(train_loader)
            self._val_epoch(val_loader)
            if self.print_stats:
                print(f"\n###########{epoch}#############\n")
                print(f"train loss : {self.loss['train'][-1]}\t val loss: {self.loss['val'][-1]}")
                print(f"train bleu score : {self.bleu['train'][-1]} \t val bleu score : {self.bleu['val'][-1]}")
                test_txt="In this story an old man sets out to ask an Indian king to dig some well in his village when their water runs dry"
                expected_translation="Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec."
                predicted_translation=self.transcribe(test_txt,self.pred_pipeline,50,189,self.tgt_vocab,188)
                blue_score=bleu_score([predicted_translation[0].split()],[[expected_translation.split()]],max_n=2,weights=[0.5,0.5])
                print(f"expected translation : \t {expected_translation}")
                print(f"predicted trainslation : \t{predicted_translation}")
                print(f"bleu_score : {blue_score}")
                print("\n-----------------------------------\n")
                if epoch==0:
                    with open(os.path.join(save_path,"sample_bleu.json"),"w+") as fp :
                        json.dump({"src text":test_txt,
                         "results":[]},fp)
                with open(os.path.join(save_path,"sample_bleu.json"),"r+") as fp :
                    result={"expected tranlation ":expected_translation,
                          "predicted translation":predicted_translation,
                          "bleu score ":blue_score,
                          "epoch":epoch
                          }
                    prev_data=json.load(fp)
                    prev_data["results"].append(result)
                    fp.seek(0)
                    json.dump(prev_data,fp)
            self.writer.add_scalar("train loss ",self.loss['train'][-1],epoch)
            self.writer.add_scalar("val loss ",self.loss['val'][-1],epoch)
            self.writer.add_scalar("train bleu ",self.bleu['train'][-1],epoch)
            self.writer.add_scalar("val bleu ",self.bleu['val'][-1],epoch)
        self.save_model(os.path.join(save_path,"model.pt"))
        self.save_loss(os.path.join(save_path,"loss.json"))
        self.save_loss(os.path.join(save_path,"bleu.json"))
    def _train_epoch(self,train_loader):
        i=0
        epoch_loss=0
        epoch_bleu=0
        for batch_src,batch_tgt in tqdm(train_loader):
            i+=1
            source=batch_src.to(self.device)
            target=batch_tgt.to(self.device)
            outputs=self.model(source,target,self.output_size_decoder,self.teacher_forcing_ratio)
            preds=outputs.argmax(-1)
            outputs=outputs[1:].reshape(-1,outputs.shape[-1])
            batch_tgt=batch_tgt[1:].reshape(-1)
            loss=self.criterion(outputs,batch_tgt)
            epoch_loss+=loss.item()
            self.optimizer.zero_grad()
            loss.backward()
            self.optimizer.step()
            pred_tokens=[self.tgt_vocab.lookup_tokens(tokens) for tokens in preds[1:].t().tolist()]
            target_tokens=[[self.tgt_vocab.lookup_tokens(tokens)] for tokens in target.t().tolist()]
            bleu=bleu_score(pred_tokens,target_tokens,max_n=2,weights=[0.5,0.5])
            epoch_bleu+=bleu
        self.loss['train'].append(epoch_loss/i)
        self.bleu['train'].append(epoch_bleu/i)
                
            
    def _val_epoch(self,val_loader):
        i=0
        epoch_bleu=0
        epoch_loss=0
        with torch.no_grad():
            for batch_src,batch_tgt in tqdm(val_loader):
                i+=1
                source=batch_src.to(self.device)
                target=batch_tgt.to(self.device)
                outputs=self.model(source,target,self.output_size_decoder,self.teacher_forcing_ratio)
                preds=outputs.argmax(-1)
                outputs=outputs[1:].reshape(-1,outputs.shape[-1])
                batch_tgt=batch_tgt[1:].reshape(-1)
                loss=self.criterion(outputs,batch_tgt)
                pred_tokens=[self.tgt_vocab.lookup_tokens(tokens) for tokens in preds[1:].t().tolist()]
                target_tokens=[[self.tgt_vocab.lookup_tokens(tokens)] for tokens in target.t().tolist()]
                bleu=bleu_score(pred_tokens,target_tokens,max_n=2,weights=[0.5,0.5])
                epoch_bleu+=bleu
                epoch_loss+=loss.item()
        self.loss['val'].append(epoch_loss/i)
        self.bleu['val'].append(epoch_bleu/i)
    def save_model(self,save_path):
        torch.save(self.model,save_path)
    def save_loss(self,save_path):
        with open(save_path,"w") as fp:
            json.dump(self.loss,fp)
    def save_bleu_score(self,save_path):
        with open(save_path,'w') as fp:
            json.dump(self.bleu,fp)
    def transcribe(self,inputs,pipeline,max_tokens,start_token,tgt_vocab,end_token):
        with torch.no_grad():
            inputs=pipeline(inputs)
            inputs=inputs.to(self.device)
            encoder_states,hidden,cell=self.model.encoder(inputs)
            output_tokens=[]
            i=0
            for i in range(inputs.shape[1]):
                x=torch.LongTensor([start_token]).to(self.device)
                current_output=[]
                while True:
                    predictions=self.model.decoder(x,encoder_states,hidden,cell)
                    predictions=predictions.argmax(1)
                    pred_tokens=tgt_vocab.lookup_token(predictions.item())
                    current_output.append(pred_tokens)
                    x=predictions
                    if end_token==predictions or len(current_output)>=max_tokens:
                        break
                output_tokens.append(" ".join(current_output))
        return output_tokens

In [19]:
encoder=Encoder(len(eng_vocab),embed_size=encoder_embedding_size,hidden_size=hidden_size,num_layers=encoder_n_layers,drop_prob=encoder_dropout)
decoder=Decoder(len(fra_vocab),embed_size=decoder_embedding_size,hidden_size=hidden_size,num_layers=decoder_n_layers,drop_prob=decoder_dropout,output_size=len(fra_vocab))
model=Seq2Seq(encoder=encoder,decoder=decoder)

In [20]:
criterion=nn.CrossEntropyLoss(ignore_index=eng_vocab['<pad>'])
optimizer=torch.optim.Adam(model.parameters(),lr=learning_rate)

In [21]:
def predict_pipeline(txt):
    if isinstance(txt,str):
        txt=[txt]
    sent_tokens=[tokenizer(tokens) for tokens in txt]
    int_tokens=[eng_vocab.forward(tokens) for tokens in sent_tokens]
    src_tensor=[torch.LongTensor(token_list) for token_list in int_tokens]
    src=pad_sequence(src_tensor,padding_value=eng_vocab['<pad>'])
    return src

In [22]:
trainer=Trainer(model=model,num_epochs=num_epochs,batch_size=batch_size,criterion=criterion,optimizer=optimizer,learning_rate=learning_rate,output_size_decoder=len(fra_vocab),teacher_forcing_ratio=teacher_forcing_ratio,device=device,print_stats=True,tgt_vocab=fra_vocab,pred_pipeline=predict_pipeline)

In [None]:
trainer.train(train_loader,val_loader,"results/attention")

100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [16:57<00:00,  1.49s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:49<00:00,  1.57it/s]



###########0#############

train loss : 4.834526880745314	 val loss: 11.353723810430159
train bleu score : 0.13305588507725327 	 val bleu score : 0.0
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Un voiture . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:13<00:00,  1.52s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:49<00:00,  1.56it/s]



###########1#############

train loss : 3.588101567061416	 val loss: 11.150528723733467
train bleu score : 0.18829018407212164 	 val bleu score : 0.0
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['De une une histoire . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:18<00:00,  1.52s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:49<00:00,  1.56it/s]



###########2#############

train loss : 2.687594021520307	 val loss: 12.585745738960846
train bleu score : 0.24030360238723505 	 val bleu score : 1.5983758943043938e-05
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans une histoire . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:31<00:00,  1.54s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########3#############

train loss : 2.0199654453660734	 val loss: 13.20143875322844
train bleu score : 0.28762970350606637 	 val bleu score : 2.030052203266763e-05
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans une vieille . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:42<00:00,  1.56s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########4#############

train loss : 1.5939023109300394	 val loss: 15.263689264219407
train bleu score : 0.3269022472609948 	 val bleu score : 1.1240537705788899e-05
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans une voiture . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:40<00:00,  1.56s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########5#############

train loss : 1.3521030036585073	 val loss: 15.719273271616439
train bleu score : 0.35518097559352474 	 val bleu score : 8.133893256914562e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans une histoire . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:36<00:00,  1.55s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:49<00:00,  1.56it/s]



###########6#############

train loss : 1.1772216611768493	 val loss: 16.708558595668503
train bleu score : 0.375924355957872 	 val bleu score : 5.223873062897026e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	["Dans quel homme d'une autre idée . <eos>"]
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:42<00:00,  1.56s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########7#############

train loss : 1.0569782269315635	 val loss: 16.827799596284564
train bleu score : 0.39214511524561557 	 val bleu score : 0.0
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans quel vieux . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:45<00:00,  1.56s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:49<00:00,  1.56it/s]



###########8#############

train loss : 0.9672028258486577	 val loss: 17.279570607414023
train bleu score : 0.40464934064756497 	 val bleu score : 9.444835418867154e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans quel mot . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:43<00:00,  1.56s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########9#############

train loss : 0.8772203335401949	 val loss: 16.761161854392604
train bleu score : 0.41599780617808074 	 val bleu score : 0.0
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans ce mot . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:43<00:00,  1.56s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.54it/s]



###########10#############

train loss : 0.8218364840553652	 val loss: 16.88570699636002
train bleu score : 0.42423655295388574 	 val bleu score : 6.833336679395221e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans une histoire . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [18:04<00:00,  1.59s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########11#############

train loss : 0.7689772575132309	 val loss: 17.21592580784134
train bleu score : 0.43073539847918796 	 val bleu score : 8.792664097860152e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans quel mot . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [18:09<00:00,  1.60s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:52<00:00,  1.52it/s]



###########12#############

train loss : 0.7370818724904942	 val loss: 18.06215963307877
train bleu score : 0.4365387925421611 	 val bleu score : 0.0
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	["C'est une autre idée pour une autre homme a une autre idée . <eos>"]
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [18:15<00:00,  1.61s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:52<00:00,  1.53it/s]



###########13#############

train loss : 0.7061815064760947	 val loss: 18.695564894648324
train bleu score : 0.4405279704765313 	 val bleu score : 0.0
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Quel autre histoire . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [18:09<00:00,  1.60s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:51<00:00,  1.53it/s]



###########14#############

train loss : 0.6814692302708052	 val loss: 18.725468964604605
train bleu score : 0.4446548887026767 	 val bleu score : 1.6870030927469047e-05
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans une . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [18:17<00:00,  1.61s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:56<00:00,  1.47it/s]



###########15#############

train loss : 0.6416108719458329	 val loss: 17.83846754776804
train bleu score : 0.44920583640958867 	 val bleu score : 5.314904450031101e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Peu une histoire à une histoire . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [18:07<00:00,  1.60s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:49<00:00,  1.57it/s]



###########16#############

train loss : 0.64136017944194	 val loss: 17.41644959700735
train bleu score : 0.4505131960893843 	 val bleu score : 4.687630232107313e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans cette voiture . <eos>']
bleu_score : 0.004742017726198676

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:26<00:00,  1.53s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########17#############

train loss : 0.6180036042617563	 val loss: 17.42315179702134
train bleu score : 0.45348402141580224 	 val bleu score : 7.0314456711043844e-06
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	["C'est une histoire . <eos>"]
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:41<00:00,  1.56s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.55it/s]



###########18#############

train loss : 0.6021501658555349	 val loss: 17.422008313630755
train bleu score : 0.45586781437863316 	 val bleu score : 1.1220084569743248e-05
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Quel histoire . <eos>']
bleu_score : 0.0

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [17:12<00:00,  1.51s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:50<00:00,  1.54it/s]



###########19#############

train loss : 0.5914477636038034	 val loss: 16.84025349533349
train bleu score : 0.45781320244861934 	 val bleu score : 1.7272810303547737e-05
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans cette femme . <eos>']
bleu_score : 0.004742017726198676

-----------------------------------



100%|████████████████████████████████████████████████████████████████████████████████| 682/682 [18:12<00:00,  1.60s/it]
100%|████████████████████████████████████████████████████████████████████████████████| 171/171 [01:56<00:00,  1.47it/s]



###########20#############

train loss : 0.5808584739036224	 val loss: 17.75728784527695
train bleu score : 0.45873210463093467 	 val bleu score : 1.923833210255653e-05
expected translation : 	 Dans cette histoire, un vieil homme entreprend de demander à un roi indien de creuser un puits dans son village lorsque leur eau sera à sec.
predicted trainslation : 	['Dans cette histoire . <eos>']
bleu_score : 0.004742017726198676

-----------------------------------



 64%|███████████████████████████████████████████████████▏                            | 436/682 [10:09<06:37,  1.62s/it]