## Motivation for Attention

In [1]:
import sys 
import platform
import numpy as np 
import pandas as pd 
import string
import re 
import math 
from string import digits 
from tqdm import tqdm
import sklearn as sk 
import torch
from torch import nn 
import torch.nn.functional as nnfunc 
from torch.utils.data import Dataset, DataLoader

In [2]:
# What version of Python do you have?
print(f"python Platform: {platform.platform()}")
print(f"PyTorch Version: {torch.__version__}")
print(f"Python: {sys.version}")
print(f"Pandas: {pd.__version__}")
print(f"Scikit-Learn: {sk.__version__}")

python Platform: macOS-15.4-arm64-arm-64bit
PyTorch Version: 2.6.0
Python: 3.11.7 (main, Dec 15 2023, 12:09:56) [Clang 14.0.6 ]
Pandas: 2.2.3
Scikit-Learn: 1.6.1


In [3]:
def get_device():
    has_gpu = torch.cuda.is_available()
    has_mps = torch.backends.mps.is_built()
    print ("NVIDIA/CUDA GPU is", "available" if has_gpu else "NOT AVAILABLE")
    print("MPS (Apple Metal) is", "AVAILABLE" if has_mps else "NOT AVAILABLE")
    return torch.device('mps') if has_mps else torch.device('cuda') if has_gpu else torch.device('cpu')
device = get_device()
print(f"Target device is {device}")

NVIDIA/CUDA GPU is NOT AVAILABLE
MPS (Apple Metal) is AVAILABLE
Target device is mps


In [4]:
def scaled_dot_product(q, k, v, mask=None):
    d_k = q.size()[-1]
    scaled = torch.matmul(q, k.transpose(-1, -2)) / math.sqrt(d_k)
    if mask is not None:
        scaled = scaled.permute(1, 0, 2, 3) + mask
        scaled = scaled.permute(1, 0, 2, 3)
    attention = nnfunc.softmax(scaled, dim=-1)
    values = torch.matmul(attention, v)
    return values, attention

In [5]:
class PositionalEncoding(nn.Module):
    def __init__(self, d_model, max_sequence_length):
        super().__init__()
        self.max_sequence_length = max_sequence_length
        self.d_model = d_model

    def forward(self):
        even_i = torch.arange(0, self.d_model, 2).float()
        denominator = torch.pow(10000, even_i/self.d_model)
        position = (torch.arange(self.max_sequence_length)
                          .reshape(self.max_sequence_length, 1))
        even_PE = torch.sin(position / denominator)
        odd_PE = torch.cos(position / denominator)
        stacked = torch.stack([even_PE, odd_PE], dim=2)
        PE = torch.flatten(stacked, start_dim=1, end_dim=2)
        return PE

In [6]:
class SentenceEmbedding(nn.Module):
    "For a given sentence, create an embedding"
    def __init__(self, max_sequence_length, d_model, language_to_index, START_TOKEN, END_TOKEN, PADDING_TOKEN):
        super().__init__()
        self.vocab_size = len(language_to_index)
        self.max_sequence_length = max_sequence_length
        self.embedding = nn.Embedding(self.vocab_size, d_model)
        self.language_to_index = language_to_index
        self.position_encoder = PositionalEncoding(d_model, max_sequence_length)
        self.dropout = nn.Dropout(p=0.1)
        self.START_TOKEN = START_TOKEN
        self.END_TOKEN = END_TOKEN
        self.PADDING_TOKEN = PADDING_TOKEN
    
    def batch_tokenize(self, batch, start_token, end_token):
        def tokenize(sentence, start_token, end_token):
            sentence_word_indices = []
            for token in sentence.split():
                if token in self.language_to_index:
                    sentence_word_indices.append(self.language_to_index[token])
            if start_token:
                sentence_word_indices.insert(0, self.language_to_index[self.START_TOKEN])
            if end_token:
                sentence_word_indices.append(self.language_to_index[self.END_TOKEN]) 
            for _ in range(len(sentence_word_indices), self.max_sequence_length):
                sentence_word_indices.append(self.language_to_index[self.PADDING_TOKEN])
            return torch.tensor(sentence_word_indices)

        tokenized = []
        for sentence_num in range(len(batch)):
           tokenized.append(tokenize(batch[sentence_num], start_token, end_token))
        tokenized = torch.stack(tokenized)
        return tokenized.to(device)
    
    def forward(self, x, start_token, end_token): # sentence
        x = self.batch_tokenize(x, start_token, end_token)
        x = self.embedding(x)
        pos = self.position_encoder().to(device)
        x = self.dropout(x + pos)
        return x

In [7]:
class MultiHeadAttention(nn.Module):
    def __init__(self, d_model, num_heads):
        super().__init__()
        self.d_model = d_model
        self.num_heads = num_heads
        self.head_dim = d_model // num_heads
        self.qkv_layer = nn.Linear(d_model , 3 * d_model)
        self.linear_layer = nn.Linear(d_model, d_model)
    
    def forward(self, x, mask):
        batch_size, sequence_length, d_model = x.size()
        qkv = self.qkv_layer(x)
        qkv = qkv.reshape(batch_size, sequence_length, self.num_heads, 3 * self.head_dim)
        qkv = qkv.permute(0, 2, 1, 3)
        q, k, v = qkv.chunk(3, dim=-1)
        values, attention = scaled_dot_product(q, k, v, mask)
        values = values.permute(0, 2, 1, 3).reshape(batch_size, sequence_length, self.num_heads * self.head_dim)
        out = self.linear_layer(values)
        return out

In [8]:
class LayerNormalization(nn.Module):
    def __init__(self, parameters_shape, eps=1e-5):
        super().__init__()
        self.parameters_shape=parameters_shape
        self.eps=eps
        self.gamma = nn.Parameter(torch.ones(parameters_shape))
        self.beta =  nn.Parameter(torch.zeros(parameters_shape))

    def forward(self, inputs):
        dims = [-(i + 1) for i in range(len(self.parameters_shape))]
        mean = inputs.mean(dim=dims, keepdim=True)
        var = ((inputs - mean) ** 2).mean(dim=dims, keepdim=True)
        std = (var + self.eps).sqrt()
        y = (inputs - mean) / std
        out = self.gamma * y + self.beta
        return out

In [9]:
class PositionwiseFeedForward(nn.Module):
    def __init__(self, d_model, hidden, drop_prob=0.1):
        super(PositionwiseFeedForward, self).__init__()
        self.linear1 = nn.Linear(d_model, hidden)
        self.linear2 = nn.Linear(hidden, d_model)
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(p=drop_prob)

    def forward(self, x):
        x = self.linear1(x)
        x = self.relu(x)
        x = self.dropout(x)
        x = self.linear2(x)
        return x

In [10]:
class EncoderLayer(nn.Module):
    def __init__(self, d_model, ffn_hidden, num_heads, drop_prob):
        super(EncoderLayer, self).__init__()
        self.attention = MultiHeadAttention(d_model=d_model, num_heads=num_heads)
        self.norm1 = LayerNormalization(parameters_shape=[d_model])
        self.dropout1 = nn.Dropout(p=drop_prob)
        self.ffn = PositionwiseFeedForward(d_model=d_model, hidden=ffn_hidden, drop_prob=drop_prob)
        self.norm2 = LayerNormalization(parameters_shape=[d_model])
        self.dropout2 = nn.Dropout(p=drop_prob)

    def forward(self, x, self_attention_mask):
        residual_x = x.clone()
        x = self.attention(x, mask=self_attention_mask)
        x = self.dropout1(x)
        x = self.norm1(x + residual_x)
        residual_x = x.clone()
        x = self.ffn(x)
        x = self.dropout2(x)
        x = self.norm2(x + residual_x)
        return x
 

In [11]:
class SequentialEncoder(nn.Sequential):
    def forward(self, *inputs):
        x, self_attention_mask  = inputs
        for module in self._modules.values():
            x = module(x, self_attention_mask)
        return x

In [12]:
class Encoder(nn.Module):
    def __init__(self, 
                 d_model, 
                 ffn_hidden, 
                 num_heads, 
                 drop_prob, 
                 num_layers,
                 max_sequence_length,
                 language_to_index,
                 START_TOKEN,
                 END_TOKEN, 
                 PADDING_TOKEN):
        super().__init__()
        self.sentence_embedding = SentenceEmbedding(max_sequence_length, d_model, language_to_index, START_TOKEN, END_TOKEN, PADDING_TOKEN)
        self.layers = SequentialEncoder(*[EncoderLayer(d_model, ffn_hidden, num_heads, drop_prob)
                                      for _ in range(num_layers)])

    def forward(self, x, self_attention_mask, start_token, end_token):
        x = self.sentence_embedding(x, start_token, end_token)
        x = self.layers(x, self_attention_mask)
        return x

In [13]:
class MultiHeadCrossAttention(nn.Module):
    def __init__(self, d_model, num_heads):
        super().__init__()
        self.d_model = d_model
        self.num_heads = num_heads
        self.head_dim = d_model // num_heads
        self.kv_layer = nn.Linear(d_model , 2 * d_model)
        self.q_layer = nn.Linear(d_model , d_model)
        self.linear_layer = nn.Linear(d_model, d_model)
    
    def forward(self, x, y, mask):
        batch_size, sequence_length, d_model = x.size() # in practice, this is the same for both languages...so we can technically combine with normal attention
        kv = self.kv_layer(x)
        q = self.q_layer(y)
        kv = kv.reshape(batch_size, sequence_length, self.num_heads, 2 * self.head_dim)
        q = q.reshape(batch_size, sequence_length, self.num_heads, self.head_dim)
        kv = kv.permute(0, 2, 1, 3)
        q = q.permute(0, 2, 1, 3)
        k, v = kv.chunk(2, dim=-1)
        values, attention = scaled_dot_product(q, k, v, mask) # We don't need the mask for cross attention, removing in outer function!
        values = values.permute(0, 2, 1, 3).reshape(batch_size, sequence_length, d_model)
        out = self.linear_layer(values)
        return out

In [14]:
class DecoderLayer(nn.Module):
    def __init__(self, d_model, ffn_hidden, num_heads, drop_prob):
        super(DecoderLayer, self).__init__()
        self.self_attention = MultiHeadAttention(d_model=d_model, num_heads=num_heads)
        self.layer_norm1 = LayerNormalization(parameters_shape=[d_model])
        self.dropout1 = nn.Dropout(p=drop_prob)

        self.encoder_decoder_attention = MultiHeadCrossAttention(d_model=d_model, num_heads=num_heads)
        self.layer_norm2 = LayerNormalization(parameters_shape=[d_model])
        self.dropout2 = nn.Dropout(p=drop_prob)

        self.ffn = PositionwiseFeedForward(d_model=d_model, hidden=ffn_hidden, drop_prob=drop_prob)
        self.layer_norm3 = LayerNormalization(parameters_shape=[d_model])
        self.dropout3 = nn.Dropout(p=drop_prob)

    def forward(self, x, y, self_attention_mask, cross_attention_mask):
        _y = y.clone()
        y = self.self_attention(y, mask=self_attention_mask)
        y = self.dropout1(y)
        y = self.layer_norm1(y + _y)

        _y = y.clone()
        y = self.encoder_decoder_attention(x, y, mask=cross_attention_mask)
        y = self.dropout2(y)
        y = self.layer_norm2(y + _y)

        _y = y.clone()
        y = self.ffn(y)
        y = self.dropout3(y)
        y = self.layer_norm3(y + _y)
        return y

In [15]:
class SequentialDecoder(nn.Sequential):
    def forward(self, *inputs):
        x, y, self_attention_mask, cross_attention_mask = inputs
        for module in self._modules.values():
            y = module(x, y, self_attention_mask, cross_attention_mask)
        return y

In [16]:
class Decoder(nn.Module):
    def __init__(self, 
                 d_model, 
                 ffn_hidden, 
                 num_heads, 
                 drop_prob, 
                 num_layers,
                 max_sequence_length,
                 language_to_index,
                 START_TOKEN,
                 END_TOKEN, 
                 PADDING_TOKEN):
        super().__init__()
        self.sentence_embedding = SentenceEmbedding(max_sequence_length, d_model, language_to_index, START_TOKEN, END_TOKEN, PADDING_TOKEN)
        self.layers = SequentialDecoder(*[DecoderLayer(d_model, ffn_hidden, num_heads, drop_prob) for _ in range(num_layers)])

    def forward(self, x, y, self_attention_mask, cross_attention_mask, start_token, end_token):
        y = self.sentence_embedding(y, start_token, end_token)
        y = self.layers(x, y, self_attention_mask, cross_attention_mask)
        return y

In [17]:
class Transformer(nn.Module):
    def __init__(self, 
                d_model, 
                ffn_hidden, 
                num_heads, 
                drop_prob, 
                num_layers,
                max_sequence_length, 
                kn_vocab_size,
                english_to_index,
                hindi_to_index,
                START_TOKEN, 
                END_TOKEN, 
                PADDING_TOKEN
                ):
        super().__init__()
        self.encoder = Encoder(d_model, ffn_hidden, num_heads, drop_prob, num_layers, max_sequence_length, english_to_index, START_TOKEN, END_TOKEN, PADDING_TOKEN)
        self.decoder = Decoder(d_model, ffn_hidden, num_heads, drop_prob, num_layers, max_sequence_length, hindi_to_index, START_TOKEN, END_TOKEN, PADDING_TOKEN)
        self.linear = nn.Linear(d_model, kn_vocab_size)
        self.device = device

    def forward(self, 
                x, 
                y, 
                encoder_self_attention_mask=None, 
                decoder_self_attention_mask=None, 
                decoder_cross_attention_mask=None,
                enc_start_token=False,
                enc_end_token=False,
                dec_start_token=False, # We should make this true
                dec_end_token=False): # x, y are batch of sentences
        x = self.encoder(x, encoder_self_attention_mask, start_token=enc_start_token, end_token=enc_end_token)
        out = self.decoder(x, y, decoder_self_attention_mask, decoder_cross_attention_mask, start_token=dec_start_token, end_token=dec_end_token)
        out = self.linear(out)
        return out

In [18]:
# Define parameters
d_model = 128 # Embedding size
batch_size = 32 # batch size to be fed to model 32 hindi sentence 32 english sentence at single point of time
ffn_hidden = 2048 # Number of hidden layer
num_heads = 8 # Number of attention heads
drop_prob = 0.1 # Percentage of neuron dropout
num_layers = 8 # Number of decoder-encoder
max_sequence_length = 90 #I've checked it in exploratary analysis-> 90 is ideal
chunk_size = 25000  # Process 25,000 rows at a time
num_epochs=10 # Number of epocs
START_TOKEN = '<START>' # Start token
PADDING_TOKEN = '<PADDING>' # Padding token
END_TOKEN = '<END>' # End token

## Preparing Data

### Read hindi file clean a bit and write it down again.

In [19]:
base_path = '/Users/siddharthchaudhary/Documents/git_repos/AI-Models/Transformer_from_scratch/'

In [20]:
train_en_file = base_path + 'Dataset/vocab_and_training_files/train_en.txt'
train_hn_file = base_path + 'Dataset/vocab_and_training_files/train_hn.txt'
english_vocab_file = base_path + 'Dataset/vocab_and_training_files/english_vocab.txt'
hindi_vocab_file = base_path + 'Dataset/vocab_and_training_files/hindi_vocab.txt'

model_path = base_path + "model/transformer_v1_hindi_english.pth"

In [21]:
model_path

'/Users/siddharthchaudhary/Documents/git_repos/AI-Models/Transformer_from_scratch/model/transformer_v1_hindi_english.pth'

### Reading the hindi, english text and vocab

In [22]:
with open(train_en_file, 'r') as file:
    english_sentences = file.readlines()
english_sentences = [sentence.rstrip('\n') for sentence in english_sentences]
english_sentences[:10]

['got it',
 'i m ok',
 'come in',
 'get out',
 'go away',
 'have fun',
 'have fun',
 'have fun',
 'i forgot',
 'i forgot']

In [23]:
with open(train_hn_file, 'r') as file:
    hindi_sentences = file.readlines()
hindi_sentences = [sentence.rstrip('\n') for sentence in hindi_sentences]
hindi_sentences[: 10]

['समझे कि नहीं',
 'मैं ठीक हूँ।',
 'अंदर आ जाओ।',
 'बाहर निकल जाओ',
 'चले जाओ',
 'मज़े करना।',
 'मौज करना।',
 'मज़े करो।',
 'मैं भूल गया।',
 'मैं भूल गई।']

In [24]:
# Initialize variables to store the maximum length sentence and its word count
max_length_sentence = ""
max_word_count = 0

# Iterate through sentences
for sentence in english_sentences:
    word_count = len(sentence.split())  # Count words in the current sentence
    if len(sentence) > len(max_length_sentence):  # Compare sentence length
        max_length_sentence = sentence
        max_word_count = word_count  # Update the word count

print(f"Longest Sentence: {max_length_sentence}")
print(f"Number of Words: {max_word_count}")

Longest Sentence: there are 104 members of icc 10 full members who play official test matches 34 associate members and 60 affiliate members icc is responsible for conduct and regulation of prominent international cricket tournaments specially world cup matches it appoints umpires and referees for all accepted test matches one day internationals and twenty 20 internationals every country has a national cricket board which regulates the cricket matches played in the country cricket board selects the national team also and makes arrangements for the matches both domestic and external
Number of Words: 87


In [25]:
with open(hindi_vocab_file, 'r') as file:
    hindi_vocab = file.readlines ()
hindi_vocab = [word.rstrip('\n') for word in hindi_vocab]
print(len(hindi_vocab) )

68142


In [26]:
with open (english_vocab_file, 'r') as file:
    english_vocab= file.readlines()
english_vocab = [word.rstrip('\n') for word in english_vocab]
print(len(english_vocab))
print(english_vocab[:10])

59893
['sikandara', 'bijapur', 'rumsfeld', 'pes', 'quits', 'kasavimantri', 'yaduendra', 'buxa', 'mindonly', 'laborers']


In [27]:
hindi_vocab.insert(0, START_TOKEN)
hindi_vocab.append(PADDING_TOKEN)
hindi_vocab.append(END_TOKEN)
print(len(hindi_vocab))
print(hindi_vocab[:10])

68145
['<START>', 'अर्काट', 'यवेस', 'रेगन', 'अड़े', 'क़ैदियों', '१६८८', 'कोलर्स', 'इडिपेंडेंट', 'टाँके']


In [28]:
english_vocab.insert(0, START_TOKEN) 
english_vocab.append(PADDING_TOKEN)
english_vocab.append(END_TOKEN)
print(len(english_vocab))
print(english_vocab[:20])

59896
['<START>', 'sikandara', 'bijapur', 'rumsfeld', 'pes', 'quits', 'kasavimantri', 'yaduendra', 'buxa', 'mindonly', 'laborers', 'sakhare', 'heptanesia', 'demanded', 'discontinuous', 'bootes', 'mig', 'pratipha', 'amalgamate', 'criticise']


In [29]:
index_to_hindi = {k:v for k,v in enumerate(hindi_vocab)}
hindi_to_index = {v:k for k,v in enumerate (hindi_vocab)}
index_to_english = {k:v for k,v in enumerate (english_vocab)}
english_to_index = {v:k for k,v in enumerate(english_vocab)}

In [30]:
# Get the first 20 key-value pairs
first_20_items = list(index_to_hindi.items())[:10]
# Print keys and values together
for key, value in first_20_items:
    print(f"{key}: {value}")

0: <START>
1: अर्काट
2: यवेस
3: रेगन
4: अड़े
5: क़ैदियों
6: १६८८
7: कोलर्स
8: इडिपेंडेंट
9: टाँके


In [31]:
# Get the first 20 key-value pairs
first_20_items = list(index_to_english.items())[:10]
# Print keys and values together
for key, value in first_20_items:
    print(f"{key}: {value}")

0: <START>
1: sikandara
2: bijapur
3: rumsfeld
4: pes
5: quits
6: kasavimantri
7: yaduendra
8: buxa
9: mindonly


In [32]:
print(f"Number of sentences: {len(hindi_sentences)}")
print(f"Number of sentences: {len(english_sentences)}")

Number of sentences: 124076
Number of sentences: 124076


In [33]:
class TextDataset(Dataset):
    def __init__(self, english_sentences, hindi_sentences):
        self.english_sentences = english_sentences
        self.hindi_sentences = hindi_sentences
    
    def __len__(self) :
        return len(self.english_sentences)
    
    def __getitem__(self, idx):
        return self.english_sentences[idx], self.hindi_sentences[idx]

## Training the model Model

In [34]:
hn_vocab_size = len(hindi_vocab)

In [35]:
transformer = Transformer(
    d_model,
    ffn_hidden,
    num_heads, 
    drop_prob, 
    num_layers, 
    max_sequence_length, 
    hn_vocab_size,
    english_to_index, 
    hindi_to_index,
    START_TOKEN, 
    END_TOKEN, 
    PADDING_TOKEN)

In [36]:
criterian = nn.CrossEntropyLoss(ignore_index=hindi_to_index[PADDING_TOKEN],
                                reduction= 'none')
# When computing the loss, we are ignoring cases when the label is the padding token
for params in transformer.parameters():
    if params.dim() > 1:
        nn.init.xavier_uniform_(params)
        
optim = torch.optim.Adam(transformer.parameters(), lr=1e-4)

In [37]:
NEG_INFTY = -1e9

def create_masks(eng_batch, hn_batch):
    num_sentences = len(eng_batch)
    look_ahead_mask = torch.full([max_sequence_length, max_sequence_length] , True)
    look_ahead_mask = torch.triu(look_ahead_mask, diagonal=1)
    encoder_padding_mask = torch.full([num_sentences, max_sequence_length, max_sequence_length] , False)
    decoder_padding_mask_self_attention = torch.full([num_sentences, max_sequence_length, max_sequence_length] , False)
    decoder_padding_mask_cross_attention = torch.full([num_sentences, max_sequence_length, max_sequence_length] , False)
    
    for idx in range(num_sentences):
        eng_sentence_length, hn_sentence_length = len(eng_batch[idx]), len(hn_batch[idx])
        eng_words_to_padding_mask = np.arange(eng_sentence_length + 1, max_sequence_length)
        hn_words_to_padding_mask = np.arange(hn_sentence_length + 1, max_sequence_length)
        encoder_padding_mask[idx, :, eng_words_to_padding_mask] = True
        encoder_padding_mask[idx, eng_words_to_padding_mask, :] = True
        decoder_padding_mask_self_attention[idx, :, hn_words_to_padding_mask] = True
        decoder_padding_mask_self_attention[idx, hn_words_to_padding_mask, :] = True
        decoder_padding_mask_cross_attention[idx,:, eng_words_to_padding_mask] = True
        decoder_padding_mask_cross_attention[idx, hn_words_to_padding_mask, :] = True
    
    encoder_self_attention_mask = torch.where(encoder_padding_mask, NEG_INFTY, 0)
    decoder_self_attention_mask = torch.where(look_ahead_mask + decoder_padding_mask_self_attention, NEG_INFTY, 0)
    decoder_cross_attention_mask = torch.where(decoder_padding_mask_cross_attention, NEG_INFTY, 0)
    # print f" encoder self _attention mask (encoder_self _attention mask size(l}: (encoder self_attention_maskl, :10, :101")
    # print (f"decoder_self_attention mask {decoder_self_attention_mask.size()}: {decoder_self_attention_mask[0, :10, :10]}")
    # print(f" decoder_cross_attention_mask {decoder_cross_attention_mask.size()}: {decoder_cross_attention_mask[0, :10, : 10]}")
    return encoder_self_attention_mask, decoder_self_attention_mask, decoder_cross_attention_mask

In [38]:
transformer.train()
transformer.to(device)
bst_loss = float("inf") # Initialize the best loss 
wrse_epochs = 0 # Counter for consecutive worse epochs 
max_wrse_epochs = 3 # Number of consecutive worse epochs before stopping

for epoch in range(num_epochs):
    print(f"EPOCH {epoch + 1}----------------------------------------------------------------------------------------")
    epch_loss = 0
    for start_idx in tqdm(range(0, len(english_sentences), chunk_size), desc="Processing Chunks"):
        end_idx = start_idx + chunk_size
        subset = TextDataset(
            english_sentences[start_idx:end_idx],
            hindi_sentences[start_idx:end_idx]
        )
        train_loader = DataLoader(subset, batch_size=batch_size, shuffle=True)  # Small batch size
        iterator = iter(train_loader)
        for batch_num, batch in enumerate(iterator):
            transformer.train()
            eng_batch, hn_batch = batch
            encoder_self_attention_mask, decoder_self_attention_mask, decoder_cross_attention_mask = create_masks(eng_batch, hn_batch)
            optim.zero_grad()
            hn_predictions = transformer(eng_batch,
                                         hn_batch,
                                         encoder_self_attention_mask.to(device), 
                                         decoder_self_attention_mask.to(device), 
                                         decoder_cross_attention_mask.to(device),
                                         enc_start_token=False,
                                         enc_end_token=False,
                                         dec_start_token=True,
                                         dec_end_token=True)
            labels = transformer.decoder.sentence_embedding.batch_tokenize(hn_batch, start_token=False, end_token=True)
            loss = criterian(
                hn_predictions.view(-1, hn_vocab_size).to(device),
                labels.view(-1).to(device)
            ).to(device)
            valid_indicies = torch.where(labels.view(-1) == hindi_to_index[PADDING_TOKEN], False, True)
            loss = loss.sum() / valid_indicies.sum()
            loss.backward()
            optim.step()
            epch_loss += loss.item() # Accumulate batch losses
            
            if batch_num % 100 == 0:
                print(f"Iteration {batch_num} : {loss.item()}")
                print(f"English: {eng_batch[0]}")
                print(f"hindi Translation: {hn_batch[0]}")
                hn_sentence_predicted = torch.argmax(hn_predictions[0], axis=1)
                predicted_sentence = ""
                for idx in hn_sentence_predicted:
                    if idx == hindi_to_index[END_TOKEN]:
                        break
                    predicted_sentence += index_to_hindi[idx.item()] + " " # Add a space after each word
                print(f"hindi Prediction: {predicted_sentence}")
    
    
                transformer.eval()
                hn_sentence = ("",)
                eng_sentence = ("put folder in the bin",)
                for word_counter in range(max_sequence_length):
                    encoder_self_attention_mask, decoder_self_attention_mask, decoder_cross_attention_mask= create_masks(eng_sentence, hn_sentence)
                    predictions = transformer(eng_sentence,
                                              hn_sentence,
                                              encoder_self_attention_mask.to(device), 
                                              decoder_self_attention_mask.to(device), 
                                              decoder_cross_attention_mask.to(device),
                                              enc_start_token=False,
                                              enc_end_token=False,
                                              dec_start_token=True,
                                              dec_end_token=False)
                    next_token_prob_distribution = predictions[0][word_counter] # not actual probs
                    next_token_index = torch.argmax(next_token_prob_distribution).item()
                    next_token = index_to_hindi[next_token_index]
                    hn_sentence = (hn_sentence[0] + next_token + " ", ) # Add a space after each word
                    if next_token == END_TOKEN:
                      break
                print(f"Evaluation translation (put folder in the bin) : {hn_sentence}")
                print("-------------------------------------------")
    
    # Evaluate and save model if the epoch improves the best loss 
    print("------------------------------------------------------------------------------------------------------")
    print(f"Epoch {epoch + 1} Loss: {epch_loss}") 
    if epch_loss < bst_loss: 
        bst_loss = epch_loss 
        wrse_epochs = 0 # Reset counter for worse epochs 
        torch.save(transformer, model_path)
        print(f"Saved Best Model at Epoch {epoch + 1} with Loss: {bst_loss}") 
    else: 
        wrse_epochs += 1 # Increment counter for worse epochs 
        print(f"Epoch {epoch + 1} did not improve. Consecutive worse epochs: {wrse_epochs}") 
        
    # Stop training if the loss doesn't improve for 3 consecutive epochs    
    if wrse_epochs >= max_wrse_epochs:
        print(f"Stopping training after {max_wrse_epochs} consecutive worse epochs.") 
        break

EPOCH 1----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 11.136124610900879
English: when this has been done the bill is ready to be brought before the house
hindi Translation: इस समूची प्रक्रिया के पश्चात विधेयक सदन के समक्ष लाए जाने के लिए तैयार हो जात है
hindi Prediction: कवितावली जिलो लेआऊँ कुटीरोद्योगी पकड़वाले बहुराष्ट्रीय सुविधा बहुराष्ट्रीय जयवंत जिलो कवितावली सुदारों फसलं परपोतों मुर्गीपालन सुदारों मुर्गीपालन जयवंत कवितावली जिलो मुर्गीपालन दुनपुर जिलो सुदारों कुटीरोद्योगी पैंगुइन्स मुर्गीपालन बहुराष्ट्रीय जिलो बहुराष्ट्रीय मुर्गीपालन कवितावली बृजभाषा मुर्गीपालन जिलो कवितावली अंतर्हित वेश्यावृत ममेरा पकड़वाले मुर्गीपालन जयवंत मुर्गीपालन छेड पोलीनियस मुर्गीपालन कवितावली सुदारों सुदारों छेड पकड़वाले पकड़वाले फार्मूले वेश्यावृत ज्यूडिशियल सुदारों कवितावली किरासन फसलं कवितावली कवितावली लेआऊँ गुफाएं बहुराष्ट्रीय सुदारों मुर्गीपालन कवितावली लेआऊँ कवितावली बृजभाषा पकड़वाले जिलो उत्कंठा बहुराष्ट्रीय जिलो पुण्यप्रद जिलो पैंगुइन्स कवितावली पकड़वाले दैतिक जिलो कवितावली बहुराष्ट्रीय मूवियों पकड़वाले छेड सुविधाविहीन पैंगुइन्स जिलो 


Processing Chunks:  20%|██        | 1/5 [04:53<19:33, 293.30s/it]

Iteration 0 : 7.438241481781006
English: after pharakka dam was built there was help in the life of fishes in the ganga river
hindi Translation: फरक्का बांध बन जाने से गंगा नदी में हिल्सा मछली के बीजोत्पादन में सहायता मिली है।
hindi Prediction: के के के के के के के के के के के के के के के 
Evaluation translation (put folder in the bin) : ('<END> ',)
-------------------------------------------
Iteration 100 : 7.4728851318359375
English: and when an officer suffered bullet injuries in the stomach the dgp philosophised pet bara zalim hota hai goli bhi pacha jayega lrb the stomach is cruel
hindi Translation: और जब एक अधिकारी के पेट में गोली लगी तो ड़ीजीपी ने दार्शनिक अंदाज में कहा       पेट बड़ जालिम होता है   गोली भी पचा जाएगा
hindi Prediction: के के के के के के के के के के के के के के 
Evaluation translation (put folder in the bin) : ('के के <END> ',)
-------------------------------------------
Iteration 200 : 7.182496547698975
English: future reviews
hindi Translation: भावी समीक्षाएं
hi

Processing Chunks:  40%|████      | 2/5 [09:43<14:34, 291.37s/it]

Iteration 0 : 7.416233539581299
English: he was the head of a monastery and had a large following his place sonnalige lrb sholapur of maha rashtra rrb was a small village he built it into a big town
hindi Translation: वह एक मठ का मठाधीश था और उसके शिष्यों की विशाल संख़्या थी उसकी जगह सोन्नातिगे   महाराष्ट्र का शोलापुर   नामक एक छोटा गांव था   जिसे उसने बड़ा नगर बना दिया था
hindi Prediction: यह के के के एक के 
Evaluation translation (put folder in the bin) : ('और और यह यह यह एक यह <END> ',)
-------------------------------------------
Iteration 100 : 7.2128705978393555
English: in progesive india mumbai which was earlier known as bombay is the capital of indian kingdom maharastra
hindi Translation: भारत के पश्चिमी तट पर स्थित मुम्बई  पूर्व नाम बम्बई  भारतीय राज्य महाराष्ट्र की राजधानी है।
hindi Prediction: और के एक एक के एक के के के के के लिए के के लिए के 
Evaluation translation (put folder in the bin) : ('और और और यह यह यह यह यह यह एक एक यह एक यह एक एक एक एक एक एक एक एक एक एक एक एक एक ए

Processing Chunks:  60%|██████    | 3/5 [14:27<09:35, 287.94s/it]

Iteration 0 : 6.6395697593688965
English: thereafter he went to delhi and took admission in kirodimal college and got science degree
hindi Translation: उन्होंने बाद अध्ययन करने के लिए ये दिल्ली विश्वविद्यालय के किरोड़ीमल कॉलेज चले गए जहां इन्होंने विज्ञान स्नातक की उपाधि प्राप्त की।
hindi Prediction: इस एक के के के लिए लिए लिए के के लिए के के है 
Evaluation translation (put folder in the bin) : ('और और यह एक एक <END> ',)
-------------------------------------------
Iteration 100 : 6.695461750030518
English: we need to teach listening in our schools
hindi Translation: हमे स्कूलों में सुनना सिखाने की जरूरत हैं
hindi Prediction: और एक के एक के के लिए है 
Evaluation translation (put folder in the bin) : ('और यह एक एक <END> ',)
-------------------------------------------
Iteration 200 : 6.735112190246582
English: they put an rfid bracelet on the baby
hindi Translation: उन्होंने एक आर  अफ  आई  दी  कंगन पहना दिया बच्ची को
hindi Prediction: और एक एक से के के 
Evaluation translation (put folder 

Processing Chunks:  80%|████████  | 4/5 [19:09<04:45, 285.92s/it]

Iteration 0 : 6.78009033203125
English: but on the insistence of friends and relations he agreed to have a legal adviser to watch the procedings of the tribunal and to give him advice on lines of cross examination
hindi Translation: लेकिन दोस्तों और संबंधियों के आग्रह पर उन्होंने ट्रिब्यूनल की कार्यवाही पर नजर रखने और जिरह के लिए उन्हें परामर्श देने के लिए एक कानूनी परामर्शदाता का सहयोग लेना स्वीकार कर लिया
hindi Prediction: इस यह के लिए के लिए के एक एक के एक के एक के के लिए है लिए है एक के के लिए एक है है के भी के है के है 
Evaluation translation (put folder in the bin) : ('और हम एक <END> ',)
-------------------------------------------
Iteration 100 : 6.5449604988098145
English: the new india has become the oldest india inhabited by crazy hindus in frightening fancy dress
hindi Translation: नया भारत उस पुराने भारत में तदील हो गया है   जिसमें भयभीत करने वाले बाने में खती हिंदुओं का वास है
hindi Prediction: यह एक के और एक के एक के है है कि यह के के एक के भी के के एक के 
Evaluation trans

Processing Chunks: 100%|██████████| 5/5 [23:40<00:00, 284.04s/it]


Epoch 1 Loss: 27561.55429172516
Saved Best Model at Epoch 1 with Loss: 27561.55429172516
EPOCH 2----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 6.530716896057129
English: nearly all the administrative positions were occupied by englishmen and many of the new laws for india were debated not only between englishmen but quite often not even on indian soil
hindi Translation: लगभग सभी प्रशासनिक पदों पर अंग्रेज विराजमान थे और भारत के लिए बनने वाले कानूनों पर न केवल अंग्रेजों के बीच ही विवाद होता था बल्कि अक़्सर यह विवाद भारत की धरती पर भी नहीं होता था
hindi Prediction: यह एक एक के के एक और के और यह के लिए एक के के के एक भी एक के लिए के भी के है 
Evaluation translation (put folder in the bin) : ('और हम आप <END> ',)
-------------------------------------------
Iteration 100 : 6.324617385864258
English: idioceus the mangohopper bug that causes damage to mango blossoms belongs here
hindi Translation: आमफुदका आइडियोसिरस मत्कुण आम मंजरी को क्षति पहुंचाता है
hindi Prediction: इस के के के और के एक के है 
Evaluation translation (put folder in the bin) : ('और मैं एक नहीं है <END> ',)
-------------------------------------------
It

Processing Chunks:  20%|██        | 1/5 [04:44<18:57, 284.43s/it]

Iteration 0 : 6.648044586181641
English: the government has made a number of significant changes to the race relations act 1976
hindi Translation: सरकार ने रेस रिलेशन्ज़ ऐक्ट        नस्ली सम्बन्धी अधिनियम   में बहुत से मुख्य परिवर्तन लाये
hindi Prediction: इस के एक के के के और और के एक एक एक भी 
Evaluation translation (put folder in the bin) : ('और मैं आप से <END> ',)
-------------------------------------------
Iteration 100 : 6.347762107849121
English: they are skating they are doing street plays
hindi Translation: वे स्केटिंग कर रहे हैं  वे नुक्कड़ नाटक कर रहे हैं
hindi Prediction: और एक में है है कि आप के 
Evaluation translation (put folder in the bin) : ('और मैं आप से <END> ',)
-------------------------------------------
Iteration 200 : 6.3467116355896
English: i did comic book arbitrage
hindi Translation: मैनें कॉमिक्स की अदला बदली भी की ।
hindi Prediction: और एक के 
Evaluation translation (put folder in the bin) : ('और मैं आप <END> ',)
-------------------------------------------


Processing Chunks:  40%|████      | 2/5 [09:22<14:01, 280.61s/it]

Iteration 0 : 6.524257659912109
English: nepal toss evidence about the origin of the word is nothing but a well known by faith by the term ashrushti and paul cave is made up
hindi Translation: नेपाल शब्द की उत्त्पत्ति के बारे मे ठोस प्रमाण कुछ नही है लेकिन एक प्रसिद्ध विश्वास अनुसार यह शब्द ने ऋषि तथा पाल  गुफा  मिलकर बना है।
hindi Prediction: यह के के एक के लिए में एक रूप है एक है कि यह एक के करने भी भी के एक के एक के के भी है 
Evaluation translation (put folder in the bin) : ('और आप एक <END> ',)
-------------------------------------------
Iteration 100 : 6.395111560821533
English: the antibodies produced by the animal after the injection of the venom are used to make the serum
hindi Translation: जहर के इंजेक्शन के बाद जानवर के शरीर में निर्मित एंटीबॉड़ी   प्रतिरक्षी   का इस्तेमाल सीरम बनाने के लिए किया जाता है
hindi Prediction: इस के लिए में लिए के में लिए में एक भी के के एक किया और के लिए एक है है 
Evaluation translation (put folder in the bin) : ('और आप से <END> ',)
---------------

Processing Chunks:  60%|██████    | 3/5 [14:00<09:18, 279.44s/it]

Iteration 0 : 6.589354038238525
English: and so that s what it s about
hindi Translation: और देखिये इसी सब पर ये आधारित है।
hindi Prediction: और आप भी नहीं नहीं 
Evaluation translation (put folder in the bin) : ('और आप भी <END> ',)
-------------------------------------------
Iteration 100 : 6.51075553894043
English: the author of purana has explained the ill will of godessess but the real intention was to establish virtue and right
hindi Translation: पुराणकारों ने देवताओं की दुष्प्रवृत्तियों का व्यापक विवरण किया है लेकिन मूल उद्देश्य सद्भावना का विकास और सत्य की प्रतिष्ठा ही है।
hindi Prediction: इस के एक के एक के एक ही के है और वे प्रकार के के एक के लिए में एक के एक 
Evaluation translation (put folder in the bin) : ('और आप भी भी <END> ',)
-------------------------------------------
Iteration 200 : 6.58120584487915
English: the government high school run by the british was reopened
hindi Translation: अंग्रेजों द्वारा स्थापित गवर्नमेंट हाई स्कूल पुन   खोल दिया गया
hindi Prediction: और क

Processing Chunks:  80%|████████  | 4/5 [1:23:47<30:22, 1822.27s/it]

Iteration 0 : 6.207591533660889
English: legal lawful acceptance of pain
hindi Translation: एक वैध उपकरण के रूप में यातना के आधिकारिक स्वीकृति
hindi Prediction: और एक है के लिए में 
Evaluation translation (put folder in the bin) : ('और आप से एक है <END> ',)
-------------------------------------------
Iteration 100 : 6.186358451843262
English: michael with the orders from god changes the weather
hindi Translation: मीकाईल           जो ईश्वर के समादेश पर मौसम बदलनेवाला देवदूत
hindi Prediction: और के एक के लिए में एक के है। 
Evaluation translation (put folder in the bin) : ('और आप एक है <END> ',)
-------------------------------------------
Iteration 200 : 6.720801830291748
English: but where a choice between two positions has to be made the congress must without fear back the vital groupsthe masses the kisans and petty zamindars and landless people even though the consequences might be the driving away of the taluqadars and the big zamindars
hindi Translation: लेकिन जब दो स्थितियों में से 

Processing Chunks: 100%|██████████| 5/5 [2:44:04<00:00, 1968.91s/it]


Epoch 2 Loss: 24883.520357608795
Saved Best Model at Epoch 2 with Loss: 24883.520357608795
EPOCH 3----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 5.919589042663574
English: 3 written constitution will be compulsarily in written form because it must clearly state division of powers
hindi Translation: लिखित सविन्धान अनिवार्य रूप से लिखित रूप मे होगा क्योंकि उसमे शक्ति विभाजन का स्पषट वर्णन आवश्यक है।
hindi Prediction: इस प्रकार के के के एक प्रकार के एक और यह एक के के एक है कर कर 
Evaluation translation (put folder in the bin) : ('और आप तरह के लिए <END> ',)
-------------------------------------------
Iteration 100 : 6.3282318115234375
English: to make the consistency of hugali river in summer season release the big amount of water of ganga river from pharkha dam to hugali river
hindi Translation: ग्रीष्म ऋतु में हुगली नदी के बहाव को निरंतर बनाये रखने के लिये गंगा नदी के जल के एक बड़े हिस्से को फ़रक्का बाँध के द्वारा हुगली नदी में मोड़ दिया जाता है।
hindi Prediction: इस के के एक के के लिए में एक एक गया के लिए एक के के लिए के लिए एक और के एक और के लिए एक के के एक किया 
Evaluation translation (put folder in the bin) : ('

Processing Chunks:  20%|██        | 1/5 [1:16:00<5:04:00, 4560.20s/it]

Iteration 0 : 6.452909469604492
English: to police a user
hindi Translation: एक यूज़र की निगरानी में खर्च हो
hindi Prediction: और तरह से है 
Evaluation translation (put folder in the bin) : ('और मैं आप से <END> ',)
-------------------------------------------
Iteration 100 : 6.3122334480285645
English: my students to delegates to the world trade organization
hindi Translation: विश्व व्यापार संगठन के प्रतिनिधियों को अपने छात्रों
hindi Prediction: और के के के लिए में एक लिए में के 
Evaluation translation (put folder in the bin) : ('और आप तरह के लिए <END> ',)
-------------------------------------------
Iteration 200 : 6.330966949462891
English: bhagat singh was admired in this and his martyrdom was seen as a victory over gaandhivaad
hindi Translation: इसमें भगतसिंह की प्रशंसा की गई थी तथा उनकी शहादत को गांधीवाद के उपर विजय के रूप में देखा गया था ।
hindi Prediction: इस यह के एक है है कि कि यह यह के यह के लिए एक के लिए में भी है है 
Evaluation translation (put folder in the bin) : ('और मैं आ

Processing Chunks:  40%|████      | 2/5 [2:54:38<4:27:56, 5358.93s/it]

Iteration 0 : 6.179574489593506
English: nasa space flight medal
hindi Translation: नासा अंतरिक्ष उड़ान पदक
hindi Prediction: और के 
Evaluation translation (put folder in the bin) : ('और आप तरह के लिए <END> ',)
-------------------------------------------
Iteration 100 : 6.313223361968994
English: one who does dharam maitri
hindi Translation: जो धम्म मैत्री की वृद्धि करे
hindi Prediction: और एक भी के 
Evaluation translation (put folder in the bin) : ('और आप तरह के लिए <END> ',)
-------------------------------------------
Iteration 200 : 6.126039028167725
English: the operations were by and large labour intensive and electrical equipment and coal cutting machinery were not much in evidence till after the war
hindi Translation: कार्यप्रणाली भी मुख़्य रूप से श्रम निर्देशित थी और युद्ध समाप्ति के बाद तक भी विद्युत उपकरणों और कोयला काटने की मशीनों पुराने ढंग की थीं और उनका भी उचित ओंर पर्याप्त प्रयोग नहीं होता था
hindi Prediction: इस में एक तरह के भी के और और वह के के लिए और एक एक है के अन्य

Processing Chunks:  60%|██████    | 3/5 [4:12:23<2:48:04, 5042.16s/it]

Iteration 0 : 5.985119819641113
English: this practice is illegal and takes advantage of the fact that you have fewer rights when you buy from a private seller
hindi Translation: ऐसा करना अवैध है और यह बात का फायदा उठाया जाता है कि निजी व्यापारी से सामान खऋरीदने पर आपके अपेक्षतया कम अधिकार होते हैं
hindi Prediction: इस एक है है कि यह एक है है है है है कि वह तरह के एक के के नहीं लिए ही है है है 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 6.452840328216553
English: is because we were in europe
hindi Translation: की हम यूरोप में थे
hindi Prediction: और एक एक के 
Evaluation translation (put folder in the bin) : ('और हम हम एक नहीं है <END> ',)
-------------------------------------------
Iteration 200 : 6.058716297149658
English: jack hobbs was the greatest master of this art because when the ball was new and moving a great deal he never played a ball which he could avoid and which was unlikely to hit t

Processing Chunks:  80%|████████  | 4/5 [5:06:03<1:12:02, 4322.90s/it]

Iteration 0 : 6.240297794342041
English: the added weight behind compensates for this
hindi Translation: तब नितंब का अतिरिक्त वजन संतुलन साधता है
hindi Prediction: और एक के एक एक के के के 
Evaluation translation (put folder in the bin) : ('और यह एक तरह <END> ',)
-------------------------------------------
Iteration 100 : 6.055503845214844
English: this way formation or integration of rajasthan was completed
hindi Translation: इसी के साथ आज से राजस्थान का निर्माण या एकीकरण पूरा हुआ।
hindi Prediction: और प्रकार लिए एक एक एक के एक नहीं 
Evaluation translation (put folder in the bin) : ('और यह एक तरह <END> ',)
-------------------------------------------
Iteration 200 : 6.172871112823486
English: for example new york passed a law
hindi Translation: उदाहरण के लिए  न्यूयॉर्क में एक कानून पास हुआ
hindi Prediction: और के लिए एक के 
Evaluation translation (put folder in the bin) : ('और यह एक तरह है <END> ',)
-------------------------------------------
Iteration 300 : 6.323243618011475
English: t

Processing Chunks: 100%|██████████| 5/5 [6:39:25<00:00, 4793.04s/it]  


Epoch 3 Loss: 24018.089849948883
Saved Best Model at Epoch 3 with Loss: 24018.089849948883
EPOCH 4----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 5.909209728240967
English: we need to put money where it can productively grow
hindi Translation: हमें निवेश वहाँ करना चाहिए जहाँ ये लाभजनक रूप से बढ़ सके
hindi Prediction: और यह के के कर कि हम है है 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.753538608551025
English: during bowling we can keep elbow at any angle or swing in any angle but at the same Tears in my eyes it can t be striate if elbow becomes striate in not permeated way then square leg umpire can declare the no ball according to current rules blower can straiten his arms up to 15 or less
hindi Translation: गेंदबाजी के दौरान कोहनी को किसी भी कोण पर रखा जा सकता है या मोड़ा जा सकता है लेकिन इस दौरान उसे सीधा नहीं किया जा सकता है  यदि कोहनी अवैध रूप से सीधी हो जाती है तो स्क्वेर लेग अम्पायर इसे नो बॉल           घोषित कर सकता है  वर्तमान नियमों के अनुसार एक गेंदबाज अपनी भुजा को १५ डिग्री या उससे कम तक सीधा कर सकता है
hindi P

Processing Chunks:  20%|██        | 1/5 [23:47<1:35:10, 1427.67s/it]

Iteration 0 : 6.056212902069092
English: the chains on hindi language and literature
hindi Translation: हिन्दी भाषा और साहित्य पर और कड़ियाँ
hindi Prediction: और के के हिन्दी के 
Evaluation translation (put folder in the bin) : ('यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.959221839904785
English: they checked schedules they were meeting with secretaries
hindi Translation: समय सारिणियाँ बनाईं  सचिवों से मुलाकातें कीं
hindi Prediction: और के के के के एक के 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 200 : 6.084525108337402
English: after muavia raji became the caliph the caliphate became inherited
hindi Translation: मुआविया रजी  के खलीफा बनने के बाद खिलाफत वंशानुगत हो गयी।
hindi Prediction: भारत के के साथ में में लिए में में भाग 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 300 : 5.96229

Processing Chunks:  40%|████      | 2/5 [28:24<37:32, 750.69s/it]   

Iteration 0 : 5.829010963439941
English: as during his first voyage rabindranath took to his cabin and did not stir outthis Tears in my eyes for four days
hindi Translation: और जैसा कि पहली बार यात्रा के दौरान रवीन्द्रनाथ अपनी केबिन में बंद हो गए थे और कभी बाहर निकलते ही नहीं थे  ठीक वैसे ही इस बार भी लगातार चार दिनों तक बाहर झांका तक नहीं
hindi Prediction: यह यह कि यह प्रकार एक के लिए यह के तरह में एक करने दिया और 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 6.072662353515625
English: we could focus on her recovery
hindi Translation: और हम उसके स्वास्थ्य लाभ पर ध्यान दे पाए
hindi Prediction: और यह एक पास में कर 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 200 : 6.022204399108887
English: if they happen to hit right ideas on which to build their experimental or theoretical work they spark a breakthrough
hindi Transla

Processing Chunks:  60%|██████    | 3/5 [33:51<18:34, 557.31s/it]

Iteration 0 : 5.922760963439941
English: so how do you construct belief
hindi Translation: तो आप कैसे विश्वास की आधार शिला रखेंगे
hindi Prediction: आप आप में एक कर 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 6.10112190246582
English: it is otherwise with scientific theories
hindi Translation: वैज्ञानिक सिद्धांतों की बात इससे पूर्णत   भिन्न है
hindi Prediction: और तरह में एक है है है है 
Evaluation translation (put folder in the bin) : ('और यह एक तरह <END> ',)
-------------------------------------------
Iteration 200 : 6.046688556671143
English: ordinary wheat is even a higher polyploid it is hexaploid lrb 6n rrb with 42 chromosomes
hindi Translation: साधारण गेहूं षट्गुणित होता है    न्   तथा उसमें    गुणसूत्र होते हैं
hindi Prediction: इस समय के और है और और अन्य एक के हैं और के के के और और और और 
Evaluation translation (put folder in the bin) : ('और एक एक है <END> ',)
-----------------------------

Processing Chunks:  80%|████████  | 4/5 [40:10<08:06, 486.86s/it]

Iteration 0 : 6.046917915344238
English: in the an damans he composed his poem kamala in a special blank verse which he named vinayak vritta
hindi Translation: अंडमान में उन्होंने एक खास तरह के मुक्त छंद में   कमला   नामक कविता लिखी   जिसे बाद में   विनायक वृत्त   नाम दिया
hindi Prediction: इस ने एक अपने बार और के लिए थे में एक थे और के गया तक में एक के के के 
Evaluation translation (put folder in the bin) : ('और एक एक है <END> ',)
-------------------------------------------
Iteration 100 : 6.166965007781982
English: wings of fire an autobiography of apj abdul kalam written by abdul kalam auriant longman 1999 isbn 81 7371 146 1
hindi Translation: विंग्स आफ फायर  एन आटोबायोग्राफी आफ एपीजे अब्दुल कलाम एपीजे अब्दुल कलाम कृत अरुण तिवारी  ओरियेंट लांगमैन
hindi Prediction: हिन्दी के हिन्दी और एस और कलाम कलाम कलाम और 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 200 : 5.851659297943115
English: and that was the 

Processing Chunks: 100%|██████████| 5/5 [51:52<00:00, 622.45s/it]


Epoch 4 Loss: 23176.178472995758
Saved Best Model at Epoch 4 with Loss: 23176.178472995758
EPOCH 5----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 5.783653259277344
English: to write about you on the little flier
hindi Translation: तुम्हारे बारे में विज्ञापन के पर्चे में क्या लिखुँ ।
hindi Prediction: और लिए में एक के लिए के 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.901514053344727
English: we use cnc to make scaffolding
hindi Translation: हम सीएनसी से मचान बनाते हैं
hindi Prediction: और एक के एक से है 
Evaluation translation (put folder in the bin) : ('यह एक है <END> ',)
-------------------------------------------
Iteration 200 : 5.664328575134277
English: science arts literature mathematics astronomy industries philosophy etc flourished in their reign
hindi Translation: विज्ञान कला साहित्य गणित खगोल शास्त्र प्राचीन प्रौद्योगिकी धर्म तथा दर्शन इन्हीं राजाओं के शासनकाल में फ़ले फ़ूले ।
hindi Prediction: इस के के के के और और आर के के अन्य के हैं। के साथ में 
Evaluation translation (put folder in the bin) : ('और यह एक है <END

Processing Chunks:  20%|██        | 1/5 [13:36<54:24, 816.20s/it]

Iteration 0 : 5.869423866271973
English: and when the peasants organised political and economic struggles against the zamindars landlords and money lenders the government brought into action against them the entire police and judicial machinery in the name of law and order and often bru tally suppressed their struggles
hindi Translation: और जब उसने जमींदारों   भू स्वामियों और महाजनों के विरुद्ध राजनीतिक और आर्थिक संघर्ष का संगठन किया तब सरकार ने कानून और व्यवस्था के नाम पर अपनी सारी पुलिस और मशीनरी का उसके विरुद्ध इस्तेमाल किया और अक्सर निर्दयतापूर्वक उसके संघर्ष को कुचल दिया
hindi Prediction: इस यह यह भी के रूप के अन्य के लिए ही रूप अधिक रूप के अधिकार है गया यह के एक के अन्य के लिए के एक ओर और के अधिक के एक लिए ही किया गया वह वह के लिए के भी कर 
Evaluation translation (put folder in the bin) : ('यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.76185417175293
English: this grave is bigger than mumtaz grave but it exhibits the same component one great bas

Processing Chunks:  40%|████      | 2/5 [25:04<37:02, 740.91s/it]

Iteration 0 : 5.8650102615356445
English: british government reamined firm on its decision and hangged bhagat sinh and his colleagues
hindi Translation: अंग्रेज सरकार अपने स्थान पर अडी रही और भगत सिंह और उनके साथियों को फॉंसी दी गयी।
hindi Prediction: लेकिन ऊण्श्छ्ष् ने लिए में उन्होंने हुए है वे ने ने त पास के एक 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.877147674560547
English: its onset is rather abrupt the child experiences frequency of urination excessive thirst increase in appetite but paradoxically loss of weight
hindi Translation: यह अचानक शुरू होता है तथा बच्चे को बार बार पेशाब आता है   अधिक प्यास लगती है   भूख बढ़ जाती है परंतु शरीर का वजन कम होता जाता है
hindi Prediction: इस एक है है है कि यह के एक एक एक करने है और ही के है और और सकता है 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 200 : 5.81655454635

Processing Chunks:  60%|██████    | 3/5 [37:14<24:31, 735.97s/it]

Iteration 0 : 5.452186584472656
English: he had decided not to follow the beaten track but lead a life conducive to his own spiritual advancement and the uplift of his fellowmen
hindi Translation: उनका निश्चय था कि लीक नहीं पीटेंगे और ऐसी जिंदगी अपनायेंगे जो उनकी अपनी आध्यात्मिक उन्नति और साथियों के उत्थान में सहायक हो
hindi Prediction: लेकिन एक है कि यह है है के पास समय के के भी ओर तरह तरह की वह के लिए में नहीं नहीं 
Evaluation translation (put folder in the bin) : ('और यह भी है <END> ',)
-------------------------------------------
Iteration 100 : 5.970447063446045
English: he never went to the races never gambled drank played cards for stakes never went to nautch parties
hindi Translation: वह घुडऋदऋडऋ देखने कभी नहीं गये   जुआ कभी नहीं खेले और शराब   पतऋ ऊण्श्छ्ष् तेबाजी व नाच की मफि लो से हमेशा दूर रहे
hindi Prediction: लेकिन यह ने के कहा नहीं और ने उन्होंने था 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iterat

Processing Chunks:  80%|████████  | 4/5 [47:35<11:30, 690.76s/it]

Iteration 0 : 5.63781213760376
English: in akbar s Tears in my eyes the sense of nationhood was still more limited
hindi Translation: अकबर के समय राष्ट्रीयता का अर्थ और भी सीमित था
hindi Prediction: इस ने बाद में ने एक हुआ उनके ही है 
Evaluation translation (put folder in the bin) : ('और यह एक एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.254788398742676
English: to regard culture as the privilege of any particular class is against the spirit of democracy and to permit the individual to give free expression to his idiosyncrasies even when they are harmful to society is the negation of socialism
hindi Translation: संस्कृति को एक वर्ग विशेष का विशेषाधिकार मानना प्रजातंत्र की आत्मा के विरूद्ध है और किसी व्यक़्ति को उसकी विशिष्टता की अभिव्यक़्ति की अनुमति देना   ऐसी स्थिति में भी जबकि वे समाज के लिए हानिकर हैं   समाजवाद को अस्वीकार करना है
hindi Prediction: इस के एक बार के और एक था है के ओर के लिए ही और वे प्रकार के एक तरह की गई की जाती से चाहिए है के नहीं ह

Processing Chunks: 100%|██████████| 5/5 [1:00:17<00:00, 723.53s/it]


Epoch 5 Loss: 22350.120428085327
Saved Best Model at Epoch 5 with Loss: 22350.120428085327
EPOCH 6----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 5.628194332122803
English: those efforts had come to a naught
hindi Translation: पर तब ऐसे प्रयास नाकाम रहे दे
hindi Prediction: और यह यह साल से रहे हैं रहे 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.490630149841309
English: and it is because of mitosis that the body cell retains intact its genetic patrimony in all the successors it breeds by division
hindi Translation: समसूत्रण के फलस्वरूप कोशिका विभाजन से कायिक कोशिकाओं द्वारा प्रजनित सारी कोशिकाएं आनुवंशिक पैतृकता बनाये रखती है
hindi Prediction: यह के लिए में के के एक और के एक और तरह के और के हैं हैं 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 200 : 5.768176078796387
English: so why ca n t our liberals be more like thackeray
hindi Translation: तो हमारे उदारवादी थोडऋ आकरे की तरह क्यों नहीं बन जाते
hindi Prediction: हम हम पास को के के तरह से करते 

Processing Chunks:  20%|██        | 1/5 [10:10<40:42, 610.69s/it]

Iteration 0 : 5.697429656982422
English: so it s a big design job
hindi Translation: संरचना की दृष्टि से ये बहुत बड़ी बात है
hindi Prediction: और को तरह से नहीं नहीं है है। है 
Evaluation translation (put folder in the bin) : ('यह एक बड़ा है। <END> ',)
-------------------------------------------
Iteration 100 : 5.532821178436279
English: a puzzle and its solution 15th december 1921 4
hindi Translation: एक पहेली और उसका हल    दिसंबर
hindi Prediction: यह साल के अन्य एक है में के के के 
Evaluation translation (put folder in the bin) : ('और यह एक है <END> ',)
-------------------------------------------
Iteration 200 : 5.617731094360352
English: employers will want to be sure that the people they are thinking of taking on are reliable
hindi Translation: काम देने वाले इस बात की ओर विशेष ध्यान देते हैं कि वे उन्हीं लोगों को काम दें जिन पर विश्वास किया जा सके  भाष्
hindi Prediction: अगर करने से या तरह से है के या के हैं और आप आप के में अपने कर 
Evaluation translation (put folder in the bin) : 

Processing Chunks:  40%|████      | 2/5 [15:14<21:30, 430.10s/it]

Iteration 0 : 5.7464776039123535
English: google s pages is a free tool which allows one to create web pages in hindi
hindi Translation: गुगल का आधिकारिक जालक्षेत्र हिन्दी मे इंटर्नेट पे आसानी से वेब पेजेज़ बनाने के लिये यहाँ कई मुफ्त टूल हैं ।
hindi Prediction: हिन्दी में हिन्दी हिन्दी हिन्दी हिन्दी हिन्दी के हिन्दी से हिन्दी हिन्दी में के लिए 
Evaluation translation (put folder in the bin) : ('और एक एक साल <END> ',)
-------------------------------------------
Iteration 100 : 5.71591329574585
English: with paramhansa s blessings narendra attained self realization he became chief of all disciples of paramhansa
hindi Translation: परमहंसजी की कृपा से इनको आत्म साक्षात्कार हुआ फलस्वरूप नरेंद्र परमहंसजी के शिष्यों में प्रमुख हो गए।
hindi Prediction: इस के एक के पहले पहले बार देने है के ने ने रूप में एक हो गया 
Evaluation translation (put folder in the bin) : ('और एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.729485988616943
English: announcer and zishan

Processing Chunks:  60%|██████    | 3/5 [20:22<12:28, 374.23s/it]

Iteration 0 : 5.650047302246094
English: the keertan or sankeertan is a extremely important congregational singing in the eastern parts of our country and sri chaitanya mahaprabhu the bengali saint of the fifteenth sixteenth centuries is said to have popularized this kind of group singing
hindi Translation: हमारे देश के पूर्वी अंचल में कीर्तन और संकीर्तन गायकी बहुत महत्वपूर्ण समूह गायन है और   वीं   वीं शताब्दी में बंगाल के संत श्री चैतन्य महाप्रभु ने इस तरह के समूह गान को लोकप्रिय बनाया
hindi Prediction: इस जीवन में लिए भाग के एक के अन्य ऊण्श्छ्ष् और हैं रूप के के और यह प्रकार और में एक के साथ और ऊण्श्छ्ष् के और य प्रकार के रूप के ऊण्श्छ्ष् एक और है के ऊण्श्छ्ष् और ऊण्श्छ्ष् ऊण्श्छ्ष् और और और और और और और आदि आदि और 
Evaluation translation (put folder in the bin) : ('और यह एक एक बात है <END> ',)
-------------------------------------------
Iteration 100 : 5.701002597808838
English: and you ll understand the scope of the project
hindi Translation: और इस प्रोजेक्ट का प्रयोजन समझ सकेंगे
h

Processing Chunks:  80%|████████  | 4/5 [25:34<05:49, 349.76s/it]

Iteration 0 : 5.380954742431641
English: category poets of section devoted to lord krishna
hindi Translation: श्रेणी कृष्णाश्रयी शाखा के कवि
hindi Prediction: मुंबई प्रदेश भारतीय में उत्तर में में और 
Evaluation translation (put folder in the bin) : ('और यह एक एक है <END> ',)
-------------------------------------------
Iteration 100 : 5.49449348449707
English: i am no admirer of european pacifists and crisis after crisis has shown them to be not only totally ineffective but often the unconscious tools of reaction and even war mongering
hindi Translation: मैं यूरोप के शांतिवादियों का प्रशंसक नहीं हूं इसके बाद एक संकट ने यह साबित कर दिया है कि वह न सिर्फ बिल्कुल बेअसर रहे हैं   बल्कि वह किसी बात की खिलाफत या लोगों को उकसा तक नहीं सकते
hindi Prediction: लेकिन अपने में लिए के कहना है है कि लिए के और में अपने ही करने दिया कि कि यह अपने कि भी अपने और हैं और वह अपने भी के बात को उसके के भी नहीं नहीं कर हैं के 
Evaluation translation (put folder in the bin) : ('और एक एक है <END> ',)
----------

Processing Chunks: 100%|██████████| 5/5 [30:33<00:00, 366.80s/it]


Epoch 6 Loss: 21615.240204811096
Saved Best Model at Epoch 6 with Loss: 21615.240204811096
EPOCH 7----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 5.571569442749023
English: why are there different answers
hindi Translation: इस प्रश्न के उत्तर अलग अलग क्यों हैं
hindi Prediction: और तरह के लिए 
Evaluation translation (put folder in the bin) : ('और एक साल <END> ',)
-------------------------------------------
Iteration 100 : 5.277646541595459
English: these are the people i want to talk about to you today
hindi Translation: आज उन्ही लोगों के बारे में मैं आपको बताऊगाँ।
hindi Prediction: मैं मैं को में बारे में मैं आप एक 
Evaluation translation (put folder in the bin) : ('एक एक बहुत बड़ा है <END> ',)
-------------------------------------------
Iteration 200 : 5.439302444458008
English: that your english is good enough
hindi Translation: कि आपकी अंग्रेजी ठीक ठाक है।
hindi Prediction: और आप तरह को हो हैं 
Evaluation translation (put folder in the bin) : ('और यह एक साल <END> ',)
-------------------------------------------
Iteration 300 : 5.525282859802246
English: the term every person used in articles 5 and 10 has been int

Processing Chunks:  20%|██        | 1/5 [05:09<20:39, 309.93s/it]

Iteration 0 : 5.326703071594238
English: leg ship position
hindi Translation: पद जहाज पोजीशन
hindi Prediction: बाहरी का 
Evaluation translation (put folder in the bin) : ('और एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.138419151306152
English: his first sermon was in sarnath near varansi which he gave to his friends
hindi Translation: उनका पहला धर्मोपदेश वाराणसी के पास सारनाथ मे था जो उन्होने अपने पहले मित्रो को दिया।
hindi Prediction: उन्होंने एक नाम के में साथ हुआ के हुआ 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.143810272216797
English: hindi hindi dictionary
hindi Translation: हिन्दी   हिन्दी विक्षनरी
hindi Prediction: हिन्दी हिन्दी हिन्दी 
Evaluation translation (put folder in the bin) : ('और यह एक भी है <END> ',)
-------------------------------------------
Iteration 300 : 5.314756870269775
English: therefore on his return to india with a tripos and

Processing Chunks:  40%|████      | 2/5 [10:18<15:27, 309.08s/it]

Iteration 0 : 5.345464706420898
English: subhas chandra was around fifteen years old when he entered one of the stormiest periods in his mental and psychical life
hindi Translation: लगभग पंद्रह साल की उम्र में सुभाष चन्द्र ने   मानसिक और मनोवैज्ञानिक दृष्टि से   जीवन के एक सर्वाधिक झंझावाती दौर में कदम रखा
hindi Prediction: उन्होंने ही साल में एक में उन्होंने ने ने अपने साल एक साल से एक के साथ जीवन जीवन और को एक की 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.498053073883057
English: in was established by larry page and sergey brin in 1998
hindi Translation: ये १९९८ मै लेरि पेज और ब्राएन सर्जन के द्वरा स्तापिथ हुआ था ।
hindi Prediction: इस एक के एक के के उर्दू के 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.490212440490723
English: 2 greatness of constitution the provisions of the constitution association 

Processing Chunks:  60%|██████    | 3/5 [15:28<10:19, 309.52s/it]

Iteration 0 : 5.035911560058594
English: as most of you i hope know
hindi Translation: आप में से बहुत  मुझे आशा है
hindi Prediction: मैं को मैं एक नहीं नहीं कर 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 100 : 5.503020286560059
English: and in the mri and mr spectroscopy here the
hindi Translation: और इन     या    स्पेक्ट्रोस्कोपी में
hindi Prediction: और यह लोगों एक के 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 200 : 5.488307952880859
English: because every roof which you see in this picture
hindi Translation: क्योंकि इस तस्वीर में दिख रही सभी छतें
hindi Prediction: और हम तरह को एक सकते है के 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------
Iteration 300 : 5.344335556030273
English: but the culture which flourished during the rajput period was t

Processing Chunks:  80%|████████  | 4/5 [20:42<05:11, 311.20s/it]

Iteration 0 : 5.318029880523682
English: 14 the soul is ageless eternal
hindi Translation: आत्मा अजर अमर है
hindi Prediction: एक के एक है 
Evaluation translation (put folder in the bin) : ('और एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.257784843444824
English: now the power was in the hands of akbar but many difficulties were also there
hindi Translation: अब अकबर के अपने हाथों में सत्ता थी लेकिन अनेक कठिनाइयाँ भी थीं।
hindi Prediction: लेकिन यह ने बाद बाद में एक के और उनकी साल के थे 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.363222599029541
English: was the sr71 it went a whole life cycle got too rusty to fly
hindi Translation: था  इस विमान ने अपना जीवन चक्र पूरा किया  पुराना होकर उड़ने के अयोग्य हो गया
hindi Prediction: यह कि पर के अपने नाम में के किया और ही वह में लिए 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
--------

Processing Chunks: 100%|██████████| 5/5 [25:51<00:00, 310.36s/it]


Epoch 7 Loss: 20920.525897979736
Saved Best Model at Epoch 7 with Loss: 20920.525897979736
EPOCH 8----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 5.257648944854736
English: official website of obama us senator
hindi Translation: अमरीकी सेनेटर के रूप में ओबामा का आधिकारिक जालस्थल
hindi Prediction: आतंकवाद भारतीय के पास में 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.14754056930542
English: a crow is as black as coal
hindi Translation: कौआ कोयले जैसा काला होता है।
hindi Prediction: यह और के 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.430553913116455
English: using photovoltaic technique to draw water from a well for drinking and irrigation is very useful technique for india
hindi Translation: फोटो वोल्टायिक प्रणाली द्वारा पीने व सिंचाई के लिए कुओं आदि से जल का पम्प किया जाना भारत के लिए एक अत्यन्त उपयोगी प्रणाली है।
hindi Prediction: सौर प्रदूषण प्रणाली के एक के अन्य के लिए एक के के भी प्राप्त उपयोग प्राप्त जाता चाहिए में लिए एक ही अधि

Processing Chunks:  20%|██        | 1/5 [05:17<21:10, 317.67s/it]

Iteration 0 : 5.3491597175598145
English: i brought seven pairs of underpants
hindi Translation: मैं अंत  वस्त्र के   जोड़े लाये है
hindi Prediction: मैं एक में हूँ बारे में 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.392938137054443
English: they must not utter the first name of an older relative but imply it symbolically or by pointing at an article with a similar name
hindi Translation: यहां की स्त्रियां अपने से बड़ों के नाम लेना पाप समझती है जरूरत होने पर उपने से बड़ों के नाम के स्थान प्रतीक शब्दों तथा वस्तुओं आदि का संकेत कर इच्छित नाम बताने का प्रयास करती
hindi Prediction: यह से यह के अपने ही के लिए के और और है और के के यह लोगों से की लिए के लिए पर रहे में अन्य के के उपयोग 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.119473934173584
English: and dissect some lessons from it
hindi Translation: और इससे क

Processing Chunks:  40%|████      | 2/5 [10:40<16:02, 321.00s/it]

Iteration 0 : 5.339047908782959
English: we must remember this and not confuse the issue for else we will have neither socialism nor independence
hindi Translation: हमें हमेशा अपने लक्ष्य को याद रखना है   वरना हमें न तो समाजवाद हासिल होगा और न आजादी ही
hindi Prediction: हम यह नहीं लिए के नहीं नहीं चाहिए कि हम यह चाहते यह के कर 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.0301313400268555
English: so work goes on relentlessly
hindi Translation: सो   निर्माण लगातार जारी है
hindi Prediction: एक एक के है है 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.038630962371826
English: and of course the ever present media
hindi Translation: और हां  हर जगह मौजूद मीडिया
hindi Prediction: और ये एक बहुत है है 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------

Processing Chunks:  60%|██████    | 3/5 [15:49<10:30, 315.38s/it]

Iteration 0 : 5.066103458404541
English: life introduction
hindi Translation: जीवन परिचय
hindi Prediction: बाहरी के 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 4.960941314697266
English: kinnari bommayya was another devotee whose profession was lute playing
hindi Translation: एक अन्य भक़्त था किन्नरी बोम्मय्या जिसका पेशा था वीण बजाना
hindi Prediction: इस दिन वर्षों जो जो और और एक 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.168576240539551
English: class rivers of bihar
hindi Translation: श्रेणी बिहार की नदियाँ
hindi Prediction: श्रेणी भारत 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 300 : 5.409506320953369
English: pandavas were shiaknedi general
hindi Translation: पाण्डवों के सेनापति शिखण्डी थे।
hindi Prediction: भारत के अन

Processing Chunks:  80%|████████  | 4/5 [21:07<05:16, 316.33s/it]

Iteration 0 : 5.414599895477295
English: and that eventually because pathology
hindi Translation: और अंततः विकृति पैदा करती हैं
hindi Prediction: और वो भी के कर है 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 4.944536209106445
English: maulana shah abdul haq of delhi lrb 1551 1642 rrb brought indian muslims nearer to the source of islamic teaching by popularising the study of the traditions of the prophet
hindi Translation: दिल्ली के मौलाना शाह अब्दुल हक               पैगंबर की परंपराओं के अध्ययन को लोकप्रिय बनाते हुए भारतीय मुसलमानों को इस्लाम की शिक्षा के आधार के निकट लाये
hindi Prediction: सन् में बाद साम्राज्य ने सिंह के ने स्थापना में बाद में भारत करने हुए भारत भारतीय के भारत के स्थापना से रूप में लिए से गये के के के और और और और और और और और और और और और और और और और और और और 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iterat

Processing Chunks: 100%|██████████| 5/5 [26:12<00:00, 314.51s/it]


Epoch 8 Loss: 20259.890893936157
Saved Best Model at Epoch 8 with Loss: 20259.890893936157
EPOCH 9----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 5.3557233810424805
English: it was built of hard black stone in the ninth century in the Tears in my eyes of pallava aparajitavarman one of the last rulers of the dynasty
hindi Translation: यह नवीं शताब्दी में पल्लव राजवंश के अंतिम शासकों में से एक अपराजितवर्मन के समय में कठोर काले पत्थर से बनाया गया था
hindi Prediction: यह भी शताब्दी में एक लाख के रूप भाग में स्थित एक लाख के कारण में एक लाख मंदिर में एक गया 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.093822479248047
English: the committee s technical studies showed that movement of commodities was generally economical by road for distances upto 300 350 km
hindi Translation: कमेटी के तकनीकी अध्ययन बताते हैं कि वस्तुओं का परिवहन         कि मी   की कम दूरी तक के लिए सड़क मार्ग से सामान्यत   कम खर्चीला होता है
hindi Prediction: सन् के बाद क्षेत्र में हुए और भारत के एक के विकास के कुल से में से लिए ही का का भी अधिक हो अधिक है 
Evaluatio

Processing Chunks:  20%|██        | 1/5 [05:09<20:39, 309.78s/it]

Iteration 0 : 5.069626808166504
English: m n roy had been committed by the magistrate to sessions on 15th october 1931
hindi Translation: ण्म एन   राय को    अक़्तूबर      को मजिस्ट्रेट द्वारा सेशन अदालत के सुपुर्द किया गया था
hindi Prediction: भारत नेहरू नेहरू ने भारत के एक के एक सरकार के रूप में गया था। 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.314113140106201
English: these belongs to utter pradesh
hindi Translation: ये उत्तर प्रदेश से हैं।
hindi Prediction: यह भारत भारत में 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 5.331651210784912
English: and the moon is only two seconds away so if you take a picture of the moon
hindi Translation: चाँद हमसे बस दो सेकण्ड की दूरी पर है  तो अगर आप साधारण रोशनी में चाँद का चित्र लें
hindi Prediction: और के एक एक और के तरह के निर्भर 
Evaluation translation (put folder in

Processing Chunks:  40%|████      | 2/5 [10:19<15:28, 309.65s/it]

Iteration 0 : 5.276571750640869
English: this was created in 1659 and was a personal mosque of aurangzeb
hindi Translation: यह सन्      में बाद में बनाई गई थी जो औरंगजे़ब की निजी मस्जिद थी।
hindi Prediction: यह एक में सन् में भारत गयी और और सन् के स्थापना राजधानी थी 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 4.989884853363037
English: and here they are
hindi Translation: ये रहे
hindi Prediction: और एक हैं 
Evaluation translation (put folder in the bin) : ('एक साल से <END> ',)
-------------------------------------------
Iteration 200 : 5.271574020385742
English: the home school agreement may just say that you are expected to support the school s homework policy without repeating what it says
hindi Translation: घर   स्कूल के बीच के समझऋते में यह उल्लेख मात्र हो सकता है कि इसमें जो उल्लेख किया गया है उसे दोहराये बिना ही आपसे होमवर्क पर स्कूल की नीति ह्यपोलिसीहृ का समर्थन करने की अपेऋआ की जाती है  भाष

Processing Chunks:  60%|██████    | 3/5 [15:31<10:21, 310.74s/it]

Iteration 0 : 5.075561046600342
English: here i m looking at the hex dump of an image file
hindi Translation: यहाँ  मैं एक छवि फ़ाइल के हेक्स डंप को देख रहा हूँ
hindi Prediction: मैं मैं एक छोटा के में साथ से में 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 4.883274078369141
English: it is capable of producing light within and outside the house for 3 to 4 hours per day
hindi Translation: यह घर के अन्दर व घर के बाहर प्रतिदिन ३ से ४ घंटे तक प्रकाश दे सकने में सक्षम है।
hindi Prediction: यह एक के लिए के एक के बीच और के के एक और के उपलब्ध का रहे के जा हो 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 200 : 5.232875347137451
English: gesture recognition and machine learning
hindi Translation: इशारा मान्यता  और मशीन की सीखने की ताकत
hindi Prediction: और करने और कैसे के तरह में 
Evaluation translation (put folder in the bin)

Processing Chunks:  80%|████████  | 4/5 [20:33<05:07, 307.26s/it]

Iteration 0 : 5.187267780303955
English: he was prepared to step down provided another uncompromising national leader like narendra deva was chosen as the president
hindi Translation: वे अपनी उम्मीदवारी वापस लेने को तैयार थे   बशर्ते उन्हीं जैसा अन्य राष्ट्रीय नेता अध्यक्ष चुना जाये जैसे आचार्य नरेन्द्र देव
hindi Prediction: लेकिन कांग्रेस पार्टी के के के कहा करने कि कि के कि सरकार सरकार 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 100 : 5.043954849243164
English: once again he praises the european society where women because they are accorded their due share of freedom help to make the nation strong and contrasts it with the indian society where woman s sole function seemed to be to serve and pamper man and thereby emasculate him
hindi Translation: एक बार फिर वे उस यूरोपीय समाज की प्रशंसा करते हैं जिसमें स्त्रियों ने स्वतंत्रता के मामले में अपनी भागेदारी का समुचित अनुपात तय कर लिया है और राष्ट्र को मज

Processing Chunks: 100%|██████████| 5/5 [25:01<00:00, 300.30s/it]


Epoch 9 Loss: 19615.11864042282
Saved Best Model at Epoch 9 with Loss: 19615.11864042282
EPOCH 10----------------------------------------------------------------------------------------


Processing Chunks:   0%|          | 0/5 [00:00<?, ?it/s]

Iteration 0 : 4.914895057678223
English: ravindra literature
hindi Translation: रवीन्द्र साहित्य
hindi Prediction: श्रेणी हिन्दू 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 4.644829750061035
English: not only that
hindi Translation: बस वही नहीं
hindi Prediction: न नहीं नहीं 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 4.819253444671631
English: and this is what they call zero b type of water
hindi Translation: और ये उस तरह का है जिसे वे ज़ीरो बी पानी कहते हैं
hindi Prediction: और यह एक प्रकार से बच्चा कि एक एक हैं से 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 300 : 5.044816493988037
English: is your father a teacher
hindi Translation: क्या तुम्हारे पिताजी अध्यापक हैं
hindi Prediction: क्या आप पास क्या 
Evaluation translation (put

Processing Chunks:  20%|██        | 1/5 [04:38<18:32, 278.01s/it]

Iteration 0 : 4.9264726638793945
English: the rakhi threads are spun out of cotton and dyed in red
hindi Translation: राखी लाल डोरी तथा रंग विरंगी रूई से बनाई जाती
hindi Prediction: एक और ऊण्श्छ्ष् के दो के और के 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 5.049317836761475
English: at night when i go to bed 3 4 a m in the morning
hindi Translation: रात में जब मैं सोने जाता हूँ  सुबह के   या   बजे
hindi Prediction: एक में मैं मैं एक में हूँ 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 4.932462215423584
English: his mausoleum is sacred for his followers
hindi Translation: उनकी समाधि उनके अनुयाइयों के लिये पवित्र है।
hindi Prediction: उन्होंने मृत्यु के अनुसार के अनुसार ही है। 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 300 : 4.9

Processing Chunks:  40%|████      | 2/5 [09:14<13:51, 277.06s/it]

Iteration 0 : 5.003285884857178
English: seven year old justin senigar
hindi Translation: सात वर्षीय जस्टिन सैनिगर
hindi Prediction: एक साल लोग के 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 4.816014766693115
English: didn t belong to girls in india
hindi Translation: भारत में महिलाओं का नहीं था
hindi Prediction: अब में एक की एक 
Evaluation translation (put folder in the bin) : ('एक साल में <END> ',)
-------------------------------------------
Iteration 200 : 4.961280822753906
English: talking of indian unity subhas said that the Tears in my eyes was opportune for the final solution of this problem consistent with the fundamental principles of nationalism
hindi Translation: एकता का जिक्र करते हुए सुभाष ने कहा कि राष्ट्रवाद के आधारभूत सिद्धांतों के अनुरूप इस समस्या को अंतिम रूप से सुलझा लेने का यही उपयुक़्त अवसर है
hindi Prediction: इस के कहना करने हुए उन्होंने ने कहा कि यह के लिए रूप को लिए था तरह 

Processing Chunks:  60%|██████    | 3/5 [17:08<12:14, 367.19s/it]

Iteration 0 : 4.65474796295166
English: poor administration
hindi Translation: खराब प्रशासन
hindi Prediction: भारत करने के 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 100 : 4.850268363952637
English: watch kung fu movies
hindi Translation: कुंग फू फिल्मे देखा करता था
hindi Prediction: एक एं 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 200 : 4.842039585113525
English: and 266 its implies the money which is come to the assembly and for it works is called country fund this is under work of the assembly and this fund is suspect on high level and imposed the states country fund also
hindi Translation: अनु     इसका वर्णन भी करता है वह धन जिसे भारत सरकार कर एकत्रीकरण प्राप्त आय उगाहे गये ऋण के अलावा एकत्र करे भारत की लोकनिधि कहलाती है कर्मचारी भविष्य निधि को भारत की लोकनिधि मे जमा किया गया है यह कार्यपालिका के अधीन निधि है इ

Processing Chunks:  80%|████████  | 4/5 [23:37<06:15, 375.75s/it]

Iteration 0 : 4.900001525878906
English: election commission s procedure function
hindi Translation: निर्वाचन आयोग की कार्यप्रणाली कार्य
hindi Prediction: राष्ट्रपति बिल के नियुक्ति के 
Evaluation translation (put folder in the bin) : ('एक एक साल में <END> ',)
-------------------------------------------
Iteration 100 : 4.5956573486328125
English: what were the gifts to be given to them in case they show friendly feeling
hindi Translation: यदि उन्होंने मित्रता का व्यवहार किया तब उन्हें क्या उपहार दिए जायें
hindi Prediction: वे वे इस को काम किया तो वह एक किया से जाने 
Evaluation translation (put folder in the bin) : ('एक साल के लिए <END> ',)
-------------------------------------------
Iteration 200 : 4.858831882476807
English: even according to the present congress policy it is our objective to nationalise key industries and key services and banking etc
hindi Translation: कांग्रेस की मौजूदा नीति के मुताबिक हमारा उद्देश्य बुनियादी उद्योगों   बुनियादी सेवाओं   बैंकों आदि का राष्ट्रीयकरण कर

Processing Chunks: 100%|██████████| 5/5 [28:05<00:00, 337.07s/it]


Epoch 10 Loss: 18983.889060020447
Saved Best Model at Epoch 10 with Loss: 18983.889060020447


## Load the model

In [47]:
from torch.serialization import add_safe_globals

# Add the Transformer class to the allowlist for loading
add_safe_globals([Transformer])

# Load the model
transformer_model = torch.load(model_path, weights_only=False)

In [48]:
def translate(eng_sentence):
    eng_sentence = (eng_sentence, )
    hn_sentence = ("",)
    for word_counter in range(max_sequence_length):
        encoder_self_attention_mask, decoder_self_attention_mask, decoder_cross_attention_mask = create_masks(eng_sentence, hn_sentence)
        predictions = transformer_model(eng_sentence,
                                          hn_sentence, 
                                          encoder_self_attention_mask.to(device), 
                                          decoder_self_attention_mask.to(device),
                                          decoder_cross_attention_mask.to(device), 
                                          enc_end_token=False, 
                                          dec_start_token=True, 
                                          dec_end_token=False)
        
        next_token_prob_distribution = predictions[0][word_counter]
        next_token_index = torch.argmax(next_token_prob_distribution).item()
        next_token = index_to_hindi[next_token_index]
        hn_sentence = (hn_sentence[0] + next_token + " ", )
        if next_token == END_TOKEN:
            break
    return hn_sentence[0]
    

In [49]:
translation = translate("India is a country")
print(translation)

यह है कि भारत में <END> 
