In [1]:
from google.colab import drive
drive.mount('/content/drive')

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly&response_type=code

Enter your authorization code:
··········
Mounted at /content/drive


# Importing Packages

In [1]:
import pandas as pd
import numpy as np
import string
from string import digits
import matplotlib.pyplot as plt
%matplotlib inline
import re
from sklearn.utils import shuffle
from sklearn.model_selection import train_test_split
from tensorflow.keras.layers import Input, LSTM, Embedding, Dense
from tensorflow.keras.models import Model

In [2]:
#data_cleaning 
#data_path='/content/drive/My Drive/Colab Notebooks/LanguageTranslation/hin.txt'
data_path=r"E:\DATASETS\LanguageTranslation\hindi_english_data\hin.txt"
lines= pd.read_table(data_path, names=['eng', 'hin'],encoding='utf-8')

In [3]:
lines.drop('hin',inplace=True,axis='columns')

In [4]:
lines.rename(columns={'eng':'hin'},inplace=True)

In [5]:

lines['eng']=lines.index

In [6]:
lines.reset_index(level=0, inplace=True)

In [7]:
lines.drop('index',inplace=True,axis='columns')
lines.head()

Unnamed: 0,hin,eng
0,वाह!,Wow!
1,बचाओ!,Help!
2,उछलो.,Jump.
3,कूदो.,Jump.
4,छलांग.,Jump.


# Data Preprocessing 

In [8]:
#preprocessing of data
# Lowercase all characters
lines.eng=lines.eng.apply(lambda x: x.lower())
lines.hin=lines.hin.apply(lambda x: x.lower())

# Remove quotes
lines.eng=lines.eng.apply(lambda x: re.sub("'", '', x))
lines.hin=lines.hin.apply(lambda x: re.sub("'", '', x))
exclude = set(string.punctuation) # Set of all special characters

# Remove all the special characters
lines.eng=lines.eng.apply(lambda x: ''.join(ch for ch in x if ch not in exclude))
lines.hin=lines.hin.apply(lambda x: ''.join(ch for ch in x if ch not in exclude))

# Remove all numbers from text
remove_digits = str.maketrans('', '', digits)
lines.eng=lines.eng.apply(lambda x: x.translate(remove_digits))
lines.hin = lines.hin.apply(lambda x: re.sub("[२३०८१५७९४६]", "", x))

# Remove extra spaces
lines.eng=lines.eng.apply(lambda x: x.strip())
lines.hin=lines.hin.apply(lambda x: x.strip())
lines.eng=lines.eng.apply(lambda x: re.sub(" +", " ", x))
lines.hin=lines.hin.apply(lambda x: re.sub(" +", " ", x))

# Add start and end tokens to target sequences
lines.hin = lines.hin.apply(lambda x : 'START_ '+ x + ' _END')

In [10]:
lines.head(10)

Unnamed: 0,hin,eng
0,START_ वाह _END,wow
1,START_ बचाओ _END,help
2,START_ उछलो _END,jump
3,START_ कूदो _END,jump
4,START_ छलांग _END,jump
5,START_ नमस्ते। _END,hello
6,START_ नमस्कार। _END,hello
7,START_ वाहवाह _END,cheers
8,START_ चियर्स _END,cheers
9,START_ समझे कि नहीं _END,got it


# Creating Vocab

In [11]:
#Vocabulary of English
all_eng_words=set()
for eng in lines.eng:
    for word in eng.split():
        if word not in all_eng_words:
            all_eng_words.add(word)

# Vocabulary of Hindi 
all_hindi_words=set()
for hin in lines.hin:
    for word in hin.split():
        if word not in all_hindi_words:
            all_hindi_words.add(word)


In [13]:
count=-1
for i in all_eng_words:
    count+=1
    if count < 10:
        print(i)#printing some words from english words set in the vocab

plus
jobs
hardly
brothers
team
too
bombay
bags
whom
kid


In [14]:
count=-1
for i in all_hindi_words:
    count+=1
    if count < 10:
        print(i)#printing some words from hindi words set in the vocab

उद्योग
पकड़ीं
जाएँगे।
कर
चोरी
चहिए
तोला।
गईं
द्वार
चुना


In [15]:
# Max Length of source sequence or we can english sentence instead of source sequence
lenght_list=[]
for l in lines.eng:
    lenght_list.append(len(l.split(' ')))
max_length_src = np.max(lenght_list)
max_length_src

22

In [16]:
# Max Length of target sequence or we can hindi sentence instead of source sequence
lenght_list=[]
for l in lines.hin:
    lenght_list.append(len(l.split(' ')))
max_length_tar = np.max(lenght_list)
max_length_tar

27

In [17]:
input_words = sorted(list(all_eng_words))
target_words = sorted(list(all_hindi_words))
num_encoder_tokens = len(all_eng_words)
num_decoder_tokens = len(all_hindi_words)
#max_encoder_seq_length = max([len(txt.split()) for txt in lines.eng])
#max_decoder_seq_length = max([len(txt.split()) for txt in lines.hin])
print('encoder token',num_encoder_tokens, 'decoder token',num_decoder_tokens)
#print('max_encoder_seq_len',max_encoder_seq_length,'max_decoder_seq_len',max_decoder_seq_length)


encoder token 2341 decoder token 2968


In [18]:
num_decoder_tokens += 1 # For zero padding
num_decoder_tokens

2969

In [19]:
num_encoder_tokens+=1

In [20]:
input_token_index = dict([(word, i+1) for i, word in enumerate(input_words)])
target_token_index = dict([(word, i+1) for i, word in enumerate(target_words)])

In [21]:
print(input_token_index)
print(target_token_index)

{'a': 1, 'abandoned': 2, 'ability': 3, 'ablaze': 4, 'able': 5, 'about': 6, 'above': 7, 'abroad': 8, 'absence': 9, 'absent': 10, 'absolute': 11, 'absurd': 12, 'abused': 13, 'accepted': 14, 'access': 15, 'accident': 16, 'accidental': 17, 'accompanied': 18, 'accompany': 19, 'according': 20, 'account': 21, 'accountable': 22, 'accused': 23, 'accustomed': 24, 'ache': 25, 'acknowledgement': 26, 'acquaintance': 27, 'acquaintances': 28, 'acquainted': 29, 'across': 30, 'act': 31, 'actions': 32, 'actor': 33, 'actress': 34, 'add': 35, 'adding': 36, 'address': 37, 'admit': 38, 'adopted': 39, 'advantage': 40, 'advice': 41, 'advise': 42, 'advised': 43, 'affected': 44, 'afford': 45, 'afraid': 46, 'africa': 47, 'after': 48, 'afternoon': 49, 'again': 50, 'against': 51, 'age': 52, 'ago': 53, 'agree': 54, 'agreement': 55, 'aids': 56, 'air': 57, 'airport': 58, 'alarm': 59, 'alcohol': 60, 'alike': 61, 'alive': 62, 'all': 63, 'allergic': 64, 'allow': 65, 'allowances': 66, 'allowed': 67, 'almost': 68, 'alone'

In [22]:
reverse_input_char_index = dict((i, word) for word, i in input_token_index.items())
reverse_target_char_index = dict((i, word) for word, i in target_token_index.items())

In [23]:
lines = shuffle(lines)
lines.head(10)

Unnamed: 0,hin,eng
2496,START_ तुम नसीब वालो हो जिसके इतना प्यार करने ...,you are fortunate to have such loving parents
113,START_ मोटे मत हो जाना। _END,dont get fat
1652,START_ जो अखबार में लिखा है वह सच है। _END,what the newspapers say is true
277,START_ यह सही नहीं है। _END,this isnt right
862,START_ उसकी राष्ट्रीयता क्या है _END,what is his nationality
1673,START_ वह हर सुबह अखबार पढ़ता है। _END,he reads the paper every morning
2729,START_ नई सरकार ने देश को भ्रष्टाचार से मुक्त ...,the new government promised to rid the country...
1682,START_ पता नहीं कैसे पर तुमने कर दिया। _END,i dont know how but you did it
2264,START_ उसने कपड़े उतारे बिना ही पानी में छलाँग...,he jumped into the water clothes and all
1501,START_ कृपया ध्यान दीजिए। _END,give me your attention please


In [24]:
X, y = lines.eng, lines.hin
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.1)
X_train.shape, X_test.shape

((2495,), (278,))

In [25]:
len(X)

2773

In [26]:
y_train[:10]

585                        START_ तुम कब लौट कर आओगे _END
198                           START_ सब लोग कैसे हैं _END
77                                START_ तुम कैसे हो _END
350                           START_ तू कहाँ रहता है _END
744             START_ स्कूल साढ़े तीन बजे छूटता है। _END
269                      START_ आपसे मिलकर खुशी हुई। _END
1885       START_ मैं पियानो बहुत अच्छा बजा लेता था। _END
2151    START_ उसने अपनी गाड़ी बिना हिचकिचाहट हे बेच द...
561                          START_ यह मुफ़्त का है। _END
1478                   START_ पत्र किसको लिखा गया था _END
Name: hin, dtype: object

In [27]:
X_train[:10]

585                       when will you return
198                            how is everyone
77                                 how are you
350                          where do you live
744                          school is over at
269                           nice to meet you
1885        i was able to play piano very well
2151    he sold his own car without hesitation
561                       it is free of charge
1478             who was the letter written to
Name: eng, dtype: object

In [91]:
X_train.to_pickle('/content/drive/My Drive/Colab Notebooks/LanguageTranslation/Weights_Mar/X_train.pkl')
X_test.to_pickle('/content/drive/My Drive/Colab Notebooks/LanguageTranslation/Weights_Mar/X_test.pkl')

# Encoder - Decoder data for training

In [53]:
encoder_input_data = np.zeros(
    (len(X), max_length_src), #using all data becaus the dataset is small but if we have bigger dataset we can we use split data as well
    dtype='float32')
decoder_input_data = np.zeros(
    (len(X), max_length_tar),
    dtype='float32')
decoder_target_data = np.zeros(
    (len(X), max_length_tar, num_decoder_tokens), #we can  also pass the pass y_train bcoz we just need len nothing else
    dtype='float32')

   
print("encoder input shape",encoder_input_data.shape,'decoder input shape',decoder_input_data.shape,'decoder out shape',decoder_target_data.shape)
for i, (input_text, target_text) in enumerate(zip(X, y)):
    for t, word in enumerate(input_text.split()):
            encoder_input_data[i, t] = input_token_index[word] # encoder input seq
    for t, word in enumerate(target_text.split()):
            print('target',word)
            if t<len(target_text.split())-1:
                decoder_input_data[i, t] = target_token_index[word] # decoder input seq
            if t>0:
              # decoder target sequence (one hot encoded)
              # does not include the START_ token
              # Offset by one timestep
              decoder_target_data[i, t - 1, target_token_index[word]] = 1


encoder input shape (2773, 22) decoder input shape (2773, 27) decoder out shape (2773, 27, 2969)
target START_
target तुम
target नसीब
target वालो
target हो
target जिसके
target इतना
target प्यार
target करने
target वाले
target माँबाप
target हैं।
target _END
target START_
target मोटे
target मत
target हो
target जाना।
target _END
target START_
target जो
target अखबार
target में
target लिखा
target है
target वह
target सच
target है।
target _END
target START_
target यह
target सही
target नहीं
target है।
target _END
target START_
target उसकी
target राष्ट्रीयता
target क्या
target है
target _END
target START_
target वह
target हर
target सुबह
target अखबार
target पढ़ता
target है।
target _END
target START_
target नई
target सरकार
target ने
target देश
target को
target भ्रष्टाचार
target से
target मुक्त
target करने
target का
target वादा
target किया।
target _END
target START_
target पता
target नहीं
target कैसे
target पर
target तुमने
target कर
target दिया।
target _END
target START_
target उसने
target कपड़े
ta

target मुझे
target तुम्हें
target थप्पड़
target करने
target के
target लिए
target मजबूर
target मत
target करो।
target _END
target START_
target वह
target खेत
target पर
target सुबह
target से
target शाम
target तक
target काम
target करता
target है।
target _END
target START_
target वह
target थोड़ी
target ताज़ा
target हवा
target खाने
target के
target लिए
target बाहर
target गया।
target _END
target START_
target उन
target सभी
target के
target पास
target साईकल
target है।
target _END
target START_
target तुम्हारा
target कुत्ता
target कौनसा
target है
target _END
target START_
target मैं
target अंग्रेज़ी
target पढ़
target सकती
target हूँ।
target _END
target START_
target भारत
target को
target ब्रिटेन
target से
target में
target स्वतंत्रता
target प्राप्त
target हुई।
target _END
target START_
target उसने
target मुझे
target ध्यान
target में
target लेने
target से
target इनकार
target करदिआ।
target _END
target START_
target टीवी
target का
target रिमोट
target कहाँ
target है
target _END
target START_
target

target का
target है
target _END
target START_
target वह
target अंग्रेज़ी
target बोलता
target है
target क्या
target _END
target START_
target एक
target दिन
target में
target चौबीस
target घंटे
target होते
target हैं।
target _END
target START_
target तुम्हारा
target दोस्त
target कितने
target बजे
target घर
target वापस
target गया
target था
target _END
target START_
target इस
target कहानी
target का
target लेखक
target कौन
target है
target _END
target START_
target वह
target एक
target महान
target कवि
target ही
target नहीं
target बल्कि
target एक
target डॉक्टर
target भी
target थे।
target _END
target START_
target हमारी
target मीटिंग
target कभीकभार
target ही
target टाईम
target पर
target शुरू
target होती
target है।
target _END
target START_
target यह
target सरासर
target समय
target की
target बर्बादी
target है।
target _END
target START_
target मुश्किल
target क्या
target है
target _END
target START_
target उसने
target सौ
target डॉलर
target बचा
target लिए।
target _END
target START_
target तुम्हारे
tar

target START_
target तू
target बाहर
target नहीं
target गया
target था
target क्या
target _END
target START_
target वह
target वहाँ
target गया
target क्या
target _END
target START_
target मेरे
target पास
target तुमसे
target मिलने
target के
target लिए
target समय
target नहीं
target है।
target _END
target START_
target मैं
target तैर
target सकता
target हूँ।
target _END
target START_
target क्या
target आपको
target लगता
target है
target कि
target हमे
target अम्रीका
target से
target चावल
target का
target आयात
target करना
target चाहिए
target _END
target START_
target उसने
target मुझे
target वह
target नियम
target समझाया।
target _END
target START_
target बेकरी
target में
target जो
target लड़की
target काम
target करती
target है
target वह
target बहुत
target क्यूट
target है।
target _END
target START_
target तुम
target कौनसे
target स्कूल
target में
target पढ़ते
target हो
target _END
target START_
target काम
target कल
target तक
target खतम
target होना
target होगा।
target _END
target START_
target वह
targ

target चढ़ा।
target _END
target START_
target हमारे
target पास
target पीने
target के
target लिए
target पानी
target नहीं
target था।
target _END
target START_
target यह
target मशीन
target उस
target मशीन
target से
target बेहतर
target है।
target _END
target START_
target अगली
target बार
target अपनी
target बहन
target को
target भी
target साथ
target लाना।
target _END
target START_
target यह
target तुम्हारा
target कुत्ता
target है।
target _END
target START_
target मुझे
target उस
target घर
target को
target न
target खरीदने
target का
target पछतावा
target हो
target रहा
target है।
target _END
target START_
target मेरे
target दोस्तों
target ने
target मेरा
target जन्मदिन
target मनाया।
target _END
target START_
target करने
target के
target लिए
target हमेशा
target कुछनकुछ
target तो
target होता
target ही
target है।
target _END
target START_
target मुझे
target शहर
target का
target नक्शा
target चाहिए।
target _END
target START_
target यहाँ
target बीस
target परिवार
target बसे
target हुए
target हैं।
target _

target रोज़
target मुझे
target फ़ोन
target किया।
target _END
target START_
target उसने
target अपनी
target पत्नी
target को
target उसे
target सुबह
target सात
target बजे
target उठाने
target की
target बात
target का
target याद
target दिलाया।
target _END
target START_
target मुझे
target अपना
target नाम
target और
target फ़ोन
target नम्बर
target बताईये।
target _END
target START_
target उन्हें
target अपनी
target टीचर
target से
target डाँट
target पड़ी।
target _END
target START_
target मुझे
target यह
target बताओ
target कि
target टॉम
target ऐसा
target कर
target क्यों
target रहा
target है।
target _END
target START_
target अगर
target मेरे
target पास
target पंख
target होते
target तो
target मैं
target उड़कर
target तुम्हारे
target पास
target चला
target आता।
target _END
target START_
target तुम
target मानो
target या
target न
target मानो
target उससे
target कोई
target फ़र्क
target नहीं
target पड़ता।
target _END
target START_
target मेरा
target पार्टी
target में
target आना
target ज़रूरी
target है
target क्

target जागे
target रहता
target था।
target _END
target START_
target बच्चा
target पालनी
target में
target सो
target गया।
target _END
target START_
target यह
target काम
target दोपहर
target तीन
target बजे
target से
target पहले
target खतम
target हो
target जाना
target चाहिए।
target _END
target START_
target उसको
target बहादुरी
target की
target ज़रूरत
target है।
target _END
target START_
target तैवान
target में
target रहते
target समय
target मेरी
target उससे
target दोस्ती
target हुई।
target _END
target START_
target वह
target चिट्ठी
target पढ़ने
target के
target समय
target दुखी
target लग
target रही
target थी।
target _END
target START_
target मेरे
target पापा
target बहुत
target अच्छे
target हैं।
target _END
target START_
target वे
target कमसेकम
target साठ
target बरस
target के
target तो
target होंगे।
target _END
target START_
target हमारे
target पास
target इस
target काम
target को
target खतम
target करने
target के
target लिए
target कितना
target समय
target है
target _END
target START_
target और
ta

target START_
target पता
target नहीं
target कैसे
target पर
target टॉम
target ने
target कर
target दिया।
target _END
target START_
target मेरी
target ट्रेन
target में
target एक
target पुराने
target दोस्त
target से
target मुलाक़ात
target हुई।
target _END
target START_
target आपको
target क्या
target करना
target अच्छा
target लगता
target है
target _END
target START_
target मुझे
target थोड़ा
target आराम
target करने
target का
target मन
target है।
target _END
target START_
target छः
target बजने
target वाले
target हैं।
target _END
target START_
target क्या
target तुम
target मुझे
target सिखा
target सकते
target हो
target _END
target START_
target उसके
target नाना
target की
target उम्र
target क्या
target होनी
target चाहिए
target _END
target START_
target खाना
target खाने
target के
target बाद
target दाँतों
target को
target ब्रश
target करो।
target _END
target START_
target मैं
target अपना
target कर्ज़
target जल्दसेजल्द
target चुकताऊँगा।
target _END
target START_
target वह
target तुमसे
target प्यार
ta

target कोशिश
target करने
target में
target कोई
target फ़ायदा
target नहीं
target है।
target _END
target START_
target उसने
target गाते
target गाते
target काम
target किया।
target _END
target START_
target हम
target अक्सर
target ग़लतियाँ
target कर
target बैठते
target हैं।
target _END
target START_
target उन
target दिनों
target के
target सिवाय
target जब
target बारिश
target हो
target रही
target होती
target है
target मैं
target साईकल
target चलाकर
target काम
target पर
target जाता
target हूँ।
target _END
target START_
target दरवाज़े
target को
target खुला
target मत
target छोड़ो।
target _END
target START_
target वह
target बीमार
target नहीं
target हो
target सकता।
target _END
target START_
target इन
target कर्मचारियों
target को
target नौकरी
target से
target निकालने
target की
target बजाय
target क्यों
target न
target हम
target इनके
target काम
target करना
target का
target समय
target कम
target करदें
target _END
target START_
target उसका
target निशाना
target बहुत
target अच्छा
target है।
target _END
tar

target बगीचा
target है।
target _END
target START_
target मैंने
target तो
target मज़ाक
target के
target तौर
target पर
target कहा
target था।
target _END
target START_
target पुलीसवाले
target ने
target आदमी
target को
target दरवाज़ा
target खोलते
target देखा।
target _END
target START_
target यह
target घड़ी
target टूटी
target हुई
target है।
target _END
target START_
target वह
target पुलिस
target अफ़सर
target बन
target गया।
target _END
target START_
target मैं
target तुमसे
target निराश
target हूँ।
target _END
target START_
target खेद
target की
target बात
target है
target लेकिन
target वैसा
target ही
target है।
target _END
target START_
target मैंने
target एक
target लड़की
target को
target देखा
target जिसके
target बाल
target उसकी
target कमर
target तक
target आते
target थे।
target _END
target START_
target तुम
target यहाँ
target पहले
target आए
target हुए
target हो
target क्या
target _END
target START_
target मुझे
target गुफ़ा
target में
target ये
target मिला।
target _END
target START_
target तुम्ह

target किताब
target है
target _END
target START_
target ट्रेन
target के
target आने
target का
target समय
target लगभग
target आ
target गया
target है।
target _END
target START_
target आज
target मैं
target चार
target साल
target का
target हो
target गया
target हूँ।
target _END
target START_
target वह
target बंद
target दरवाज़े
target को
target खोल
target नहीं
target पाया।
target _END
target START_
target वह
target तीन
target घंटों
target में
target वापस
target आएगा।
target _END
target START_
target तुम्हे
target पक्का
target मालूम
target है
target कि
target वह
target समय
target पर
target आ
target रही
target है
target _END
target START_
target क्या
target आप
target मुझे
target बता
target सकते
target हैं
target कि
target यह
target किस
target नाप
target का
target है
target _END
target START_
target वह
target संगीत
target का
target बहुत
target शौकीन
target है।
target _END
target START_
target हर
target इनसान
target की
target राय
target अलग
target होती
target है।
target _END
target START_
target मै

target ही
target नहीं।
target _END
target START_
target मुझे
target पीठ
target में
target बुरी
target तरह
target से
target दर्द
target हो
target रहा
target है।
target _END
target START_
target तू
target कैसा
target है
target _END
target START_
target वह
target कैनटीन
target में
target लन्च
target खाता
target है।
target _END
target START_
target वह
target हर
target सुबह
target अपने
target कुत्ते
target को
target सैर
target पर
target ले
target जाता
target है।
target _END
target START_
target जल्दी
target कीजिए।
target _END
target START_
target मुझे
target पिंजरा
target खाली
target मिला।
target _END
target START_
target यह
target नदी
target एक
target मील
target चौड़ी
target है।
target _END
target START_
target उसने
target बुरे
target वक्त
target के
target लिए
target पैसे
target बचाए।
target _END
target START_
target बच्चों
target को
target दवाईयों
target से
target दूर
target रखना
target चहिए।
target _END
target START_
target वह
target काम
target करती
target रही।
target _END
target START_


target हो
target क्योंकि
target मेरी
target अभी
target हस्पताल
target में
target है।
target _END
target START_
target डॉक्टर
target ने
target उसको
target छुट्टी
target लेने
target की
target सलाह
target दी।
target _END
target START_
target वह
target बहुत
target बकबक
target करती
target है।
target _END
target START_
target उस
target तरह
target का
target आदमी
target मुझसे
target झिलता
target नहीं
target है।
target _END
target START_
target तुम्हे
target बस
target उसकी
target सलाह
target के
target मुताबिक
target काम
target करना
target होगा।
target _END
target START_
target तुम
target कोई
target दिलचस्प
target किताब
target पढ़
target रही
target हो
target क्या
target _END
target START_
target मैं
target फ़ैसला
target कर
target चुका
target हूँ।
target _END
target START_
target मुझसे
target उसका
target अक्खड़पन
target झेला
target नहीं
target जाता।
target _END
target START_
target उसको
target अहंकारी
target होने
target की
target आदत
target है।
target _END
target START_
target घंटी
target बज
targ

target है।
target _END
target START_
target हमे
target पर्यावरण
target की
target रक्षा
target करने
target की
target कोशिश
target करनी
target चाहिए।
target _END
target START_
target कोई
target है
target क्या
target _END
target START_
target कहना
target और
target करना
target अलगअलग
target बातें
target हैं।
target _END
target START_
target यह
target पैसा
target ज़रूरतमंदों
target में
target बाँट
target देना
target चाहिए।
target _END
target START_
target धूम्रपान
target आपको
target हानि
target पहुँचाएगा।
target _END
target START_
target ज़ुकाम
target हो
target तो
target यह
target दवाई
target ले
target लेना।
target _END
target START_
target मैं
target हिल
target नहीं
target सकता।
target _END
target START_
target वह
target किसी
target भी
target चीज़
target से
target नहीं
target डरती
target है।
target _END
target START_
target ग्लास
target रेत
target से
target बनाया
target जाता
target है।
target _END
target START_
target टॉम
target मेरा
target लड़का
target है।
target _END
target START_
target

target करूँगा
target तो
target कभी
target नहीं
target करूँगा।
target _END
target START_
target वे
target ज़ू
target गए
target थे।
target _END
target START_
target तुम्हे
target अकेले
target रहना
target अच्छा
target लगता
target है
target क्या
target _END
target START_
target वह
target दस
target भाषाएँ
target बोलना
target जानता
target है।
target _END
target START_
target जापान
target में
target सभी
target बच्चें
target स्कूल
target जाते
target हैं।
target _END
target START_
target इसको
target अपना
target घर
target ही
target समझो।
target _END
target START_
target मेरा
target जन्मदिन
target आज
target से
target एक
target महीने
target में
target है।
target _END
target START_
target हो
target सके
target तो
target मैं
target उससे
target मिलना
target नहीं
target चाहूँगा।
target _END
target START_
target आप
target विदेश
target गए
target हुए
target हैं
target क्या
target _END
target START_
target मुझे
target उसका
target पता
target पता
target है।
target _END
target START_
target कुरसियाँ
target का

target START_
target वे
target अभी
target व्यस्थ
target हैं
target और
target आपसे
target बात
target नहीं
target कर
target सकतीं
target हैं।
target _END
target START_
target हमारे
target पास
target सोचने
target के
target लिए
target बहुत
target सारी
target बातें
target हैं।
target _END
target START_
target जहाज़
target में
target कितने
target लोग
target हैं
target _END
target START_
target मैं
target बहुत
target थक
target गया
target हूँ।
target _END
target START_
target वह
target धीरेधीरे
target ठीक
target हो
target जाएगा।
target _END
target START_
target उसने
target अपने
target दफ़तर
target के
target पैसों
target को
target गबन
target किया।
target _END
target START_
target मेरी
target उसके
target साथ
target पहली
target मुलाकात
target लंदन
target में
target हुई
target थी।
target _END
target START_
target वह
target सूप
target को
target सूँघ
target रहा
target है।
target _END
target START_
target मैं
target तुम्हें
target तुम्हारे
target होमवर्क
target के
target साथ
target मदद
target करना
ta

target हूँ।
target _END
target START_
target मैं
target टॉम
target और
target जॉन
target के
target बीच
target में
target बैठा।
target _END
target START_
target मुझे
target एक
target गिलास
target पानी
target देदीजिए।
target _END
target START_
target ऑस्ट्रेलिया
target ऊन
target का
target बड़ी
target मात्रा
target में
target निर्यात
target करता
target है।
target _END
target START_
target मुझे
target ये
target कल
target तक
target खतम
target करना
target है
target ।
target _END
target START_
target चियर्स
target _END
target START_
target तुम्हे
target इस
target तरह
target की
target आदत
target तोड़
target देनी
target चाहिए।
target _END
target START_
target उसने
target पैसेवाले
target से
target शादी
target की।
target _END
target START_
target मेरी
target घड़ी
target ख़राब
target हो
target गई।
target _END
target START_
target कौआ
target कोयले
target जैसा
target काला
target होता
target है।
target _END
target START_
target सोच
target लो।
target _END
target START_
target आधे
target सेव
target सड़


target छोड़ने
target का
target आदेश
target दिया।
target _END
target START_
target कल
target रात
target क्या
target हुआ
target _END
target START_
target आज
target ट्रेन
target दस
target मिनट
target लेट
target है।
target _END
target START_
target तुम्हे
target इसे
target राज़
target रखना
target चहिए
target था।
target _END
target START_
target ये
target चिड़ियाँ
target हैं।
target _END
target START_
target मुझे
target सायकल
target चलाना
target चलने
target से
target ज़्यादा
target पसंद
target है।
target _END
target START_
target मेरे
target पिताजी
target कैंसर
target से
target चल
target बसे।
target _END
target START_
target मैं
target परेशान
target था
target क्योंकि
target मुझे
target फ़्रांसीसी
target बोलनी
target नहीं
target आती
target थी।
target _END
target START_
target उसे
target ज़ुकाम
target बहुत
target आसानी
target से
target हो
target जाता
target है।
target _END
target START_
target मुझे
target इस
target तरह
target का
target सोफ़ा
target नहीं
target खरीदना
target है।
target _END
ta

target गए
target हैं।
target _END
target START_
target घूमफिरकर
target बात
target मत
target करो
target सीधेसीधे
target बोलो।
target _END
target START_
target आसपास
target कोई
target नहीं
target है।
target _END
target START_
target उसने
target सफ़ेद
target कपड़े
target पहने
target हुएँ
target हैं।
target _END
target START_
target उस
target राजा
target से
target उसकी
target ताक़त
target छीन
target ली
target गई।
target _END
target START_
target उन्होंने
target ने
target मुझसे
target टूटी
target हुई
target खिड़की
target के
target लिए
target पैसे
target माँगे।
target _END
target START_
target तुम
target उस
target ड्रेस
target में
target अच्छी
target लगती
target हो।
target _END
target START_
target उसे
target धोका
target मत
target दो।
target _END
target START_
target आप
target एक
target और
target कप
target चाय
target पीना
target चाहेंगे
target क्या
target _END
target START_
target क्या
target आपको
target पेट
target में
target दर्द
target महसूस
target हो
target रहा
target है
target _END
targe

target START_
target मैं
target बेहोश
target हो
target गया।
target _END
target START_
target मेरा
target दीवालिया
target हो
target चुका
target है।
target _END
target START_
target तुम्हे
target टॉम
target को
target रोकना
target ही
target होगा।
target _END
target START_
target जब
target पिताजी
target विदेश
target में
target थे
target वे
target हमारे
target साथ
target चिट्ठी
target और
target फ़ोन
target से
target सम्पर्क
target करते
target थे।
target _END
target START_
target वह
target बुखार
target से
target जल
target रहा
target था।
target _END
target START_
target आप
target डॉक्टर
target हैं
target क्या
target _END
target START_
target किसी
target ने
target मेरी
target पतंग
target काट
target ली
target है।
target _END
target START_
target उसे
target नारंगी
target अच्छे
target लगते
target हैं।
target _END
target START_
target यह
target असली
target हीरा
target होगा।
target _END
target START_
target वह
target आठ
target साल
target का
target था
target जब
target उसने
target अपने
target मातापित

target नसीब
target अच्छा
target है।
target _END
target START_
target अगर
target तुम
target मदद
target चाह्ते
target हो
target तो
target मैं
target मदद
target करने
target के
target लिए
target तैयार
target हूँ।
target _END
target START_
target मैं
target बस
target स्कूल
target पहुँचा
target ही
target था
target कि
target घंटी
target बज
target गई।
target _END
target START_
target तुम
target अच्छे
target से
target सोये
target क्या
target _END
target START_
target उसने
target एक
target सुंदर
target लड़की
target को
target देखा।
target _END
target START_
target शराब
target की
target एक
target बूंद
target भी
target मत
target पियो।
target _END
target START_
target छत
target पर
target जो
target चिड़िया
target बैठी
target है
target वह
target एक
target कौआ
target है।
target _END
target START_
target रेलगाड़ी
target में
target डब्बे
target हैं।
target _END
target START_
target वो
target मजेदार
target था
target i
target _END
target START_
target तुम्हे
target दोपहर
target में
target क्या
target करने


target किसी
target भी
target पहलू
target में
target एकसमान
target नहीं
target हैं।
target _END
target START_
target ज़बान
target सम्भाल
target के
target बात
target करो।
target _END
target START_
target एक
target लम्बा
target है
target और
target दूसरा
target छोटा
target है।
target _END
target START_
target माफ़
target कीजिएगा
target मेरे
target पापा
target अभी
target घर
target पर
target नहीं
target हैं।
target _END
target START_
target उनकी
target ट्रेन
target छूट
target गई।
target _END
target START_
target मेरी
target सोच
target तुम्हारी
target सोच
target से
target बिलकुल
target अलग
target है।
target _END
target START_
target गोलीबारी
target लगभग
target दोपहर
target के
target बारह
target बजे
target शुरू
target हुई।
target _END
target START_
target a
target b
target से
target पाँचगुना
target लम्बा
target है।
target _END
target START_
target तुम
target आज
target सुबह
target देर
target से
target क्यों
target आए
target _END
target START_
target यह
target किताब
target है।
target _END
target

target को
target चालू
target कर
target दिया।
target _END
target START_
target उसने
target विदेश
target में
target पढ़ाई
target करी
target थी।
target _END
target START_
target लड़का
target मुझको
target देखते
target ही
target भाग
target गया।
target _END
target START_
target पापा
target बाथरूम
target में
target दाढ़ी
target बना
target रहे
target हैं।
target _END
target START_
target मुझे
target तुमसे
target किसी
target बारे
target में
target बात
target करनी
target है।
target _END
target START_
target वह
target आज
target टीवी
target पर
target आएगी।
target _END
target START_
target आजकल
target अंग्रेज़ी
target अच्छे
target से
target बोलना
target जानना
target बहुत
target ज़रूरी
target है।
target _END
target START_
target मदर
target टेरेसा
target को
target जो
target इनाम
target में
target पैसे
target मिले
target उन्होंने
target उन
target पैसों
target को
target भारत
target और
target विदोश
target दोनों
target में
target अपने
target काम
target में
target लगाया।
target _END
target START_
target आ

target टेस्ट
target के
target नतीजे
target को
target जानने
target के
target लिए
target बेचैन
target है।
target _END
target START_
target राजा
target ने
target अपने
target दुश्मनों
target को
target कुचल
target दिया।
target _END
target START_
target मेरे
target साथ
target डान्स
target करना
target चाहती
target हो
target क्या
target _END
target START_
target विष्व
target में
target ऐसी
target कोई
target भी
target वस्तु
target नहीं
target है
target जिसपर
target सूर्य
target का
target प्रभाव
target न
target पड़ता
target हो।
target _END
target START_
target माफ़
target कीजिएगा
target अगर
target मैंने
target आपको
target परेशान
target किया
target तो।
target _END
target START_
target क्या
target आप
target हमारे
target साथ
target खाना
target खाने
target नहीं
target आएंगे
target _END
target START_
target दस
target साल
target बहुत
target लम्बा
target समय
target होता
target है।
target _END
target START_
target वे
target मेरा
target विश्वास
target नहीं
target करेंगे
target चाहे
target मैं
target कसम


target _END
target START_
target वह
target अक्सर
target गिटार
target बजाता
target है।
target _END
target START_
target उसे
target बहुत
target सारा
target पैसा
target मिला।
target _END
target START_
target मैंने
target उसको
target पैसे
target देने
target की
target कोशिश
target करी
target पर
target उसने
target इनकार
target कर
target दिया।
target _END
target START_
target मैं
target तुमपर
target भरोसा
target कर
target रहा
target हूँ।
target _END
target START_
target तुम्हारी
target आँखे
target खराब
target हैं
target क्या
target _END
target START_
target क्या
target तुम्हें
target यह
target किताब
target पसंद
target है
target _END
target START_
target उन्होंने
target ख़ज़ाना
target ढूँढने
target के
target लिए
target यहाँवहाँ
target खोदा।
target _END
target START_
target मैंने
target हिरण
target के
target पैरों
target के
target निशानों
target का
target पीछा
target किया।
target _END
target START_
target उसकी
target नीली
target आँखें
target हैं।
target _END
target START_
target तुम्हे
target इ

In [52]:
print(decoder_input_data[:2])
print(y[:2])
target_token_index["हो"]
print(decoder_target_data[:2])

[[1.000e+00 1.219e+03 1.456e+03 2.535e+03 2.943e+03 1.052e+03 2.080e+02
  1.744e+03 4.210e+02 2.534e+03 2.169e+03 2.939e+03 0.000e+00 0.000e+00
  0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00
  0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00]
 [1.000e+00 2.268e+03 2.126e+03 2.943e+03 1.032e+03 0.000e+00 0.000e+00
  0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00
  0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00
  0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00 0.000e+00]]
2496    START_ तुम नसीब वालो हो जिसके इतना प्यार करने ...
113                          START_ मोटे मत हो जाना। _END
Name: hin, dtype: object
[[[0. 0. 0. ... 0. 0. 0.]
  [0. 0. 0. ... 0. 0. 0.]
  [0. 0. 0. ... 0. 0. 0.]
  ...
  [0. 0. 0. ... 0. 0. 0.]
  [0. 0. 0. ... 0. 0. 0.]
  [0. 0. 0. ... 0. 0. 0.]]

 [[0. 0. 0. ... 0. 0. 0.]
  [0. 0. 0. ... 0. 0. 0.]
  [0. 0. 0. ... 0. 0. 0.]
  ...
  [0. 0. 0. ... 0. 0. 0.]
  [0. 0. 0. ... 0. 0. 0.]


In [195]:
#HERE THE DATASET IS SO SMALL WE CAN USE THIS CODE FOR GENERATING VALIDATING MATRICES FOR INPUT

'''encoder_input_val_data = np.zeros(
    (len(X_test), max_length_src),
    dtype='float32')
decoder_input_val_data = np.zeros(
    (len(X_test), max_length_tar),
    dtype='float32')
decoder_target_val_data = np.zeros(
    (len(X_test), max_length_tar, num_decoder_tokens), #we can  also pass the pass y_train bcoz we just need len nothing else
    dtype='float32')


   
for i, (input_text, target_text) in enumerate(zip(X_test, y_test)):
      for t, word in enumerate(input_text.split()):
          encoder_input_val_data[i, t] = input_token_index[word] # encoder input seq
      for t, word in enumerate(target_text.split()):
          if t<len(target_text.split())-1:
              decoder_input_val_data[i, t] = target_token_index[word] # decoder input seq
          if t>0:
              # decoder target sequence (one hot encoded)
              # does not include the START_ token
              # Offset by one timestep
              decoder_target_val_data[i, t - 1, target_token_index[word]] = 1
'''

In [197]:
#encoder_input_val_data.shape

(278, 22)

In [201]:
#decoder_target_val_data.shape


(278, 27, 2969)

In [320]:
#decoder_input_data[0].shape
encoder_input_data.shape

(2773, 22)

# ENCODER DECODER MODEL ARCHITECTURE

In [55]:
#ENCODER DECODER MODEL ARCHITECTURE
latent_dim = 256

In [56]:
# Encoder
encoder_inputs = Input(shape=(None,))
enc_emb =  Embedding(num_encoder_tokens, latent_dim, mask_zero = True)(encoder_inputs)
encoder_lstm = LSTM(latent_dim, return_state=True)
encoder_outputs, state_h, state_c = encoder_lstm(enc_emb)
# We discard `encoder_outputs` and only keep the states.
encoder_states = [state_h, state_c]

In [57]:
#Set up the decoder, using `encoder_states` as initial state.
decoder_inputs = Input(shape=(None,))
dec_emb_layer = Embedding(num_decoder_tokens, latent_dim, mask_zero = True)
dec_emb = dec_emb_layer(decoder_inputs)
# We set up our decoder to return full output sequences,
# and to return internal states as well. We don't use the
# return states in the training model, but we will use them in inference.
decoder_lstm = LSTM(latent_dim, return_sequences=True, return_state=True)
decoder_outputs, _, _ = decoder_lstm(dec_emb,
                                     initial_state=encoder_states)
decoder_dense = Dense(num_decoder_tokens, activation='softmax')
decoder_outputs = decoder_dense(decoder_outputs)

# Define the model that will turn
# `encoder_input_data` & `decoder_input_data` into `decoder_target_data`
model = Model([encoder_inputs, decoder_inputs], 
              s)

In [58]:
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['acc'])

In [59]:
model.summary()

Model: "functional_1"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_2 (InputLayer)            [(None, None)]       0                                            
__________________________________________________________________________________________________
input_3 (InputLayer)            [(None, None)]       0                                            
__________________________________________________________________________________________________
embedding (Embedding)           (None, None, 256)    599552      input_2[0][0]                    
__________________________________________________________________________________________________
embedding_1 (Embedding)         (None, None, 256)    760064      input_3[0][0]                    
_______________________________________________________________________________________

In [253]:
#displaying model architecture
#from IPython.display import Image
#Image(retina=True, filename='train_model.png')

In [327]:
train_samples = len(X_train)
val_samples = len(X_test)
batch_size = 64
epochs = 200

In [255]:
y_test.shape

(278,)

# Training

In [329]:
model.fit([encoder_input_data, decoder_input_data], decoder_target_data,
          batch_size=batch_size,
          epochs=epochs,
           validation_split=0.2)

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200
Epoch 78

<tensorflow.python.keras.callbacks.History at 0x7f0e6ec84518>

In [331]:
model.save_weights('/content/drive/My Drive/Colab Notebooks/LanguageTranslation/nmt_weights.h5') #saving model weight
model.save('/content/drive/My Drive/Colab Notebooks/LanguageTranslation/model.h5') #saving model

# Inference setup

In [332]:
#inference setup
# Encode the input sequence to get the "thought vectors"
encoder_model = Model(encoder_inputs, encoder_states)

# Decoder setup
# Below tensors will hold the states of the previous time step
decoder_state_input_h = Input(shape=(latent_dim,))
decoder_state_input_c = Input(shape=(latent_dim,))
decoder_states_inputs = [decoder_state_input_h, decoder_state_input_c]

dec_emb2= dec_emb_layer(decoder_inputs) # Get the embeddings of the decoder sequence

# To predict the next word in the sequence, set the initial states to the states from the previous time step
decoder_outputs2, state_h2, state_c2 = decoder_lstm(dec_emb2, initial_state=decoder_states_inputs)
decoder_states2 = [state_h2, state_c2]
decoder_outputs2 = decoder_dense(decoder_outputs2) # A dense softmax layer to generate prob dist. over the target vocabulary

# Final decoder model
decoder_model = Model(
    [decoder_inputs] + decoder_states_inputs,
    [decoder_outputs2] + decoder_states2)

# Function for decoding 

In [333]:
def decode_sequence(input_seq):
    # Encode the input as state vectors.
    #print('sequences',input_seq)
    states_value = encoder_model.predict(input_seq)

    #print('states_values',states_value)
    # Generate empty target sequence of length 1.
    target_seq = np.zeros((1,1))
    # Populate the first character of target sequence with the start character.
    target_seq[0, 0] = target_token_index['START_']

    # Sampling loop for a batch of sequences
    # (to simplify, here we assume a batch of size 1).
    stop_condition = False
    decoded_sentence = ''
    while not stop_condition:
        output_tokens, h, c = decoder_model.predict([target_seq] + states_value)

        # Sample a token
        sampled_token_index = np.argmax(output_tokens[0, -1, :])
        sampled_char = reverse_target_char_index[sampled_token_index]

        decoded_sentence += ' '+sampled_char

        # Exit condition: either hit max length
        # or find stop character.
        if (sampled_char == '_END' or
        len(decoded_sentence) > 50):
              stop_condition = True

        # Update the target sequence (of length 1).
        target_seq = np.zeros((1,1))
        target_seq[0, 0] = sampled_token_index

        # Update states
        states_value = [h, c]

    return decoded_sentence

In [174]:
#THIS GENERATOR FUNCTIO CAN BE USE FOR DATA GENERATION IN CASE IF WE WANT TO USE FIT_GENERATOR INSTEAD OF FIT AND WE CAN USE TRAIN AND TEST DATA
def generate_batch(X = X_train, y = y_train, batch_size = 128):
    ''' Generate a batch of data '''
    while True:
        for j in range(0, len(X), batch_size):
            encoder_input_data = np.zeros((batch_size, max_length_src),dtype='float32')
            decoder_input_data = np.zeros((batch_size, max_length_tar),dtype='float32')
            decoder_target_data = np.zeros((batch_size, max_length_tar, num_decoder_tokens),dtype='float32')
            for i, (input_text, target_text) in enumerate(zip(X[j:j+batch_size], y[j:j+batch_size])):
                for t, word in enumerate(input_text.split()):
                    encoder_input_data[i, t] = input_token_index[word] # encoder input seq
                for t, word in enumerate(target_text.split()):
                    if t<len(target_text.split())-1:
                        decoder_input_data[i, t] = target_token_index[word] # decoder input seq
                    if t>0:
                        # decoder target sequence (one hot encoded)
                        # does not include the START_ token
                        # Offset by one timestep
                        decoder_target_data[i, t - 1, target_token_index[word]] = 1.
            yield([encoder_input_data, decoder_input_data], decoder_target_data)          


# Data Testing

In [257]:
#RESULT TRAINING AND TESTING DATA AND GENERATE DATA USING GENERATOR_BATCH
train_gen = generate_batch(X_train, y_train, batch_size = 1)
k=-1

In [258]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_train[k:k+1].values[0])
print('Actual Hindi Translation:', y_train[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: he reminded his wife to wake him up at am
Actual Hindi Translation:  उसने अपनी पत्नी को उसे सुबह सात बजे उठाने की बात का याद दिलाया। 
Predicted Hindi Translation:  उसने अपनी पत्नी को उसे सुबह सात बजे उठाने की बा


In [259]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_train[k:k+1].values[0])
print('Actual Hindi Translation:', y_train[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: im looking for a small suitcase
Actual Hindi Translation:  मैं एक छोटी अटैची को ढूँढ रहा हूँ। 
Predicted Hindi Translation:  मैं एक छोटी अटैची को ढूँढ रहा हूँ। 


In [260]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_train[k:k+1].values[0])
print('Actual Hindi Translation:', y_train[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: he usually comes home late
Actual Hindi Translation:  वह आमतौर पर घर देर से आता है। 
Predicted Hindi Translation:  वह आमतौर पर घर देर से आता है। 


In [263]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_train[k:k+1].values[0])
print('Actual Hindi Translation:', y_train[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: i cant walk any further
Actual Hindi Translation:  मैं और नहीं चल सकती। 
Predicted Hindi Translation:  मुझसे और नहीं चला जाएगा। 


In [264]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_train[k:k+1].values[0])
print('Actual Hindi Translation:', y_train[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: you shouldve come yesterday
Actual Hindi Translation:  तुम्हे कल आना चाहिए था। 
Predicted Hindi Translation:  तुम्हे कल आना चाहिए था। 


In [265]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_train[k:k+1].values[0])
print('Actual Hindi Translation:', y_train[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: my hobby is visiting old temples
Actual Hindi Translation:  मैं पुराने मंदिरों को देखने जाने का शौकीन हूँ। 
Predicted Hindi Translation:  मैं पुराने मंदिरों को देखने जाने का शौकीन हूँ। 


In [266]:
#TESTING ON TESTING DATA
train_gen = generate_batch(X_test, y_test, batch_size = 1)
k=-1


In [267]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: dont shout
Actual Hindi Translation:  चिल्लाओ मत 
Predicted Hindi Translation:  चिल्लाईए मत। 


In [268]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: we ordered pink but we received blue
Actual Hindi Translation:  हमने पिंक रंग वाले का ऑर्डर किया था पर हमे नीले रंग वाला मिला। 
Predicted Hindi Translation:  हमने मामले की देखभाल अच्छी खुशी से गए। 


In [269]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: no answer is also an answer
Actual Hindi Translation:  जवाब न देना भी एक तरह का जवाब होता है। 
Predicted Hindi Translation:  तुम्हारी उम्र दिन मुझे लिखा है वह सच है। 


In [270]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: this watch is broken
Actual Hindi Translation:  यह घड़ी टूटी हुई है। 
Predicted Hindi Translation:  इस दवाई को है। 


In [271]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: i want you to go to osaka at once
Actual Hindi Translation:  फ़ौरन ओसाका जाओ। 
Predicted Hindi Translation:  मैं एक बूढ़े आदमी की तलाश की सलाह वाला हूँ। 


In [272]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: i like the blue one how much does it cost
Actual Hindi Translation:  मुझे नीली वाली पसंद है कितने की है 
Predicted Hindi Translation:  मुझे नीला वाला पसंद है कितने का है 


In [273]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: i am grateful to them
Actual Hindi Translation:  मैं उनका आभारी हूँ। 
Predicted Hindi Translation:  मैं परेशान था कि तो। 


In [274]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: the road is parallel to the river
Actual Hindi Translation:  वह सड़क नदी के साथ साथ चलती है। 
Predicted Hindi Translation:  एक टोपी इनसान की संगीत के पर बहुत खुश करो। 


In [275]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: i still dont know
Actual Hindi Translation:  मुझे अभी भी नहीं पता। 
Predicted Hindi Translation:  मुझे नहीं पता। 


In [276]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: were here to protect you
Actual Hindi Translation:  हम आपकी रक्षा करने के लिए यहाँ आए हैं। 
Predicted Hindi Translation:  आपकी रक्षा करना हमारा काम है। 


In [277]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: he has a lot of money
Actual Hindi Translation:  वह बहुत पैसेवाला है। 
Predicted Hindi Translation:  उसके अभी बहुत शौक लगती है। 


In [278]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: no i didnt go
Actual Hindi Translation:  नहीं मैं नहीं गया था। 
Predicted Hindi Translation:  मुझे नहीं पता गया कि क्या 


In [279]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: we must pay the tax
Actual Hindi Translation:  हमें टैक्स भरना पड़ेगा। 
Predicted Hindi Translation:  हमे अच्छी तक पहुँच गए। 


In [280]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: the trees are green
Actual Hindi Translation:  पेड़ हरे हैं। 
Predicted Hindi Translation:  कृपया पेड़ हैं। 


In [281]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: youre kidding
Actual Hindi Translation:  मज़ाक कर रहे हो 
Predicted Hindi Translation:  मौज करना। 


In [282]:
k+=1
(input_seq, actual_output), _ = next(train_gen)
decoded_sentence = decode_sequence(input_seq)
print('Input English sentence:', X_test[k:k+1].values[0])
print('Actual Hindi Translation:', y_test[k:k+1].values[0][6:-4])
print('Predicted Hindi Translation:', decoded_sentence[:-4])

Input English sentence: wash your hands before meals
Actual Hindi Translation:  खाना खाने से पहले अपने हाथ धोओ। 
Predicted Hindi Translation:  मेरी हाथ चल हैं। 


# TESTING ON USER INPUT DATA

In [369]:
def translation():
    
    list_exit_word=['exit','break','leave','bye']
    
    while True:
        input_text=input('Enter the text you want to translate \t')
        if input_text not in list_exit_word:
            thought_matrix=convert_user_input_into_mat(input_text)
            response=decode_sequence(thought_matrix)
            response=response.replace('_END','') #replacing _END with space
            print('original text \t',input_text)
            print('translated text \t',response)
        else:
            print('Have good day')
            return 


def convert_user_input_into_mat(input_text): #this method is same as we did above with data before training
    input_text=input_text.lower()
    encoder_input_data = np.zeros((1, max_length_src),dtype='float32') #creating matrix of max_le

    for t, word in enumerate(input_text.split()):
      #print(word)
      encoder_input_data[0, t] = input_token_index[word] #input_token_index is dict and our vocabulary is limited to if we enter any word which is not present in our vocab we 
      #will get an error

    return encoder_input_data

In [372]:
translation()#AS WE CAN SEE THAT THE ACCURACY IS NOT SO GOOD BECAUSE OF 2 MAJOR REASONS FIRST ONE IS THE DATA IS VERY SMALL AND SECOND ONE IS BECAUSE OF SMALL DATASET 
#UNCERTAINITY IS HIGH IN THE PERFORMANCE WE CAN USE THE CHARACTER LEVEL TRANSLATION INSTEAD OF WORD LEVEL BUT IN MOST OF CASES WORD LEVEL TRASNLATION IS USED
#AND ONE ADVANTAGE OF CHARACTER LEVEL TRANSLATION OVER WORD LEVEL IS THAT IN WORD LEVEL WE HAVE LIMITED VOCAB SO IF ANY WORD IS NOT PRESENT IN VOCAB THEN WE WILL GET AN ERROR
#BUT IN CASE OF CHARACTERS AS WE KNOW CHARACTERS ARE LIMITED IN EVERY LANGUAGE WE WILL GET GOOD RESULT COMPARATIVE TO WORD LEVEL SPEACIALLY WHEN WE HAVE SMALL DATASET.

Enter the text you want to translate 	HOW ARE YOU
original text 	 HOW ARE YOU
translated text 	  तुम कैसी हो 
Enter the text you want to translate 	I AM GOOD
original text 	 I AM GOOD
translated text 	  मुझे अंग्रेज़ी अच्छा लगता है। 
Enter the text you want to translate 	WHAT IS YOUR AGE
original text 	 WHAT IS YOUR AGE
translated text 	  तुम्हारी उम्र क्या है 
Enter the text you want to translate 	i do not know
original text 	 i do not know
translated text 	  मुझे नहीं पता। 
Enter the text you want to translate 	ok
original text 	 ok
translated text 	  मैं समझता हूँ। 
Enter the text you want to translate 	take care
original text 	 take care
translated text 	  बचाओ 
Enter the text you want to translate 	hello
original text 	 hello
translated text 	  नमस्ते। 
Enter the text you want to translate 	good
original text 	 good
translated text 	  मज़े करना। 
Enter the text you want to translate 	exit
Have good day
