### **Initialization**

In [105]:
stop_words  = open("stopwords.txt", "r")

In [106]:
stop_words_list = []
for line in stop_words:
    line = line.strip('\n').split()
    stop_words_list.append(line[0])

#### Statements to be imported

In [40]:
import inltk
from inltk.inltk import tokenize, get_embedding_vectors, predict_next_words, get_sentence_encoding, get_sentence_similarity, get_similar_sentences

In [None]:
import pyiwn
iwn = pyiwn.IndoWordNet()

### **Input**

In [1]:
input_sentence = input("Enter input sentence:")

Enter input sentence: मुझे खाना बहुत पसंद है


### **Preprocessing Data**

In [5]:
def preprocess_sentence(sentence):
    tokenized_ips = tokenize(sentence, 'hi')
    for i in range(len(tokenized_ips)):
        tokenized_ips[i] = tokenized_ips[i][1:]
    preprocessed_ips = ""
    for token in tokenized_ips:
        if token not in stop_words_list:
            preprocessed_ips += (" "+token)
    return preprocessed_ips

In [6]:
preprocess_sentence(input_sentence)

' मुझे खाना पसंद'

### **Ambiguous Word Input**

In [7]:
amb_word = input("Enter ambiguous word:")

Enter ambiguous word: खाना


In [8]:
import pandas as pd
from googletrans import Translator

import nltk
import string
import re

from nltk.stem import WordNetLemmatizer

from englisttohindi.englisttohindi import EngtoHindi

In [115]:
def HindiLemmetizer(word):
    temp=translator.translate(word).text
    updated_temp=lemmatizer.lemmatize(temp)
    return (EngtoHindi(updated_temp)).convert

### **pyiwn**

#### Data Gathering

In [267]:
import operator

def generate_synonyms_set(root_word, input_sentence, lst):
    # amb_word = HindiLemmetizer(amb_word)
    synsets = iwn.synsets(root_word)
    syn_head_sim = {}
    tst = []
    
    for synset in synsets:
        head = synset.head_word()
        ratio = get_sentence_similarity(synset.examples()[0], input_sentence ,'hi')
        print(head, ":", synset.examples()[0], ratio)
        
        if (head not in syn_head_sim):
            syn_head_sim[head] = ratio
        elif (head in syn_head_sim) and syn_head_sim[head] < ratio:
            syn_head_sim[head] = ratio
            
        if head == root_word and len(synset.lemma_names()) > 1:
            tst.append((synset.lemma_names()[1], ratio))
        
    print("Before:", syn_head_sim)
    syn_head_sim = dict(sorted(syn_head_sim.items(), key=operator.itemgetter(1),reverse=True))
    synonyms_list = []
    
    print("Printing dict:", syn_head_sim)
    for x in list(syn_head_sim)[0:7]:
        if x == root_word:
            for i, j in tst:
                print(i, j)
                print(syn_head_sim[x])
                if j == syn_head_sim[x]:
                    print("True")
                    lst.append(i)
        synonyms_list.append(x)
    
    print(synonyms_list)
    print("lst:", lst)
    return synonyms_list

### **Cosine Similarity**

In [58]:
def generate_sense_replaced_sentences(synonyms_set, input_sentence, amb_word):
    sentences_dict = {}
    for syn in synonyms_set:
        dummy = input_sentence
        sentences_dict[syn] = dummy.replace(amb_word, syn)
    return sentences_dict

In [210]:
def generate_highly_similar_sentences(sentences_dict):
    high_sim_sent = {}
    for sense, sent in sentences_dict.items():
        sim = get_sentence_similarity(sent, input_sentence, 'hi')
        if sim >= 0.9:
            print(">0.9->", sim, sent)
            high_sim_sent[sense] = sent
    return high_sim_sent

In [50]:
print(high_sim_sent)
print(input_sentence)
for sent in high_sim_sent:
    print(sent, get_sentence_similarity(sent, input_sentence, 'hi'))

['मुझे आहार बहुत पसंद है', 'मुझे बर्बाद करना बहुत पसंद है', 'मुझे भोजन बहुत पसंद है']
मुझे खाना बहुत पसंद है


मुझे आहार बहुत पसंद है 0.9283260703086853


मुझे बर्बाद करना बहुत पसंद है 0.9006214141845703


मुझे भोजन बहुत पसंद है 0.9286918640136719


In [18]:
ppc_high_sim_sent = []
for sent in high_sim_sent:
    ppc_high_sim_sent.append(preprocess_sentence(sent))

In [19]:
ppc_high_sim_sent

[' मुझे आहार पसंद', ' मुझे बर्बाद पसंद', ' मुझे भोजन पसंद']

### **MuRIL**

#### Model

In [20]:
import tensorflow as tf
import tensorflow_datasets as tfds
import tensorflow_hub as hub
import tensorflow_text as text
from bert import bert_tokenization
import numpy as np
from scipy.spatial import distance

In [21]:
def get_model(model_url, max_seq_length):
    inputs = dict(
        input_word_ids=tf.keras.layers.Input(shape=(max_seq_length,), dtype=tf.int32),
        input_mask=tf.keras.layers.Input(shape=(max_seq_length,), dtype=tf.int32),
        input_type_ids=tf.keras.layers.Input(shape=(max_seq_length,), dtype=tf.int32),
    )

    muril_layer = hub.KerasLayer(model_url, trainable=True)
    outputs = muril_layer(inputs)

    assert 'sequence_output' in outputs
    assert 'pooled_output' in outputs
    assert 'encoder_outputs' in outputs
    assert 'default' in outputs
    return tf.keras.Model(inputs=inputs,outputs=outputs["pooled_output"]), muril_layer

In [22]:
def create_input(input_strings, tokenizer, max_seq_length):
    input_ids_all, input_mask_all, input_type_ids_all = [], [], []
    for input_string in input_strings:
        input_tokens = ["[CLS]"] + tokenizer.tokenize(input_string) + ["[SEP]"]
        input_ids = tokenizer.convert_tokens_to_ids(input_tokens)
        sequence_length = min(len(input_ids), max_seq_length)
    
        if len(input_ids) >= max_seq_length:
            input_ids = input_ids[:max_seq_length]
        else:
            input_ids = input_ids + [0] * (max_seq_length - len(input_ids))

        input_mask = [1] * sequence_length + [0] * (max_seq_length - sequence_length)

        input_ids_all.append(input_ids)
        input_mask_all.append(input_mask)
        input_type_ids_all.append([0] * max_seq_length)
  
    return np.array(input_ids_all), np.array(input_mask_all), np.array(input_type_ids_all)

In [23]:
def encode(input_text):
    input_ids, input_mask, input_type_ids = create_input(input_text, 
                                                       tokenizer, 
                                                       max_seq_length)
    inputs = dict(
      input_word_ids=input_ids,
      input_mask=input_mask,
      input_type_ids=input_type_ids,
    )
    return muril_model(inputs)

In [24]:
max_seq_length = 128
muril_model, muril_layer = get_model(model_url="https://tfhub.dev/google/MuRIL/1", max_seq_length=max_seq_length)
     

vocab_file = muril_layer.resolved_object.vocab_file.asset_path.numpy()
do_lower_case = muril_layer.resolved_object.do_lower_case.numpy()
tokenizer = bert_tokenization.FullTokenizer(vocab_file, do_lower_case)

2023-05-16:10:12:31,839 INFO     [resolver.py:109] Using C:\Users\thakr\AppData\Local\Temp\tfhub_modules to cache modules.


#### Returning best Euclidean distance sentence

In [53]:
def tokenize_sentences(ppc_high_sim_sent):
    tokenized_sentences = []
    for sentence in ppc_high_sim_sent:
        s = sentence.strip()
        tokenized_sentences.append(s.split(" "))
    return tokenized_sentences

In [52]:
sent_without_mujhe = sentences

In [205]:
def generate_muril_output(sent):
    embeddings = encode(sent)
    tot_dist = 0
    print("->", sent)
    for index in range(len(sent)):
        tot_dist += distance.euclidean(np.array(embeddings[index]), np.array(embeddings[(index+1)%len(sent)]))
        print(sent[index], "\t", sent[(index+1)%len(sent)], "\t:", distance.euclidean(np.array(embeddings[index]), np.array(embeddings[(index+1)%len(sent)])))
    print("avg : ", tot_dist/len(sent), end = "\n\n")
    return tot_dist/len(sent)

In [37]:
for sentence in sentences:
    print("->", sentence[1])
    generate_muril_output(sentence)

-> पसंद
आहार 	 पसंद 	: 0.011560117825865746
पसंद 	 आहार 	: 0.011560117825865746
avg :  0.011560117825865746

-> पसंद
बर्बाद 	 पसंद 	: 0.008085211738944054
पसंद 	 बर्बाद 	: 0.008085211738944054
avg :  0.008085211738944054

-> पसंद
भोजन 	 पसंद 	: 0.010638106614351273
पसंद 	 भोजन 	: 0.010638106614351273
avg :  0.010638106614351273



In [275]:
def wsd_model(input_str, amb_word, root_word):    
    lst = []
    synonyms_set = generate_synonyms_set(root_word, input_str, lst)
    
    sentences_dict = generate_sense_replaced_sentences(synonyms_set, input_sentence, amb_word)
    # print(sentences_dict)
    
    high_sim_sent = generate_highly_similar_sentences(sentences_dict)
    # print(high_sim_sent)
    senses = []
    for sense in high_sim_sent.keys():
        senses.append(sense)
    
    ppc_high_sim_sent = []
    for sent in high_sim_sent.values():
        ppc_high_sim_sent.append(preprocess_sentence(sent))
        
    tokenized_sentences = tokenize_sentences(ppc_high_sim_sent)
    
    euclidean_dist = {}
    for index in range(len(tokenized_sentences)):
        euclidean_dist[senses[index]] = generate_muril_output(tokenized_sentences[index])
        
    if bool(euclidean_dist) == False:
        return input_str
    best_sense = list(euclidean_dist.keys())[0]
    min_dist = list(euclidean_dist.values())[0]
    min_dist
    for sense, dist in euclidean_dist.items():
        if min_dist > dist:
            min_dist = dist
            best_sense = sense
            
    if best_sense == root_word and len(lst):
        best_sense = lst[0]
    
    input_str = input_str.replace(amb_word, best_sense)
    return input_str

In [273]:
input_sentence = input("Enter input sentence:")

Enter input sentence: हम ताश खेल रहे हैं


In [270]:
amb_word = input("Enter ambiguous word:")

Enter ambiguous word: ताश


In [271]:
root_word = input("Enter root word:")

Enter root word: ताश


In [276]:
wsd_model(input_sentence, amb_word, root_word)

ज़री : सीता ने शादी में ज़री की साड़ी पहनी । 0.12953366339206696


ताश : उसने गुस्से में ताश को फाड़ दिया । 0.12842033803462982


ताश : कुछ लोग बाग में ताश खेल रहे हैं । 0.3216466009616852
Before: {'ज़री': 0.12953366339206696, 'ताश': 0.3216466009616852}
Printing dict: {'ताश': 0.3216466009616852, 'ज़री': 0.12953366339206696}
पत्ता 0.12842033803462982
0.3216466009616852
['ताश', 'ज़री']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं


-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



'हम ताश खेल रहे हैं'

In [229]:
generate_synonyms_set("फल", input_sentence)

फल 662 ['उसने फल की दुकान से एक किलो आम खरीदा ।'] 0.16055671870708466


नतीजा 2035 ['उसके काम का नतीजा बहुत ही बुरा निकला ।'] 0.20405006408691406


जायफल 2931 ['बच्चों को खाँसी आने पर जायफल को घिसकर पिलाया जाता है ।'] 0.09860213100910187


फल 4314 ['इस तीर का फल बहुत नुकीला है ।'] 0.38117098808288574


ढाल 5175 ['ढाल योद्धाओं को सुरक्षा प्रदान करती है ।'] 0.11565416306257248


ब्याज 7350 ['श्याम ब्याज पर पैसा देता है ।'] 0.15408121049404144


बोर्ड 10826 ['गुरुजी बोर्ड पर गणित समझा रहे हैं ।', 'सड़क के किनारे जगह-जगह पर दिग्दर्शक फलक लगे हुए हैं ।'] 0.00014742097118869424


राशिफल 38346 ['बहुत लोग राशिफल पर विश्वास नहीं करते हैं ।'] 0.05805698409676552


फल 38347 ['क्षेत्रफल, गुणनफल, योगफल, भागफल आदि फल हैं ।'] 0.023139819502830505


['नतीजा', 'ब्याज', 'ढाल', 'जायफल', 'राशिफल', 'फल', 'बोर्ड']

In [192]:
generate_synonyms_set("योग", input_sentence)

['उपाय', 'सिद्धांत', 'ध्यानयोग', 'नतीजा', 'अवसर', 'विश्वासघाती', 'मुहूर्त']


['उपाय',
 'सिद्धांत',
 'ध्यानयोग',
 'नतीजा',
 'अवसर',
 'विश्वासघाती',
 'मुहूर्त',
 'योगशास्त्र',
 'संबंध',
 'नाम',
 'नैयायिक',
 'योग',
 'सवारी',
 'उपयुक्ततता',
 'चतुराई',
 'ईश्वर',
 'प्रयोग',
 'लाभ',
 'योग छंद',
 'छल',
 'योगदान',
 'तपस्या',
 'औषध',
 'संपत्ति',
 'जोड़',
 'वशीकरण',
 'आय',
 'व्यवसाय']

In [165]:
get_sentence_similarity("वह प्रतिदिन योग करता है ।", input_sentence, 'hi')

0.2700381577014923

In [166]:
get_sentence_similarity("इन अंकों का जोड़ सावधानीपूर्वक करना", input_sentence, 'hi')

0.12754514813423157

In [278]:
import gradio as gr

In [281]:
outputs = gr.outputs.Textbox()
app = gr.Interface(fn=wsd_model, inputs=['text','text','text'], outputs=outputs,description="Hindi Word Sensse Disambiguation")

In [282]:
app.launch()

Running on local URL:  http://127.0.0.1:7861

To create a public link, set `share=True` in `launch()`.




ईश्वर : ईश्वर सर्वव्यापी है । 0.34982702136039734


नाम : हमारे प्राचार्य जी का नाम श्री पुष्पक भट्टाचार्य है । 0.339528888463974


जोड़ : इन अंकों का जोड़ सावधानीपूर्वक करना । 0.25820520520210266


जोड़ : इन संख्याओं का जोड़ बीस आया । 0.21522517502307892


उपाय : कोई ऐसा उपाय बताइए जिससे यह काम आसानी से हो जाए । 0.32295024394989014


सिद्धांत : हमें अपने सिद्धांतों का पालन करना चहिए । 0.4276919364929199


प्रयोग : यहाँ नशीले पदार्थों का प्रयोग वर्जित है । 0.20090411603450775


नतीजा : उसके काम का नतीजा बहुत ही बुरा निकला । 0.2677217423915863


लाभ : मुझे इस कपड़ा व्यापार से काफ़ी लाभ की उम्मीद थी । 0.3099312484264374


अवसर : इस काम को करने का अवसर आ गया है । 0.29774799942970276


आय : कृषि ही हमारी आय का मुख्य साधन है । 0.22766421735286713


औषध : नियमित औषध लेने से ही बीमारी ठीक होती है । 0.20499244332313538


छल : उसने छल से पूरी जायदाद अपने नाम करा ली । 0.29492682218551636


व्यवसाय : उसने कपड़ा बेचने के साथ-साथ एक दूसरा व्यवसाय भी शुरू किया है । 0.17527525126934052


तपस्या : दस्यु रत्नाकर कठोर तपस्या से वाल्मीकि बने थे । 0.3337845206260681


संपत्ति : उसने कड़ी मेहनत करके अत्यधिक संपत्ति अर्जित की । 0.25280141830444336


ध्यानयोग : संतजी  ध्यानयोग में लीन है । 0.3701060116291046


मुहूर्त : अभी लगन का मुहूर्त नहीं है । 0.33301830291748047


योग : वह प्रतिदिन योग करता है । 0.47221580147743225


संबंध : उस अचार को खाने तथा बुरा सपना देखने के बीच कोई संबंध अवश्य था । 0.3183537721633911


वशीकरण : तांत्रिक ने वशीकरण द्वारा रामू को अपने बस में कर लिया । 0.2359301745891571


योगदान : सभी ग्रामवासियों के योगदान से इस मंदिर का निर्माण हुआ है । 0.29162827134132385


योग : अम्ल और क्षार के योग से लवण बनता है । 0.19664664566516876


सवारी : वह सड़क पर खड़े होकर शहर की ओर जाने वाली किसी सवारी का इंतजार कर रहा था । 0.2861926555633545


विश्वासघाती : विश्वासघातियों पर विश्वास करना ही नहीं चाहिए । 0.3065476417541504


योगशास्त्र : पातंजलि का योगशास्त्र योगसूत्र के नाम से जाना जाता है । 0.2575295567512512


नैयायिक : नैयायिक ने अपने तर्क से सबको चुप कर दिया । 0.3278624415397644


योग : योगी को बरसों तपस्या करने के बाद योग प्राप्त हुआ । 0.4098542630672455


योग : योग की संख्या सत्ताइस है । 0.2818371653556824


योग छंद : योग छंद के प्रत्येक चरण में  बारह, आठ के विश्राम से बीस मात्राएँ और अन्त में यगण होता है । 0.3494008779525757


चतुराई : बिरबल की चतुराई से सभी प्रभावित थे । 0.3025335371494293


उपयुक्ततता : आलोचना गुण-दोषों एवं उपयुक्ततता का विवेचन करने वाली विधा है । 0.20167967677116394
Before: {'ईश्वर': 0.34982702136039734, 'नाम': 0.339528888463974, 'जोड़': 0.25820520520210266, 'उपाय': 0.32295024394989014, 'सिद्धांत': 0.4276919364929199, 'प्रयोग': 0.20090411603450775, 'नतीजा': 0.2677217423915863, 'लाभ': 0.3099312484264374, 'अवसर': 0.29774799942970276, 'आय': 0.22766421735286713, 'औषध': 0.20499244332313538, 'छल': 0.29492682218551636, 'व्यवसाय': 0.17527525126934052, 'तपस्या': 0.3337845206260681, 'संपत्ति': 0.25280141830444336, 'ध्यानयोग': 0.3701060116291046, 'मुहूर्त': 0.33301830291748047, 'योग': 0.47221580147743225, 'संबंध': 0.3183537721633911, 'वशीकरण': 0.2359301745891571, 'योगदान': 0.29162827134132385, 'सवारी': 0.2861926555633545, 'विश्वासघाती': 0.3065476417541504, 'योगशास्त्र': 0.2575295567512512, 'नैयायिक': 0.3278624415397644, 'योग छंद': 0.3494008779525757, 'चतुराई': 0.3025335371494293, 'उपयुक्ततता': 0.20167967677116394}
Printing dict: {'योग': 0.47221580147743225, 'सिद्धा

>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



पत्ता : वह बाग में गिरे सूखे पत्ते एकत्र कर रहा है । 0.20420344173908234


चादर : इस गाड़ी का ढाँचा धातु पटल से बनाया गया है । 0.09580745548009872


ताश : उसने गुस्से में ताश को फाड़ दिया । 0.06619558483362198


पीपरपर्न : सीता सोने के पीपरपर्न पहने हुए थी । 0.15046444535255432


पत्ता : उसने दवाई की दुकान से दवा का एक पत्ता खरीदा। 0.1286919265985489


पत्ता : गंजीफा का पत्ता कलात्मक और गोल होता है । 0.13931410014629364
Before: {'पत्ता': 0.20420344173908234, 'चादर': 0.09580745548009872, 'ताश': 0.06619558483362198, 'पीपरपर्न': 0.15046444535255432}
Printing dict: {'पत्ता': 0.20420344173908234, 'पीपरपर्न': 0.15046444535255432, 'चादर': 0.09580745548009872, 'ताश': 0.06619558483362198}
पात 0.20420344173908234
0.20420344173908234
True
['पत्ता', 'पीपरपर्न', 'चादर', 'ताश']
lst: ['पात']


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



ताजमहल : ताजमहल सदियों से पर्यटकों के आकर्षण का केन्द्र रहा है । -0.04787416383624077


मुकुट : राजा के सर पर मुकुट सुशोभित है । 0.0492188036441803


कलगी : मुर्गे के सिर पर लाल रंग की कलगी होती है । -0.010851066559553146


ताज : प्रतियोगिताओं में कई खिलाड़ियों के ताज छिन जाते हैं । -0.055239904671907425
Before: {'ताजमहल': -0.04787416383624077, 'मुकुट': 0.0492188036441803, 'कलगी': -0.010851066559553146, 'ताज': -0.055239904671907425}
Printing dict: {'मुकुट': 0.0492188036441803, 'कलगी': -0.010851066559553146, 'ताजमहल': -0.04787416383624077, 'ताज': -0.055239904671907425}
['मुकुट', 'कलगी', 'ताजमहल', 'ताज']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



पन्ना : बच्चे ने इस पुस्तक का एक पन्ना फाड़ दिया । 0.09425318241119385


पना : मुझे पना पीना पसंद है । 0.16622498631477356


पन्ना : यह पन्ना जड़ित अँगूठी है । 0.10804682970046997


पन्ना : इस जूते का पन्ना चमड़े का है । 0.12203922867774963


पन्ना : वह पन्ना का निवासी था । 0.028318632394075394


पन्ना जिला : पन्ना जिले का मुख्यालय पन्ना में है । 0.028683211654424667
Before: {'पन्ना': 0.12203922867774963, 'पना': 0.16622498631477356, 'पन्ना जिला': 0.028683211654424667}
Printing dict: {'पना': 0.16622498631477356, 'पन्ना': 0.12203922867774963, 'पन्ना जिला': 0.028683211654424667}
हरित मणि 0.10804682970046997
0.12203922867774963
पान 0.12203922867774963
0.12203922867774963
True
पन्ना शहर 0.028318632394075394
0.12203922867774963
['पना', 'पन्ना', 'पन्ना जिला']
lst: ['पान']


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



पन्ना : बच्चे ने इस पुस्तक का एक पन्ना फाड़ दिया । 0.09425318241119385


पना : मुझे पना पीना पसंद है । 0.16622498631477356


पन्ना : यह पन्ना जड़ित अँगूठी है । 0.10804682970046997


पन्ना : इस जूते का पन्ना चमड़े का है । 0.12203922867774963


पन्ना : वह पन्ना का निवासी था । 0.028318632394075394


पन्ना जिला : पन्ना जिले का मुख्यालय पन्ना में है । 0.028683211654424667
Before: {'पन्ना': 0.12203922867774963, 'पना': 0.16622498631477356, 'पन्ना जिला': 0.028683211654424667}
Printing dict: {'पना': 0.16622498631477356, 'पन्ना': 0.12203922867774963, 'पन्ना जिला': 0.028683211654424667}
हरित मणि 0.10804682970046997
0.12203922867774963
पान 0.12203922867774963
0.12203922867774963
True
पन्ना शहर 0.028318632394075394
0.12203922867774963
['पना', 'पन्ना', 'पन्ना जिला']
lst: ['पान']


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



इच्छा : इंसान की हर इच्छा पूरी नहीं होती । 0.42060378193855286


शौक : ममता को घूमने-फिरने का शौक है । 0.5287423133850098


चस्का : आजकल उसके पढ़ने के चस्के को देखकर सब प्रसन्न हैं । 0.5098875164985657
Before: {'इच्छा': 0.42060378193855286, 'शौक': 0.5287423133850098, 'चस्का': 0.5098875164985657}
Printing dict: {'शौक': 0.5287423133850098, 'चस्का': 0.5098875164985657, 'इच्छा': 0.42060378193855286}
['शौक', 'चस्का', 'इच्छा']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



Traceback (most recent call last):
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\gradio\routes.py", line 421, in run_predict
    event_data=event_data,
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\gradio\blocks.py", line 1321, in process_api
    fn_index, inputs, iterator, request, event_id, event_data
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\gradio\blocks.py", line 1049, in call_function
    fn, *processed_input, limiter=self.limiter
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\anyio\to_thread.py", line 29, in run_sync
    limiter=limiter)
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\anyio\_backends\_asyncio.py", line 818, in run_sync_in_worker_thread
    return await future
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\anyio\_backends\_asyncio.py", line 754, in run
    result = context.run(func, *args)
  File "C:\Users\thakr\AppData\Local\Temp\ipykernel_1588

भूल : रमा ने अपने पिता से अपनी भूल की क्षमा माँगी । 0.49525806307792664


गलती : उनके लेखों में वर्तनी और व्याकरण की गलतियाँ मिलती हैं । 0.3658895194530487
Before: {'भूल': 0.49525806307792664, 'गलती': 0.3658895194530487}
Printing dict: {'भूल': 0.49525806307792664, 'गलती': 0.3658895194530487}
ग़लती 0.3658895194530487
0.3658895194530487
True
['भूल', 'गलती']
lst: ['ग़लती']


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



बुद्धिमान : बुद्धिमानों की संगति में रहते-रहते तुम भी बुद्धिमान हो जाओगे । 0.5473990440368652


विवेकी : विवेकी व्यक्ति अपने विवेक द्वारा विषम परिस्थितियों पर भी नियंत्रण पा लेता है । 0.3235797584056854


बुद्धिमान : बुद्धिमान व्यक्ति व्यर्थ की बहस में नहीं पड़ते हैं । 0.4070586860179901
Before: {'बुद्धिमान': 0.5473990440368652, 'विवेकी': 0.3235797584056854}
Printing dict: {'बुद्धिमान': 0.5473990440368652, 'विवेकी': 0.3235797584056854}
['बुद्धिमान', 'विवेकी']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



मनपसंद : यह मेरा मनपसंद खाना है । 0.526232123374939
Before: {'मनपसंद': 0.526232123374939}
Printing dict: {'मनपसंद': 0.526232123374939}
['मनपसंद']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



सक्रिय : वह खेल-कूद में सक्रिय है । 0.4621984660625458


फुर्तीला : फुर्तीला व्यक्ति कोई भी काम जल्दी कर लेता है । 0.5006666779518127


सक्रिय : विश्व में कई सक्रिय ज्वालामुखी हैं । 0.2475729137659073
Before: {'सक्रिय': 0.4621984660625458, 'फुर्तीला': 0.5006666779518127}
Printing dict: {'फुर्तीला': 0.5006666779518127, 'सक्रिय': 0.4621984660625458}
क्रियाशील 0.4621984660625458
0.4621984660625458
True
['फुर्तीला', 'सक्रिय']
lst: ['क्रियाशील']


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



दृष्टि : गिद्ध की दृष्टि बहुत तेज़ होती है । 0.504946231842041


दृष्टिकोण : हमारे दृष्टिकोण से आपका यह काम अनुचित है । 0.45564016699790955


नज़र : माँ ने बच्चे को लोगों की नज़र से बचाने के लिए उसके माथे पर काला टीका लगा दिया । 0.5371835231781006


उपहार : जन्मदिन पर उसको ढेर सारे उपहार मिले । 0.3450165092945099


निगरानी : यह काम राम की निगरानी में हो रहा है । 0.39250341057777405


पहचान : उसकी पहचान की दाद देनी चाहिए । 0.496701717376709


दृष्टि : उनकी दृष्टि देखकर ही हम समझ गए कि वे बहुत गुस्से में हैं । 0.5329269766807556


ध्यान : मैंने उन्हें एक बार देखा तो है पर उनकी आकृति अभी ध्यान में नहीं आ रही है । 0.5044524073600769


नज़र : अमरीका की नज़रें विश्व के हर देश पर है । 0.39753028750419617


नज़र : पुलिस ने उस चोर पर नज़र रखी है । 0.3955710232257843
Before: {'दृष्टि': 0.5329269766807556, 'दृष्टिकोण': 0.45564016699790955, 'नज़र': 0.5371835231781006, 'उपहार': 0.3450165092945099, 'निगरानी': 0.39250341057777405, 'पहचान': 0.496701717376709, 'ध्यान': 0.5044524073600769}
Printing dict: {'नज़र': 0.5371835231781006, 'दृष्टि': 0.5329269766807556, 'ध्यान': 0.5044524073600769, 'पहचान': 0.496701717376709, 'दृष्टिकोण': 0.45564016699790955, 'निगरानी': 0.39250341057777405, 'उपहार': 0.3450165092945099}
['नज़र', 'दृष्टि', 'ध्यान', 'पहचान', 'दृष्टिकोण', 'निगरानी', 'उपहार']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



Traceback (most recent call last):
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\gradio\routes.py", line 421, in run_predict
    event_data=event_data,
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\gradio\blocks.py", line 1321, in process_api
    fn_index, inputs, iterator, request, event_id, event_data
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\gradio\blocks.py", line 1049, in call_function
    fn, *processed_input, limiter=self.limiter
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\anyio\to_thread.py", line 29, in run_sync
    limiter=limiter)
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\anyio\_backends\_asyncio.py", line 818, in run_sync_in_worker_thread
    return await future
  File "C:\Users\thakr\anaconda3\envs\final_env\lib\site-packages\anyio\_backends\_asyncio.py", line 754, in run
    result = context.run(func, *args)
  File "C:\Users\thakr\AppData\Local\Temp\ipykernel_1588

समाधान : मेरी समस्या का समाधान इतना आसान नहीं है । 0.22179146111011505


झगड़ा : वह झगड़े का कारण जानना चाहता है । 0.18401625752449036


हल : किसान खेत में हल चला रहा है । 0.14752744138240814


हलंत : कदाचित् के अंत में हलंत चिह्न आता है । 0.15617209672927856


सप्तर्षि : हर रात सप्तर्षि को आकाश में देखा जा सकता है । 0.11989174783229828


हल् : महान् में न् हल् है । 0.1485770046710968


कुरूपता : श्याम के गुणों के कारण उसकी कुरूपता छिप जाती है । 0.15266717970371246


हल : बलराम का अस्त्र हल था जिसके कारण उन्हें हलधर भी कहते हैं । 0.10800272226333618


हल : नंदनी के पैर में हल है । 0.16455775499343872


हल देश : हल देश का वर्णन बृहत्संहिता में मिलता है । 0.11075128614902496


हल : ज़मीदार के घर में लट्टा है । 0.14704178273677826


हल : हल देखकर ही बता सकते हैं कि गलती कहाँ हुई है । 0.1991954892873764
Before: {'समाधान': 0.22179146111011505, 'झगड़ा': 0.18401625752449036, 'हल': 0.1991954892873764, 'हलंत': 0.15617209672927856, 'सप्तर्षि': 0.11989174783229828, 'हल्': 0.1485770046710968, 'कुरूपता': 0.15266717970371246, 'हल देश': 0.11075128614902496}
Printing dict: {'समाधान': 0.22179146111011505, 'हल': 0.1991954892873764, 'झगड़ा': 0.18401625752449036, 'हलंत': 0.15617209672927856, 'कुरूपता': 0.15266717970371246, 'हल्': 0.1485770046710968, 'सप्तर्षि': 0.11989174783229828, 'हल देश': 0.11075128614902496}
लाँगल 0.14752744138240814
0.1991954892873764
संवर्तन 0.10800272226333618
0.1991954892873764
['समाधान', 'हल', 'झगड़ा', 'हलंत', 'कुरूपता', 'हल्', 'सप्तर्षि']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



अच्छा : दुनिया में अच्छे लोगों की कमी नहीं है । 0.13924387097358704


हित : वही काम करें जिसमें सबका हित हो । 0.14270734786987305


सज्जन : सज्जन व्यक्ति हर हालत में दूसरों का भला करते हैं । 0.19783569872379303


कल्याण : हमें सबके कल्याण की कामना करनी चाहिए । 0.16109530627727509


उपकार : अपका ये उपकार मैं कभी नहीं भूलूँगा । 0.25049880146980286


शुभ : शुभ कार्य की शुरुआत करने में देर नहीं होनी चाहिए । 0.14660413563251495


ख़ैर : ख़ैर, आप जो उचित समझें वही करें । 0.2421632707118988


भला : भला हो तुम्हारा । / भला आप हमारे घर आए तो । 0.28452107310295105


भला : भला ऐसा भी कभी होता है । 0.18521882593631744
Before: {'अच्छा': 0.13924387097358704, 'हित': 0.14270734786987305, 'सज्जन': 0.19783569872379303, 'कल्याण': 0.16109530627727509, 'उपकार': 0.25049880146980286, 'शुभ': 0.14660413563251495, 'ख़ैर': 0.2421632707118988, 'भला': 0.28452107310295105}
Printing dict: {'भला': 0.28452107310295105, 'उपकार': 0.25049880146980286, 'ख़ैर': 0.2421632707118988, 'सज्जन': 0.19783569872379303, 'कल्याण': 0.16109530627727509, 'शुभ': 0.14660413563251495, 'हित': 0.14270734786987305, 'अच्छा': 0.13924387097358704}
अच्छा 0.28452107310295105
0.28452107310295105
True
['भला', 'उपकार', 'ख़ैर', 'सज्जन', 'कल्याण', 'शुभ', 'हित']
lst: ['अच्छा']


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



हज : मौलवी साहब हज करने गए हैं । -0.03509962186217308
Before: {'हज': -0.03509962186217308}
Printing dict: {'हज': -0.03509962186217308}
['हज']
lst: []


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649



शांति : योग शांति प्राप्ति का एक साधन है । 0.09575996547937393


शांति : अंधेरी रात में निस्तब्धता छाई हुई थी । 0.07162833958864212


शान्ति : शांति का विवाह अथर्व ऋषि के साथ हुआ था । 0.10455728322267532


शांति : युद्ध के बाद देश में शांति है । 0.026763243600726128
Before: {'शांति': 0.09575996547937393, 'शान्ति': 0.10455728322267532}
Printing dict: {'शान्ति': 0.10455728322267532, 'शांति': 0.09575996547937393}
शान्ति 0.09575996547937393
0.09575996547937393
True
शान्ति 0.07162833958864212
0.09575996547937393
शान्ति 0.026763243600726128
0.09575996547937393
['शान्ति', 'शांति']
lst: ['शान्ति']


>0.9-> 1.0 हम ताश खेल रहे हैं


>0.9-> 1.0 हम ताश खेल रहे हैं
-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

-> ['ताश', 'खेल']
ताश 	 खेल 	: 0.01976960524916649
खेल 	 ताश 	: 0.01976960524916649
avg :  0.01976960524916649

