# B. Using IndicTrans

## Part 1

### Setup

In [1]:
%%capture
!git clone https://github.com/AI4Bharat/IndicTrans2.git

In [2]:
%%capture
%cd /content/IndicTrans2/huggingface_interface

In [3]:
%%capture
!python3 -m pip install nltk sacremoses pandas regex mock transformers>=4.33.2 mosestokenizer
!python3 -c "import nltk; nltk.download('punkt')"
!python3 -m pip install bitsandbytes scipy accelerate datasets
!python3 -m pip install sentencepiece

!git clone https://github.com/VarunGumma/IndicTransTokenizer
%cd IndicTransTokenizer
!python3 -m pip install --editable ./
%cd ..

### Inference

In [1]:
import torch
from transformers import AutoModelForSeq2SeqLM, BitsAndBytesConfig
from IndicTransTokenizer import IndicProcessor, IndicTransTokenizer

BATCH_SIZE = 4
DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
quantization = None

In [2]:
def initialize_model_and_tokenizer(ckpt_dir, direction, quantization):
    if quantization == "4-bit":
        qconfig = BitsAndBytesConfig(
            load_in_4bit=True,
            bnb_4bit_use_double_quant=True,
            bnb_4bit_compute_dtype=torch.bfloat16,
        )
    elif quantization == "8-bit":
        qconfig = BitsAndBytesConfig(
            load_in_8bit=True,
            bnb_8bit_use_double_quant=True,
            bnb_8bit_compute_dtype=torch.bfloat16,
        )
    else:
        qconfig = None

    tokenizer = IndicTransTokenizer(direction=direction)
    model = AutoModelForSeq2SeqLM.from_pretrained(
        ckpt_dir,
        trust_remote_code=True,
        low_cpu_mem_usage=True,
        quantization_config=qconfig,
    )

    if qconfig == None:
        model = model.to(DEVICE)
        if DEVICE == "cuda":
            model.half()

    model.eval()

    return tokenizer, model


def batch_translate(input_sentences, src_lang, tgt_lang, model, tokenizer, ip):
    translations = []
    for i in range(0, len(input_sentences), BATCH_SIZE):
        batch = input_sentences[i : i + BATCH_SIZE]

        # Preprocess the batch and extract entity mappings
        batch = ip.preprocess_batch(batch, src_lang=src_lang, tgt_lang=tgt_lang)

        # Tokenize the batch and generate input encodings
        inputs = tokenizer(
            batch,
            src=True,
            truncation=True,
            padding="longest",
            return_tensors="pt",
            return_attention_mask=True,
        ).to(DEVICE)

        # Generate translations using the model
        with torch.no_grad():
            generated_tokens = model.generate(
                **inputs,
                use_cache=True,
                min_length=0,
                max_length=256,
                num_beams=5,
                num_return_sequences=1,
            )

        # Decode the generated tokens into text
        generated_tokens = tokenizer.batch_decode(generated_tokens.detach().cpu().tolist(), src=False)

        # Postprocess the translations, including entity replacement
        translations += ip.postprocess_batch(generated_tokens, lang=tgt_lang)

        del inputs
        torch.cuda.empty_cache()

    return translations

### 1. English to Hindi

In [None]:
from google.colab import drive
import random
# Mount Google Drive
drive.mount('/content/drive')

# Access files in Google Drive
path = "/content/drive/My Drive/Colab Notebooks/random_text_EN.txt"

with open(path, "r", encoding="utf-8") as file:
    text_EN = file.readlines()

random_text_EN = text_EN

Mounted at /content/drive


In [None]:
for i in random_text_EN:
    print(i)

We now experience how something grows naturally.

Today is the 9thof August.

A glimpse of his life span reflects a glimpse of the entire India.

The Prime Minister pressed a lever to commence a Virtual Abhishek of the statue.

He said today India is not just the fastest growing economy in the world, but also the country that is eradicating poverty the fastest.

The Indian Side welcomed the decision to open an office of the Far East Agency in Mumbai.

During these last days, many great aspects of Atalji came up to the fore.

If a family itself continues to demoralise a child in the family and if that family expects that the kid will be respected in the locality then it is not possible.

At a public meeting at Ujire, the Prime Minister distributed RuPay cards to Pradhan Mantri Jan Dhan Yojana account holders.

There are more than 8 lakh doctors.

The MoU will help in strengthening bilateral cooperation between the two countries.

7. Posting of a Mid-Level health provider at the level of

In [None]:
en_indic_ckpt_dir = "ai4bharat/indictrans2-en-indic-dist-200M"  # ai4bharat/indictrans2-en-indic-dist-200M
en_indic_tokenizer, en_indic_model = initialize_model_and_tokenizer(en_indic_ckpt_dir, "en-indic", quantization)

ip = IndicProcessor(inference=True)

en_sents = random_text_EN

src_lang, tgt_lang = "eng_Latn", "hin_Deva"
en_to_hi = batch_translate(en_sents, src_lang, tgt_lang, en_indic_model, en_indic_tokenizer, ip)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/1.27k [00:00<?, ?B/s]

configuration_indictrans.py:   0%|          | 0.00/14.1k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/ai4bharat/indictrans2-en-indic-dist-200M:
- configuration_indictrans.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


modeling_indictrans.py:   0%|          | 0.00/61.3k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/ai4bharat/indictrans2-en-indic-dist-200M:
- modeling_indictrans.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


model.safetensors:   0%|          | 0.00/1.10G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/163 [00:00<?, ?B/s]

In [None]:
for i in en_to_hi:
  print(i)

अब हम अनुभव करते हैं कि कैसे कुछ प्राकृतिक रूप से बढ़ता है।
आज 9 अगस्त है।
उनके जीवन काल की एक झलक पूरे भारत की एक झलक को दर्शाती है।
प्रधानमंत्री ने प्रतिमा का आभासी अभिषेक शुरू करने के लिए एक लीवर दबाया।
उन्होंने कहा कि आज भारत न केवल दुनिया की सबसे तेजी से बढ़ती अर्थव्यवस्था है, बल्कि वह देश भी है जो गरीबी को सबसे तेजी से समाप्त कर रहा है।
भारतीय पक्ष ने मुंबई में सुदूर पूर्व एजेंसी का कार्यालय खोलने के निर्णय का स्वागत किया।
इन अंतिम दिनों में अटल जी के कई महान पहलू सामने आए।
यदि कोई परिवार स्वयं परिवार में किसी बच्चे का मनोबल गिराना जारी रखता है और यदि वह परिवार उम्मीद करता है कि बच्चे को इलाके में सम्मान दिया जाएगा तो यह संभव नहीं है।
उजिरे में एक जनसभा में प्रधानमंत्री ने प्रधानमंत्री जन धन योजना खाताधारकों को रुपे कार्ड वितरित किए।
8 लाख से अधिक डॉक्टर हैं।
यह समझौता ज्ञापन दोनों देशों के बीच द्विपक्षीय सहयोग को मजबूत करने में मदद करेगा।
7. उप-केंद्र के स्तर पर एक मध्य-स्तरीय स्वास्थ्य प्रदाता की नियुक्ति जो प्राथमिक स्वास्थ्य देखभाल और सार्वजनिक स्वास्थ्य से संबंधित दक्षताओं म

In [None]:
with open('random_text_EN.txt', 'w', encoding='utf-8') as file:
    for i in random_text_EN:
        file.writelines(i)

with open('En_to_Hi.txt', 'w', encoding='utf-8') as file:
    for i in en_to_hi:
        file.writelines(i)

### 2. Hindi to English

In [4]:
from google.colab import drive
import random
# Mount Google Drive
drive.mount('/content/drive')

# Access files in Google Drive
path = "/content/drive/My Drive/Colab Notebooks/random_text_HI.txt"

with open(path, "r", encoding="utf-8") as file:
    text_HI = file.readlines()

random_text_HI = text_HI

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [5]:
for i in random_text_HI:
    print(i)

इसी तरह चक्रवात को लेकर पूर्व सूचना जारी करने की दिशा में किए गए हैं।

अब तो विश्व के भी कुछ भागों में भगवान जगन्नाथ जी की रथयात्रा का उत्सव सम्पन्न होता है।

33. दोनों पक्षों ने आर्कटिक और अन्य क्षेत्रों सहित संयुक्त वैज्ञानिक अनुसंधान क्षेत्र में पारस्परिक रूप से लाभप्रद सहयोग के विकास के प्रति रूचि व्यक्त की।

सबसे पहले, 850 आवश्यक दवाओं की कीमतों को नियंत्रित किया गया और हृदय शल्य चिकित्सा और घुटने की सर्जरी के लिए इस्‍तेमाल होने वाले उपकरणों की कीमतों को कम किया गया ।

प्रधानमंत्री ने कहा कि आयुष्‍मान भारत योजना पूरी तरह से एक नई परस्‍पर संबद्ध व्‍यवस्‍था है जो स्‍वस्‍थ भारत बनाने में मदद करेगी।

मैं अक़बर साहब का आभारी हूँ।

इसी से पता चलता है कि हमारी प्राचीन विरासत और इतिहास के हमारे वीर नायकों के प्रति आज भी हमारी युवा-पीढ़ी में craze है।

अभी दो दिन पहले ही मैंने योग दिवस को लेकर के विश्व की सभी सरकारों को, सभी नेताओं को चिट्ठी लिखी है।

उन्‍होंने कहा कि आदि शंकराचार्य ने विभिन्‍न विचारधाराओं की अच्‍छाइयों को आत्‍मसात किया और उन पर विचार किया।

इसलिए स्‍वच्‍छ भारत मिशन- स्‍वच्‍

In [6]:
indic_en_ckpt_dir = "ai4bharat/indictrans2-indic-en-dist-200M"  # ai4bharat/indictrans2-indic-en-dist-200M
indic_en_tokenizer, indic_en_model = initialize_model_and_tokenizer(indic_en_ckpt_dir, "indic-en", "")

ip = IndicProcessor(inference=True)

en_sents = random_text_HI

src_lang, tgt_lang = "hin_Deva","eng_Latn",
hi_to_en = batch_translate(en_sents, src_lang, tgt_lang, indic_en_model, indic_en_tokenizer, ip)

In [7]:
for i in hi_to_en:
  print(i)

Similar steps have been taken towards the release of advance information about the cyclone.
Now the Rath Yatra of Lord Jagannath is celebrated in some parts of the world as well.
33. Both sides expressed interest in developing mutually beneficial cooperation in the field of joint scientific research, including in the Arctic and other areas.
First, the prices of 850 essential medicines were controlled and the prices of equipment used for heart surgery and knee surgery were reduced.
The Prime Minister said that the Ayushman Bharat scheme is a completely new interconnected system that will help create a healthy India.
I am thankful to Akbar Sahib.
This shows that there is still a craze among our youth towards our ancient heritage and our heroic heroes of history.
Just two days ago, I wrote a letter to all the governments and leaders of the world regarding Yoga Day.
He said that Adi Shankaracharya imbibed and reflected the goodness of various ideologies.
Therefore, the Swachh Bharat Missio

In [None]:
with open('random_text_HI.txt', 'w', encoding='utf-8') as file:
    for i in random_text_HI:
        file.writelines(i)

with open('Hi_to_En.txt', 'w', encoding='utf-8') as file:
    for i in hi_to_en:
        file.writelines(i)

### 3. Marathi to Hindi

In [None]:
from google.colab import drive
import random
# Mount Google Drive
drive.mount('/content/drive')

# Access files in Google Drive
path = "/content/drive/My Drive/Colab Notebooks/random_text_MR.txt"

with open(path, "r", encoding="utf-8") as file:
    text_MR = file.readlines()

random_text_MR = text_MR

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
for i in random_text_MR:
    print(i)

भारतातील आणखी 100 मागास जिल्हयांचा विकास करण्याची मोहिम सुरु करण्याचे आवाहन पंतप्रधानांनी केले.

निकटचे शेजारी म्हणून आमच्यातील नातेसंबंधांना अनेक स्तर आहेत.

येणाऱ्या 2019 मध्ये आपण गुरु नानक देवजी यांचं साडेपाचशेवं प्रकाश वर्ष साजरं करणार आहोत.

या बैठकीला अनुपस्थित असणाऱ्या मिझोरोमचे मुख्यमंत्र्यांतर्फे निवेदन देण्यात आले.

42 देशातल्या 300 संशोधकांपैकी 3 संशोधक भारताचे प्रतिनिधित्व करतात.

त्यावेळी तिथे एकाच वेळी अनेक देशांचे राष्ट्रध्वज फडकवले गेले.

पाण्याच्या बचतीचे महत्व सांगताना, कच्छमधली जनता पाण्याचे मोल जाणते, असे पंतप्रधान म्हणाले.

यामुळे आमच्या दोन्ही देशांच्या समाजांना जोडणारा एक बंध तयार होईल.

या बैठकीला पंतप्रधान संबोधित करतील.

दिवाळीनंतर लगेचच आपला देश ऐतिहासिक शुद्धतेच्या यज्ञाचा साक्षीदार ठरला आहे.

पर्यटनामध्ये मूल्यवर्धन अशाचवेळी होईल की, ज्यावेळी आपण फक्त मुलाखतकर्ता म्हणून परमुलुखात न जाता, एक विद्यार्थी म्हणून जावू आणि त्यांचे जीवन समजून घेण्याचा प्रयत्न करू.

वातावरण बदल, शाश्वत विकास, अन्न सुरक्षा आदी जागतिक आव्हानांवर शाश्वत तोडगा निघावा यासाठी संयुक्तरित

In [None]:
indic_indic_ckpt_dir = "ai4bharat/indictrans2-indic-indic-dist-320M"  # ai4bharat/indictrans2-indic-indic-dist-320M
indic_indic_tokenizer, indic_indic_model = initialize_model_and_tokenizer(indic_indic_ckpt_dir, "indic-indic", quantization)

ip = IndicProcessor(inference=True)

hi_sents = random_text_MR

src_lang, tgt_lang = "mar_Deva","hin_Deva"
mr_to_hi = batch_translate(hi_sents, src_lang, tgt_lang, indic_indic_model, indic_indic_tokenizer, ip)

config.json:   0%|          | 0.00/1.28k [00:00<?, ?B/s]

configuration_indictrans.py:   0%|          | 0.00/14.1k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/ai4bharat/indictrans2-indic-indic-dist-320M:
- configuration_indictrans.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


modeling_indictrans.py:   0%|          | 0.00/61.3k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/ai4bharat/indictrans2-indic-indic-dist-320M:
- modeling_indictrans.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


pytorch_model.bin:   0%|          | 0.00/1.28G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/168 [00:00<?, ?B/s]

In [None]:
for i in mr_to_hi:
    print(i)

प्रधानमंत्री ने भारत के 100 और पिछड़े जिलों के विकास के लिए एक अभियान शुरू करने का आह्वान किया।
एक करीबी पड़ोसी के रूप में हमारे बीच संबंधों के कई स्तर हैं।
2019 में हम गुरु नानक देव जी का साढ़े पांचवां प्रकाश वर्ष मनाएंगे।
बैठक से अनुपस्थित मिजोरम के मुख्यमंत्री ने एक बयान दिया।
42 देशों के 300 शोधकर्ताओं में से 3 भारत का प्रतिनिधित्व करते हैं।
उस समय एक ही समय में कई देशों के राष्ट्रध्वज फहराए गए थे।
पानी की बचत के महत्व पर प्रकाश डालते हुए प्रधानमंत्री ने कहा कि कच्छ के लोग पानी के मूल्य को जानते हैं।
यह हमारे दोनों देशों के समुदायों को जोड़ने वाला एक बांध बनाएगा।
प्रधानमंत्री बैठक को संबोधित करेंगे।
दिवाली के तुरंत बाद, हमारा देश ऐतिहासिक शुद्धता के ज्ञान का गवाह बन गया है।
पर्यटन में मूल्यवर्धन तभी होगा जब हम न केवल एक साक्षात्कारकर्ता के रूप में, बल्कि एक छात्र के रूप में जाकर उनके जीवन को समझने की कोशिश करेंगे।
दोनों नेता जलवायु परिवर्तन, सतत विकास, खाद्य सुरक्षा आदि वैश्विक चुनौतियों के स्थायी समाधान के लिए संयुक्त रूप से सकारात्मक और पर्याप्त योगदान देने पर सहमत हुए।
इन वीर ना

In [None]:
with open('random_text_MR.txt', 'w', encoding='utf-8') as file:
    for i in random_text_MR:
        file.writelines(i)

with open('Mr_to_Hi.txt', 'w', encoding='utf-8') as file:
    for i in mr_to_hi:
        file.writelines(i)

### 4. Hindi to Marathi

In [None]:
from google.colab import drive
import random
# Mount Google Drive
drive.mount('/content/drive')

# Access files in Google Drive
path = "/content/drive/My Drive/Colab Notebooks/random_text_HI_for_MR.txt"

with open(path, "r", encoding="utf-8") as file:
    text_HI_for_MR = file.readlines()

random_text_HI_for_MR = text_HI_for_MR

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
for i in random_text_HI_for_MR:
    print(i)

18. यह आयुष्‍मान भारत के अंतर्गत प्रस्‍तावित राष्‍ट्रीय स्‍वास्‍थ्‍य रक्षा मिशन के साथ जुड़ेगा।

भारत अब एक sweet revolution की ओर बढ़ रहा है।

इस बार भारतीय प्रेस परिषद की स्‍वर्ण जयंती भी मनाई जा रही है।

लेकिन जब कभी मैं ‘मन की बात’ के प्रभाव की ओर देखता हूँ तो मेरा विश्वास दृढ़ हो जाता है कि इस देश के जनमानस के साथ ‘मन की बात’ शत-प्रतिशत अटूट रिश्ते से बंध चुकी है।

प्रधानमंत्री ने कहा कि मात्र प्रकृति के संसाधनों का दोहन न मानकर व्‍यक्ति को प्रकृति के साथ अनिवार्य रूप से जुड़ना होगा और इसका अनुसरण करना होगा।

शांति और समृद्धि की दिशा में आपकी इस यात्रा में भारत की सरकार और लोग आपके साथ हैं।

उन्‍होंने कहा कि पिछले तीन से साढ़े तीन वर्षों के दौरान केंद्र सरकार ने सामाजिक लोकतंत्र की उस दृष्टि को पूरा करने के लिए काम किया है।

प्रधानमंत्री ने इस्राइल द्वारा की गई शानदार तकनीकी प्रगति और उसकी लंबी बहादुरी एवं शहादत की परंपरा का उल्लेख किया।

प्रधानमंत्री अरुणाचल प्रदेश में पुनर्विकसित तेजु हवाई अड्डे का उद्घाटन करेंगे।

हम सैन्य-से-सैन्य सहयोग के एक गुणात्मक उच्च स्तर की ओर काम करेंगे

In [None]:
indic_indic_ckpt_dir = "ai4bharat/indictrans2-indic-indic-dist-320M"  # ai4bharat/indictrans2-indic-indic-dist-320M
indic_indic_tokenizer, indic_indic_model = initialize_model_and_tokenizer(indic_indic_ckpt_dir, "indic-indic", quantization)

ip = IndicProcessor(inference=True)

hi_sents = random_text_HI_for_MR

src_lang, tgt_lang = "hin_Deva","mar_Deva"
hi_to_mr = batch_translate(hi_sents, src_lang, tgt_lang, indic_indic_model, indic_indic_tokenizer, ip)

In [None]:
for i in hi_to_mr:
    print(i)

18. हे आयुष्मान भारत अंतर्गत प्रस्तावित राष्ट्रीय आरोग्य संरक्षण मोहिमेशी जोडले जाईल.
भारत आता गोड क्रांतीकडे वाटचाल करत आहे.
यावेळी भारतीय पत्रकार परिषदेची सुवर्ण जयंतीही साजरी केली जात आहे.
पण जेव्हा जेव्हा मी 'मन की बात' च्या प्रभावाकडे पाहतो, तेव्हा माझा विश्वास दृढ होतो की 'मन की बात' या देशाच्या जनतेशी शंभर टक्के अखंड नातेसंबंधांनी जोडलेली आहे.
पंतप्रधान म्हणाले की, केवळ निसर्गाच्या संसाधनांचा गैरवापर करण्याऐवजी एखाद्याने निसर्गाशी अपरिहार्यपणे जोडले पाहिजे आणि त्याचे अनुसरण केले पाहिजे.
शांतता आणि समृद्धीसाठीच्या तुमच्या या प्रवासात भारत सरकार आणि लोक तुमच्याबरोबर आहेत.
ते म्हणाले की, गेल्या साडेतीन वर्षांत केंद्र सरकारने सामाजिक लोकशाहीचे ते स्वप्न पूर्ण करण्यासाठी काम केले आहे.
इस्रायलने केलेल्या उत्कृष्ट तांत्रिक प्रगतीचा आणि त्याच्या प्रदीर्घ शौर्य आणि शहाणपणाच्या परंपरेचा पंतप्रधानांनी उल्लेख केला.
पंतप्रधान अरुणाचल प्रदेशातील पुनर्विकसित तेजू विमानतळाचे उद्घाटन करतील.
आम्ही लष्करी-ते-लष्करी सहकार्याच्या गुणात्मक उच्च स्तरावर काम करू.
वृंदावन चंद्रोदय मंदिरात अक्षय पात्रा फ

In [None]:
with open('random_text_HI_for_MR.txt', 'w', encoding='utf-8') as file:
    for i in random_text_HI_for_MR:
        file.writelines(i)

with open('Hi_to_Mr.txt', 'w', encoding='utf-8') as file:
    for i in hi_to_mr:
        file.writelines(i)

## Part 2

In [2]:
! pip install rouge



In [3]:
import nltk
from nltk.translate.bleu_score import corpus_bleu
from rouge import Rouge

In [4]:
def bleu_score(ground_truth , output):
    b_score = 0
    b_score = corpus_bleu([[ref] for ref in ground_truth], output)
    return b_score
   
def rouge_score(ground_truth , output):
    rouge = Rouge()
    scores = rouge.get_scores(ground_truth,output,avg=True)
    return scores

### 1. English to Hindi

In [5]:
with open("English_to_Hindi/En_to_Hi.txt","r",encoding="utf-8") as file:
    En_to_Hi = file.readlines()

with open("English_to_Hindi/En_to_Hi_Original.txt","r",encoding="utf-8") as file:
    En_to_Hi_Original = file.readlines()

In [6]:
print("Bleu Score : ",bleu_score(En_to_Hi_Original,En_to_Hi))

Bleu Score :  0.7066665712972036


In [7]:
rougeScore = rouge_score(En_to_Hi_Original,En_to_Hi)

for i,j in rougeScore.items():
    print(i , " : " , j)               

rouge-1  :  {'r': 0.6334738647139899, 'p': 0.6309396061149714, 'f': 0.6288335453247389}
rouge-2  :  {'r': 0.40193678215286766, 'p': 0.4001237680798042, 'f': 0.39880689659490826}
rouge-l  :  {'r': 0.5963587954788969, 'p': 0.5934031989040611, 'f': 0.5917419199684094}


### 2. Hindi to English

In [8]:
with open("Hindi_to_English/Hi_to_En.txt","r",encoding="utf-8") as file:
    Hi_to_En = file.readlines()

with open("Hindi_to_English/Hi_to_En_Original.txt","r",encoding="utf-8") as file:
    Hi_to_En_Original = file.readlines()

In [9]:
print("Bleu Score : ",bleu_score(Hi_to_En_Original,Hi_to_En))

Bleu Score :  0.4479995439238356


In [10]:
rougeScore = rouge_score(Hi_to_En_Original,Hi_to_En)

for i,j in rougeScore.items():
    print(i , " : " , j)

rouge-1  :  {'r': 0.37192230117286434, 'p': 0.3746205928655386, 'f': 0.3674154342312152}
rouge-2  :  {'r': 0.18995708385720272, 'p': 0.19326541320016094, 'f': 0.19041753461205355}
rouge-l  :  {'r': 0.352345940654747, 'p': 0.3550702411316087, 'f': 0.34813489840498846}


### 3. Hindi to Marathi

In [11]:
with open("Hindi_to_Marathi/Hi_to_Mr.txt","r",encoding="utf-8") as file:
    Hi_to_Mr = file.readlines()

with open("Hindi_to_Marathi/Hi_to_Mr_Original.txt","r",encoding="utf-8") as file:
    Hi_to_Mr_Original = file.readlines()

In [12]:
print("Bleu Score : ",bleu_score(Hi_to_Mr_Original,Hi_to_Mr))

Bleu Score :  0.604148489191587


In [13]:
rougeScore = rouge_score(Hi_to_Mr_Original,Hi_to_Mr)

for i,j in rougeScore.items():
    print(i , " : " , j)

rouge-1  :  {'r': 0.4539714757017372, 'p': 0.4538173721847189, 'f': 0.45031956962538044}
rouge-2  :  {'r': 0.2088336782352174, 'p': 0.20935763703562818, 'f': 0.20739598353402164}
rouge-l  :  {'r': 0.4281218711429381, 'p': 0.42828062411443457, 'f': 0.42482330944493624}


### 4. Marathi to Hindi

In [14]:
with open("Marathi_to_Hindi/Mr_to_Hi.txt","r",encoding="utf-8") as file:
    Mr_to_Hi = file.readlines()

with open("Marathi_to_Hindi/Mr_to_Hi_Original.txt","r",encoding="utf-8") as file:
    Mr_to_Hi_Original = file.readlines()

In [15]:
print("Bleu Score : ",bleu_score(Mr_to_Hi_Original,Mr_to_Hi))

Bleu Score :  0.6182068355709924


In [16]:
rougeScore = rouge_score(Mr_to_Hi_Original,Mr_to_Hi)

for i,j in rougeScore.items():
    print(i , " : " , j)

rouge-1  :  {'r': 0.5398530377948986, 'p': 0.5308555708190866, 'f': 0.5307159539999723}
rouge-2  :  {'r': 0.2943369385786013, 'p': 0.2893510128190569, 'f': 0.2891481651027939}
rouge-l  :  {'r': 0.5018032389295699, 'p': 0.4927852802546739, 'f': 0.4930793403840655}
