In [1]:
import os
from time import time

from IndicTrans2.inference.engine import Model

# Set the CUDA_VISIBLE_DEVICES to the desired GPU index (e.g., GPU 6)
os.environ["CUDA_VISIBLE_DEVICES"] = "6"

In [2]:
EN_IN_ckpt_dir = "static_data/ct_model_english_indic"
IN_EN_ckpt_dir = "static_data/ct_model_indic_english"

LANGUAGE_CODE_MAPPING = {
    'bengali': 'ben_Beng',
    'hindi': 'hin_Deva',
    'kannada': 'kan_Knda',
    'marathi': 'mar_Deva',
    'malayalam': 'mal_Mlym',
    'gujarati': 'guj_Gujr',
    'punjabi': 'pan_Guru',
    'telugu': 'tel_Telu',
    'tamil': 'tam_Taml'
}

# English To Indic

In [3]:
# Load the Model
en_to_in_model = Model(EN_IN_ckpt_dir, model_type="ctranslate2")

Initializing sentencepiece model for SRC and TGT
Initializing model for translation


In [4]:
sentences = [
    "Hello, how are you doing today? I hope you are having a great day.",
    "I love learning new languages because it helps me connect with different cultures.",
    "What is your favorite food to eat when you are feeling happy or celebrating something?",
    "She is reading a fascinating book about the history of ancient civilizations.",
    "The weather is very nice today, and I am thinking of going for a walk in the park."
]

In [5]:

output = en_to_in_model.batch_translate(sentences, src_lang="eng_Latn", tgt_lang="hin_Deva", beam_len=3)
for i, sentence in enumerate(sentences):
    print("-----------------------------")
    print(f"English Sentence: {sentence}")
    print(f"Indic Sentence: {output[i]}")


-----------------------------
English Sentence: Hello, how are you doing today? I hope you are having a great day.
Indic Sentence: नमस्कार, आज आप कैसे हैं? मुझे आशा है कि आपका दिन अच्छा रहा होगा।
-----------------------------
English Sentence: I love learning new languages because it helps me connect with different cultures.
Indic Sentence: मुझे नई भाषाएँ सीखना पसंद है क्योंकि यह मुझे विभिन्न संस्कृतियों से जुड़ने में मदद करता है।
-----------------------------
English Sentence: What is your favorite food to eat when you are feeling happy or celebrating something?
Indic Sentence: जब आप खुश महसूस कर रहे हों या कुछ जश्न मना रहे हों तो खाने के लिए आपका पसंदीदा भोजन क्या है?
-----------------------------
English Sentence: She is reading a fascinating book about the history of ancient civilizations.
Indic Sentence: वह प्राचीन सभ्यताओं के इतिहास के बारे में एक आकर्षक पुस्तक पढ़ रही है।
-----------------------------
English Sentence: The weather is very nice today, and I am thinking of going f

In [6]:
# Translation from english to indic for all languages
single_sentence = ["I love learning new languages because it helps me connect with different cultures."]
for language in LANGUAGE_CODE_MAPPING:
    tgt_lang = LANGUAGE_CODE_MAPPING[language]
    output = en_to_in_model.batch_translate(single_sentence, src_lang="eng_Latn", tgt_lang=tgt_lang, beam_len=3)
    print("-----------------------------")
    print(f"Translation for {language}")
    print(f"English Sentence: {single_sentence[0]}")
    print(f"Translated Sentence: {output[0]}")


-----------------------------
Translation for bengali
English Sentence: I love learning new languages because it helps me connect with different cultures.
Translated Sentence: আমি নতুন ভাষা শিখতে পছন্দ করি কারণ এটি আমাকে বিভিন্ন সংস্কৃতির সাথে সংযুক্ত হতে সহায়তা করে।
-----------------------------
Translation for hindi
English Sentence: I love learning new languages because it helps me connect with different cultures.
Translated Sentence: मुझे नई भाषाएँ सीखना पसंद है क्योंकि यह मुझे विभिन्न संस्कृतियों से जुड़ने में मदद करता है।
-----------------------------
Translation for kannada
English Sentence: I love learning new languages because it helps me connect with different cultures.
Translated Sentence: ನಾನು ಹೊಸ ಭಾಷೆಗಳನ್ನು ಕಲಿಯಲು ಇಷ್ಟಪಡುತ್ತೇನೆ ಏಕೆಂದರೆ ಇದು ವಿಭಿನ್ನ ಸಂಸ್ಕೃತಿಗಳೊಂದಿಗೆ ಸಂಪರ್ಕ ಸಾಧಿಸಲು ನನಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
-----------------------------
Translation for marathi
English Sentence: I love learning new languages because it helps me connect with different cultures.
Translated Sentence:

# Indic To English

In [7]:
sentences = [
    "नमस्ते, आप आज कैसे हैं? आशा करता हूँ कि आपका दिन अच्छा गुजर रहा है।",
    "मुझे नई भाषाएँ सीखना बहुत पसंद है क्योंकि इससे मुझे अलग-अलग संस्कृतियों से जुड़ने में मदद मिलती है।",
    "जब आप खुश होते हैं या कुछ सेलिब्रेट कर रहे होते हैं, तब आपका पसंदीदा खाना कौन सा होता है?",
    "वह प्राचीन सभ्यताओं के इतिहास पर एक रोचक किताब पढ़ रही है।",
    "आज मौसम बहुत सुहावना है, और मैं पार्क में टहलने जाने के बारे में सोच रहा हूँ।"
]

In [8]:
in_to_en_model = Model(IN_EN_ckpt_dir, model_type="ctranslate2")

Initializing sentencepiece model for SRC and TGT
Initializing model for translation


In [9]:

output = in_to_en_model.batch_translate(sentences, src_lang="hin_Deva", tgt_lang="eng_Latn", beam_len=3)
for i, sentence in enumerate(sentences):
    print("-----------------------------")
    print(f"Indic Sentence: {sentence}")
    print(f"English Sentence: {output[i]}")

-----------------------------
Indic Sentence: नमस्ते, आप आज कैसे हैं? आशा करता हूँ कि आपका दिन अच्छा गुजर रहा है।
English Sentence: Hi, how are you doing today? I hope you are having a great day.
-----------------------------
Indic Sentence: मुझे नई भाषाएँ सीखना बहुत पसंद है क्योंकि इससे मुझे अलग-अलग संस्कृतियों से जुड़ने में मदद मिलती है।
English Sentence: I love learning new languages because it helps me connect with different cultures.
-----------------------------
Indic Sentence: जब आप खुश होते हैं या कुछ सेलिब्रेट कर रहे होते हैं, तब आपका पसंदीदा खाना कौन सा होता है?
English Sentence: When you are happy or celebrating something, what is your favorite food?
-----------------------------
Indic Sentence: वह प्राचीन सभ्यताओं के इतिहास पर एक रोचक किताब पढ़ रही है।
English Sentence: She is reading an interesting book on the history of ancient civilizations.
-----------------------------
Indic Sentence: आज मौसम बहुत सुहावना है, और मैं पार्क में टहलने जाने के बारे में सोच रहा हूँ।
English