In [1]:
from transformers import MT5ForConditionalGeneration, MT5Tokenizer
import torch
import tqdm as notebook_tqdm

# Use CPU (or change to cuda if you move to GPU)
device = torch.device("cpu")

# Load tokenizer and model from your saved directory
model_path = "../Trained_model_v2/"
tokenizer = MT5Tokenizer.from_pretrained(model_path)
model = MT5ForConditionalGeneration.from_pretrained(model_path).to(device)

# Translation function
def translate_nepali_to_english(texts):
    if isinstance(texts, str):
        texts = [texts]
    
    inputs = ["translate Nepali to English: " + t for t in texts]
    encoding = tokenizer(
        inputs,
        return_tensors="pt",
        padding=True,
        truncation=True,
        max_length=300
    ).to(device)
    
    with torch.no_grad():
        outputs = model.generate(
            input_ids=encoding["input_ids"],
            attention_mask=encoding["attention_mask"],
            max_length=300,
            num_beams=4
        )

    return tokenizer.batch_decode(outputs, skip_special_tokens=True)

# Example usage
nepali_sentences = [
    "рддрдкрд╛рдИрдВрдХреЛ рдирд╛рдо рдХреЗ рд╣реЛ?",
    "рдо рд╡рд┐рджреНрдпрд╛рд▓рдп рдЬрд╛рдиреНрдЫреБред",
    "рдК рдкреБрд╕реНрддрдХ рдкрдвреНрджреИрдЫред",
    "рдореМрд╕рдо рдЖрдЬ рд░рд╛рдореНрд░реИ рдЫред",
    "рд╣рд╛рдореА рдХрд╛рдардорд╛рдгреНрдбреМ рдЬрд╛рдБрджреИрдЫреМрдВред",
    "рддрдкрд╛рдИрдВрд▓рд╛рдИ рдХрдлреА рдордирдкрд░реНрдЫ?",
    "рдЖрдЬ рд╢реБрдХреНрд░рдмрд╛рд░ рд╣реЛред",
    "рдо рдиреЗрдкрд╛рд▓реА рднрд╛рд╖рд╛ рд╕рд┐рдХреНрджреИрдЫреБред",
    "рддрд┐рдореАрд▓рд╛рдИ рднреЗрдЯреЗрд░ рдЦреБрд╢реА рд▓рд╛рдЧреНрдпреЛред",
    "рдорд▓рд╛рдИ рднреЛрдХ рд▓рд╛рдЧреЗрдХреЛ рдЫред",
    "рдХреГрдкрдпрд╛ рдвреЛрдХрд╛ рдмрдиреНрдж рдЧрд░реНрдиреБрд╣реЛрд╕реНред",
    "рдпреЛ рдЦрд╛рдирд╛ рд╕реНрд╡рд╛рджрд┐рд▓реЛ рдЫред",
    "рд╣рд╛рдореАрд▓реЗ рдзреЗрд░реИ рдордЬрд╛ рдЧрд░реНрдпреМрдВред",
    "рдо рдлреБрдЯрдмрд▓ рдЦреЗрд▓реНрди рдорди рдкрд░рд╛рдЙрдБрдЫреБред",
    "рдкрд░реАрдХреНрд╖рд╛ рдХрд╣рд┐рд▓реЗ рд╕реБрд░реБ рд╣реБрдиреНрдЫ?",
    "рддрд┐рдореА рдХрддрд┐ рд╡рд░реНрд╖рдХреЛ рд╣реМ?",
    "рдпрд╣рд╛рдБ рдЗрдиреНрдЯрд░рдиреЗрдЯ рдЫ?",
    "рдо рднреЛрд▓реА рднреЗрдЯреНрди рд╕рдХреНрдЫреБред",
    "рдХреГрдкрдпрд╛ рдорд▓рд╛рдИ рдорджреНрджрдд рдЧрд░реНрдиреБрд╣реЛрд╕реНред",
    "рддрдкрд╛рдИрдВ рдХрд╣рд╛рдБ рдмрд╕реНрдиреБрд╣реБрдиреНрдЫ?"
]

translations = translate_nepali_to_english(nepali_sentences)

for src, tgt in zip(nepali_sentences, translations):
    print(f"ЁЯУЭ Nepali   : {src}")
    print(f"ЁЯМН English  : {tgt}")


  from .autonotebook import tqdm as notebook_tqdm
The tokenizer class you load from this checkpoint is not the same type as the class this function is called from. It may result in unexpected tokenization. 
The tokenizer class you load from this checkpoint is 'T5Tokenizer'. 
The class this function is called from is 'MT5Tokenizer'.


ЁЯУЭ Nepali   : рддрдкрд╛рдИрдВрдХреЛ рдирд╛рдо рдХреЗ рд╣реЛ?
ЁЯМН English  : What is your name?
ЁЯУЭ Nepali   : рдо рд╡рд┐рджреНрдпрд╛рд▓рдп рдЬрд╛рдиреНрдЫреБред
ЁЯМН English  : I go to school.
ЁЯУЭ Nepali   : рдК рдкреБрд╕реНрддрдХ рдкрдвреНрджреИрдЫред
ЁЯМН English  : He reads the book.
ЁЯУЭ Nepali   : рдореМрд╕рдо рдЖрдЬ рд░рд╛рдореНрд░реИ рдЫред
ЁЯМН English  : The weather is good today.
ЁЯУЭ Nepali   : рд╣рд╛рдореА рдХрд╛рдардорд╛рдгреНрдбреМ рдЬрд╛рдБрджреИрдЫреМрдВред
ЁЯМН English  : We are going to Mumbai.
ЁЯУЭ Nepali   : рддрдкрд╛рдИрдВрд▓рд╛рдИ рдХрдлреА рдордирдкрд░реНрдЫ?
ЁЯМН English  : Do you want to drink coffee?
ЁЯУЭ Nepali   : рдЖрдЬ рд╢реБрдХреНрд░рдмрд╛рд░ рд╣реЛред
ЁЯМН English  : Today is Friday.
ЁЯУЭ Nepali   : рдо рдиреЗрдкрд╛рд▓реА рднрд╛рд╖рд╛ рд╕рд┐рдХреНрджреИрдЫреБред
ЁЯМН English  : I learn Nepali language.
ЁЯУЭ Nepali   : рддрд┐рдореАрд▓рд╛рдИ рднреЗрдЯреЗрд░ рдЦреБрд╢реА рд▓рд╛рдЧреНрдпреЛред
ЁЯМН English  : You were happy with you.
ЁЯУЭ Nepali   : рдо