In [1]:
from peft import PeftModel
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import bitsandbytes as bnb
from .autonotebook import tqdm as notebook_tqdm

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
base_model_path = "mbart-model"
peft_model_path = "peft-model"

In [3]:

tokenizer = AutoTokenizer.from_pretrained(base_model_path, src_lang="en_XX", tgt_lang="hi_IN")
base_model = AutoModelForSeq2SeqLM.from_pretrained(base_model_path)
peft_model = PeftModel.from_pretrained(base_model, peft_model_path)

In [4]:
test = [
  {
    "english": "Hello.",
    "hindi": "नमस्ते।"
  },
  {
    "english": "How are you?",
    "hindi": "आप कैसे हैं?"
  },
  {
    "english": "I am fine.",
    "hindi": "मैं ठीक हूँ।"
  },
  {
    "english": "What is your name?",
    "hindi": "आपका नाम क्या है?"
  },
  {
    "english": "My name is John.",
    "hindi": "मेरा नाम जॉन है।"
  },
  {
    "english": "Where are you going?",
    "hindi": "आप कहाँ जा रहे हैं?"
  },
  {
    "english": "I am going home.",
    "hindi": "मैं घर जा रहा हूँ।"
  },
  {
    "english": "Thank you.",
    "hindi": "धन्यवाद।"
  },
  {
    "english": "Good morning.",
    "hindi": "शुभ प्रभात।"
  },
  {
    "english": "Good night.",
    "hindi": "शुभ रात्रि।"
  },
  {
    "english": "Please help me.",
    "hindi": "कृपया मेरी मदद करें।"
  },
  {
    "english": "What time is it?",
    "hindi": "अभी क्या समय हुआ है?"
  },
  {
    "english": "I don't understand.",
    "hindi": "मुझे समझ में नहीं आया।"
  },
  {
    "english": "Can you speak English?",
    "hindi": "क्या आप अंग्रेज़ी बोल सकते हैं?"
  }
]

In [5]:
for d in test:
    src =  d['english'].strip().lower()
    tgt = d['hindi']
    src_tokens = tokenizer(src, return_tensors="pt", padding=True, truncation=True).to(peft_model.device)
    translated_tokens = peft_model.generate(**src_tokens)
    tgt_trans = tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
    print(f"Source: {src}")
    print(f"Target: {tgt}")
    print(f"Translation: {tgt_trans}")
    print()

Source: hello.
Target: नमस्ते।
Translation: आओ।

Source: how are you?
Target: आप कैसे हैं?
Translation: आप कैसा हैं?

Source: i am fine.
Target: मैं ठीक हूँ।
Translation: मैं ठीक हूँ।

Source: what is your name?
Target: आपका नाम क्या है?
Translation: आपका नाम क्या है?

Source: my name is john.
Target: मेरा नाम जॉन है।
Translation: मेरी नाम हरी है।

Source: where are you going?
Target: आप कहाँ जा रहे हैं?
Translation: कहाँ जा रहे हो?

Source: i am going home.
Target: मैं घर जा रहा हूँ।
Translation: मैं घर जा रहा हूँ।

Source: thank you.
Target: धन्यवाद।
Translation: धन्यवाद।

Source: good morning.
Target: शुभ प्रभात।
Translation: सुबह अच्छी है।

Source: good night.
Target: शुभ रात्रि।
Translation: अच्छा रात।

Source: please help me.
Target: कृपया मेरी मदद करें।
Translation: कृपया मदद करें।

Source: what time is it?
Target: अभी क्या समय हुआ है?
Translation: क्या समय है?

Source: i don't understand.
Target: मुझे समझ में नहीं आया।
Translation: मैं समझ नहीं पाता।

Source: can you speak engl

In [6]:
del tokenizer
del base_model
del peft_model