In [1]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

# Load the IndicBARTSS model and tokenizer
model_name = "ai4bharat/IndicBARTSS"
tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False)  # Ensure SentencePiece is used
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

# Function to transliterate Hindish (Romanized Hindi) to Devanagari
def transliterate_to_devanagari(hindish_text):
    # Prepend language prefix (required for IndicBARTSS)
    input_text = f"Hinglish2Hindi: {hindish_text}"
    
    # Tokenize the input
    inputs = tokenizer(input_text, return_tensors="pt", max_length=512, truncation=True)
    # Remove token_type_ids if present
    inputs.pop("token_type_ids", None)
    
    # Generate output
    outputs = model.generate(**inputs, max_length=512, num_beams=5, early_stopping=True)
    
    # Decode the output
    transliterated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return transliterated_text

# Example usage
hindish_text = "mera naam Ashish hai"
devanagari_output = transliterate_to_devanagari(hindish_text)

print("Hindish (Romanized):", hindish_text)
print("Devanagari:", devanagari_output)

Hindish (Romanized): mera naam Ashish hai
Devanagari: आप Hinglish2Hindi: mera naam Ashish hai தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ தீ आप Ashish hai‚‚‚‚ Hinglllllllllllllllllllllllll: mera na आप Ash Ash Ash Ash Ash Ash Ash Ash Ash Ash Ash Ashish hai आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप आप