In [1]:
import torch
from torch.utils.data import DataLoader
from tokenizers import Tokenizer
from dataset import causal_mask
from model import build_transformer
from config import get_config, get_weights_file_path

def greedy_decode(model, source, source_mask, tokenizer_tgt, max_len, device):
    sos_idx = tokenizer_tgt.token_to_id('[SOS]')
    eos_idx = tokenizer_tgt.token_to_id('[EOS]')

    encoder_output = model.encode(source, source_mask)
    decoder_input = torch.empty(1, 1).fill_(sos_idx).type_as(source).to(device)

    while True:
        if decoder_input.size(1) == max_len:
            break

        decoder_mask = causal_mask(decoder_input.size(1)).type_as(source_mask).to(device)
        out = model.decode(encoder_output, source_mask, decoder_input, decoder_mask)
        prob = model.project(out[:, -1])
        _, next_word = torch.max(prob, dim=1)

        decoder_input = torch.cat(
            [decoder_input, torch.empty(1, 1).fill_(next_word.item()).type_as(source).to(device)],
            dim=1
        )

        if next_word.item() == eos_idx:
            break

    return decoder_input.squeeze(0)

def load_tokenizer(path):
    return Tokenizer.from_file(path)

def translate_sentence(model, sentence, tokenizer_src, tokenizer_tgt, config, device):
    model.eval()

    tokens = tokenizer_src.encode(sentence).ids
    tokens = [tokenizer_src.token_to_id('[SOS]')] + tokens + [tokenizer_src.token_to_id('[EOS]')]

    if len(tokens) < config['seq_len']:
        tokens += [tokenizer_src.token_to_id('[PAD]')] * (config['seq_len'] - len(tokens))
    else:
        tokens = tokens[:config['seq_len']]

    encoder_input = torch.tensor(tokens, dtype=torch.long).unsqueeze(0).to(device)
    encoder_mask = (encoder_input != tokenizer_src.token_to_id('[PAD]')).unsqueeze(1).unsqueeze(2)

    output_tokens = greedy_decode(model, encoder_input, encoder_mask, tokenizer_tgt, config['seq_len'], device)
    output_text = tokenizer_tgt.decode(output_tokens.tolist(), skip_special_tokens=True)
    return output_text


In [2]:
config = get_config()
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Load Tokenizers
tokenizer_src = load_tokenizer(config['tokenizer_file'].format(config['lang_src']))
tokenizer_tgt = load_tokenizer(config['tokenizer_file'].format(config['lang_tgt']))

# Load model
model = build_transformer(
    tokenizer_src.get_vocab_size(),
    tokenizer_tgt.get_vocab_size(),
    config['seq_len'],
    config['seq_len'],
    config['d_model']
).to(device)

model_path = get_weights_file_path(config, config['preload'])  # e.g., "weights/04.pth"
model_path = r"weights\\tmodel_900.pt"
state = torch.load(model_path, map_location=device)
model.load_state_dict(state['model_state_dict'])

print("🔥 Model and tokenizers loaded. Ready for inference.\n")

while True:
    english_input = input("Enter English sentence (or type 'exit' to quit): ").strip()
    if english_input.lower() == "exit":
        break
    hindi_output = translate_sentence(model, english_input, tokenizer_src, tokenizer_tgt, config, device)
    print(f"🌐 Hindi Translation: {hindi_output}\n")


  state = torch.load(model_path, map_location=device)


🔥 Model and tokenizers loaded. Ready for inference.

🌐 Hindi Translation: को को को को को को लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ दें

🌐 Hindi Translation: को को को को को को लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ दें

🌐 Hindi Translation: को को को को को को लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ दें

🌐 Hindi Translation: को को को को को को लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ लाभ दें

