In [14]:
import json
import time
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

MODEL_NAME = "Qwen/Qwen2-0.5B-Instruct"
USER_LANGUAGE = "Russian"

tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, torch_dtype=torch.float16)

post = "The project is supervised by Admissions Office, who are able to provide you with further information and materials to deliver a presentation at your school."
ground_truth = "Проект курируется Приемной комиссией, которая может предоставить вам дополнительную информацию и материалы для проведения презентации в вашей школе."
print(f"Translating '{post}'")
start_time = time.time()
messages = [
    {"role": "system", "content": f"You are a helpful assistant that translates texts in arbitrary languages to {USER_LANGUAGE}."},
    {"role": "user", "content": post}
]
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(prompt, return_tensors="pt")
generated_ids = model.generate(**inputs, max_new_tokens=512)
translation = tokenizer.batch_decode(generated_ids[:, inputs.input_ids.shape[1]:], skip_special_tokens=True)[0]
latency = time.time() - start_time

print(f"Translation latency: {latency}s")
print(f"Machine translation: '{translation}'")
print(f"Ground truth: '{ground_truth}'")

Translating 'The project is supervised by Admissions Office, who are able to provide you with further information and materials to deliver a presentation at your school.'
Translation latency: 10.47777009010315s
Machine translation: 'Теоретически, вы можете получить дополнительную информацию и материалы для презентации в школу садоводческого учреждения, под руководством которого вы сможете провести презентацию.'
Ground truth: 'Проект курируется Приемной комиссией, которая может предоставить вам дополнительную информацию и материалы для проведения презентации в вашей школе.'
