# With Ollama

In [None]:
%pip install transformers accelerate torch
%pip install ollama


## Define parameters

In [None]:
import pandas as pd
from tqdm import tqdm

dataset_path = "dataset/dataset.csv"
df = pd.read_csv(dataset_path) #creation of dataframe
output_path = "dataset/output.csv"
col_name = "Sentence"
models = [ "mistral"]
prompt_templates={
    "base":        "Traduci la seguente frase dall'italiano antico all'italiano moderno:\n\n{sentence}\n\nTraduzione:",
    "piu_dettagliato": "Il seguente testo è scritto in italiano arcaico del XIII secolo, proveniente dalla regione toscana. Riscrivilo in italiano moderno mantenendo il significato originale, la chiarezza e la coerenza sintattica.\n\n {sentence}\n\n",
    "role-based":   "You are an expert linguist specializing in the evolution of Italian language. Translate this 13th century Tuscan text to contemporary Italian: \n\n{sentence}\n\n:",
    "few_shot": (
    "Qui ci sono alcuni esempi di frasi in italiano arcaico del XIII secolo tradotte in italiano moderno:\n\n"
    "«quella guerra ben fatta l' opera perché etc.» → «quella guerra fu condotta bene, e l'opera fu compiuta come previsto.»\n"
    "«crudele, e di tutte le colpe pigli vendetta» → «crudele, e si vendica di tutte le colpe.»\n"
    "«Non d' altra forza d' animo fue ornato Ponzio Aufidiano» → «Ponzio Aufidiano non era dotato di altro vigore d’animo.»\n\n"
    "Ora traduci la seguente frase in italiano moderno mantenendo il significato originale:\n\n"
    "{sentence}\n\nTraduzione:"
)
}


## Translate the sentences

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline, AutoModelForSeq2SeqLM
import torch
from ollama import Client

client = Client(host='http://localhost:11434')#client to local ollama

for model_name in models:#iterate through models
    for prompt_name, prompt_template in prompt_templates.items():#iterate through prompt templates
        print(f"\n🔁 Traduzione con modello: {model_name} | prompt: {prompt_name}")
        translations = []#list to store translations
        for sentence in tqdm(df[col_name]):#iterate through sentences
            try:
                prompt = prompt_template.format(sentence=sentence)#give the prompt

                response = client.chat(
                    model=model_name,
                    messages=[{"role": "user", "content": prompt}]
                )#ollama api call

                translation = response['message']['content'].strip()#extract the translation


            except Exception as e:
                translation = f"[ERRORE]: {e}"
            translations.append(translation)#append the translation to the list

        df["translation"] = translations# add the translations to the dataframe

        output_file = f"traduzioni_{model_name}_{prompt_name}.csv"# create the output file name

        df.to_csv(output_file, index=False)# save the dataframe to a csv file
        print(f"✅ Traduzioni salvate in '{output_file}'")

# With Hugginface

In [None]:
%pip install transformers accelerate torch bitsandbytes
import pandas as pd
from tqdm import tqdm

# === PERCORSI ===
dataset_path = "dataset/dataset.csv"
output_path = "dataset/output.csv"

# === CARICAMENTO DATASET ===
df = pd.read_csv(dataset_path) # creation of dataframe

# === CONFIGURAZIONE ===
col_name = "Sentence"
models = ["tiiuae/falcon-rw-1b"]


# === TEMPLATE DI PROMPT ===
prompt_templates = {
    "base":        "Traduci la seguente frase dall'italiano antico all'italiano moderno:\n\n{sentence}\n\nTraduzione:",
    "piu_dettagliato": "Il seguente testo è scritto in italiano arcaico del XIII secolo, proveniente dalla regione toscana. Riscrivilo in italiano moderno mantenendo il significato originale, la chiarezza e la coerenza sintattica.\n\n{sentence}\n\nTraduzione:",
    "role-based":   "You are an expert linguist specializing in the evolution of Italian language. Translate this 13th century Tuscan text to contemporary Italian:\n\n{sentence}\n\nTranslation:",
    "few_shot": (
        "Qui ci sono alcuni esempi di frasi in italiano arcaico del XIII secolo tradotte in italiano moderno:\n\n"
        "«quella guerra ben fatta l' opera perché etc.» → «quella guerra fu condotta bene, e l'opera fu compiuta come previsto.»\n"
        "«crudele, e di tutte le colpe pigli vendetta» → «crudele, e si vendica di tutte le colpe.»\n"
        "«Non d' altra forza d' animo fue ornato Ponzio Aufidiano» → «Ponzio Aufidiano non era dotato di altro vigore d’animo.»\n\n"
        "Ora traduci la seguente frase in italiano moderno mantenendo il significato originale:\n\n"
        "{sentence}\n\nTraduzione:"
    )
}

# === LOOP SUI MODELLI E PROMPT ===
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import torch

for model_name in models:  # iterate through models

    print(f"\n📦 Caricamento del modello Hugging Face: {model_name}")
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        device_map="auto",              # usa GPU se disponibile
        torch_dtype=torch.float16,      # riduce consumo memoria
    )

    # === PIPELINE DI GENERAZIONE ===
    generate = pipeline("text-generation", model=model, tokenizer=tokenizer)

    for prompt_name, prompt_template in prompt_templates.items():  # iterate through prompt templates
        print(f"\n🔁 Traduzione con modello: {model_name} | prompt: {prompt_name}")
        translations = []  # list to store translations

        for sentence in tqdm(df[col_name]):  # iterate through sentences
            try:
                prompt = prompt_template.format(sentence=sentence)  # give the prompt

                response = generate(
                    prompt,
                    max_new_tokens=150,
                    do_sample=False,
                    temperature=0.7
                )  # Hugging Face generation call

                translation = response[0]['generated_text'].split(prompt)[-1].strip()  # extract only the new part

            except Exception as e:
                translation = f"[ERRORE]: {e}"
            translations.append(translation)  # append the translation to the list

        df["translation"] = translations  # add the translations to the dataframe

        # Crea nome file dinamico (usa solo il nome corto del modello)
        short_model_name = model_name.split("/")[-1]
        output_file = f"traduzioni_{short_model_name}_{prompt_name}.csv"  # create the output file name

        df.to_csv(output_file, index=False)  # save the dataframe to a csv file
        print(f"✅ Traduzioni salvate in '{output_file}'")


Note: you may need to restart the kernel to use updated packages.

📦 Caricamento del modello Hugging Face: tiiuae/falcon-rw-1b


pytorch_model.bin:   1%|          | 21.0M/2.62G [00:00<?, ?B/s]