In [2]:
import random
import torch
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

model_name = "facebook/mbart-large-50-one-to-many-mmt"

model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name, src_lang="en_XX")

article_en = "Be the pilot of your stories and fly as high as you can"

inputs = tokenizer(article_en, return_tensors="pt")

# Definir valores de temperatura e top_k para experimentação
temperature_values = [1.0, 2.5, 3.5]  # Valores de temperatura
top_k_values = [20, 40, 80]          # Valores de top-k

print("### Geração de texto com ajustes de temperatura e top-k sampling ###\n")

# Loop para variar os valores de temperatura e top-k
for temp in temperature_values:
    for top_k in top_k_values:
        # Gerar o texto traduzido com parâmetros ajustados
        generated_ids = model.generate(
            inputs['input_ids'],
            max_length=200,
            do_sample=True,       # Ativar a amostragem para top-k sampling
            temperature=temp,      # Controlar a aleatoriedade
            top_k=top_k,           # Limitar as palavras candidatas ao top-k
            forced_bos_token_id=tokenizer.lang_code_to_id["pt_XX"]  # Código para português
        )

        # Decodificar e exibir o texto gerado
        generated_text = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
        print(f"Temperature: {temp}, Top-k: {top_k}\nGenerated Text: {generated_text}\n")




### Geração de texto com ajustes de temperatura e top-k sampling ###

Temperature: 1.0, Top-k: 20
Generated Text: Sejam os pilotos das vossas histórias e voem o mais alto possível

Temperature: 1.0, Top-k: 40
Generated Text: Sejam os pilotos das vossas histórias e voam o mais alto possível

Temperature: 1.0, Top-k: 80
Generated Text: Sejam os pilotos das vossas histórias e voem o mais alto possível

Temperature: 2.5, Top-k: 20
Generated Text: Sejam o piloto das vossas histórias

Temperature: 2.5, Top-k: 40
Generated Text: Sês o piloto das suas histórias e voa quanto mais alto possível

Temperature: 2.5, Top-k: 80
Generated Text: Sejam o piloto das vossas histórias

Temperature: 3.5, Top-k: 20
Generated Text: Serem o piloto das vossas histórias e voarem tanto quanto puderam

Temperature: 3.5, Top-k: 40
Generated Text: Sejam o piloto da vossa história e voassem mais alto que puderem

Temperature: 3.5, Top-k: 80
Generated Text: Sejam quem vos arrebate as histórias e voam



In [None]:
import random
import torch
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

model_name = "facebook/mbart-large-50-one-to-many-mmt"

model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name, src_lang="en_XX")

article_en = "Be the pilot of your stories and fly as high as you can"

inputs = tokenizer(article_en, return_tensors="pt")

seeds = [33, 143, 456]
generated_texts = []

# Para cada seed, definir a seed e gerar o texto traduzido
for seed in seeds:
    # Definir a seed
    random.seed(seed)
    torch.manual_seed(seed)

    # Traduzir do inglês para português com parâmetros ajustados
    generated_tokens = model.generate(
        **inputs,
        forced_bos_token_id=tokenizer.lang_code_to_id["pt_XX"],  # Código para português
        do_sample=True,             # Habilita amostragem para variabilidade
        temperature=1.0,            # Ajuste de temperatura para controlar a criatividade
        max_length=50               # Limite máximo de tokens na saída
    )

    # Decodificar a tradução e adicionar aos resultados
    generated_text = tokenizer.decode(generated_tokens[0], skip_special_tokens=True)
    generated_texts.append((seed, generated_text))

# Exibir os resultados para cada seed
for seed, text in generated_texts:
    print(f"Seed {seed}: {text}")



Seed 33: Sejam os pilotos das vossas histórias e voem o mais alto possível
Seed 143: Sejam os pilotos das vossas histórias e voem o mais alto possível
Seed 456: Sejam os pilotos das vossas histórias e voem o mais alto possível
