In [1]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

# 1. Elegir un modelo pequeño y cargar el tokenizer y el modelo
# Usaremos distilgpt2, que es una versión más pequeña y rápida de GPT-2
model_name = "distilgpt2"

print(f"Cargando tokenizer y modelo '{model_name}'...")
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# Opcional: Mover el modelo a la GPU si está disponible
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)
print(f"Usando dispositivo: {device}")

# 2. Definir la entrada (el "prompt")
prompt = "El clima hoy está"
print(f"\nPrompt de entrada: '{prompt}'")

# 3. Tokenizar la entrada
# encode() convierte el texto en una lista de IDs (tokens)
# return_tensors="pt" asegura que el output sea un tensor de PyTorch
input_ids = tokenizer.encode(prompt, return_tensors="pt").to(device)

# 4. Generar texto
# generate() es el método mágico que usa el modelo para generar tokens
# max_length: cuántos tokens máximo queremos en la salida (incluyendo el prompt)
# num_return_sequences: cuántas secuencias diferentes queremos generar
# no_repeat_ngram_size: evita que se repitan secuencias de N tokens para mayor variedad
print("Generando texto...")
output_ids = model.generate(
    input_ids,
    max_length=50, # Generar hasta 50 tokens
    num_return_sequences=1, # Generar 1 secuencia
    no_repeat_ngram_size=2, # Evitar repetir bigramas
    pad_token_id=tokenizer.eos_token_id # Importante para modelos sin pad_token
)

# 5. Decodificar la salida
# decode() convierte los IDs (tokens) de vuelta a texto legible
generated_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)

# 6. Imprimir el resultado
print("\nTexto generado:")
print(generated_text)

print("\n¡Ejemplo completado!")

  from .autonotebook import tqdm as notebook_tqdm


Cargando tokenizer y modelo 'distilgpt2'...


To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development
Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Usando dispositivo: cpu

Prompt de entrada: 'El clima hoy está'
Generando texto...

Texto generado:
El clima hoy está la ciudad de la l'unción de los cesquías de las cemposadas de líos de cencias.

The first time I saw a

¡Ejemplo completado!


In [1]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

# 1. Elegir un modelo pequeño y cargar el tokenizer y el modelo
# Usaremos distilgpt2, que es una versión más pequeña y rápida de GPT-2
model_name = "distilgpt2"

print(f"Cargando tokenizer y modelo '{model_name}'...")
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# Opcional: Mover el modelo a la GPU si está disponible
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)
print(f"Usando dispositivo: {device}")

# 2. Definir la entrada (el "prompt")
prompt = "El clima hoy está seco y humedo"
print(f"\nPrompt de entrada: '{prompt}'")

# 3. Tokenizar la entrada
# encode() convierte el texto en una lista de IDs (tokens)
# return_tensors="pt" asegura que el output sea un tensor de PyTorch
input_ids = tokenizer.encode(prompt, return_tensors="pt").to(device)

# 4. Generar texto
# generate() es el método mágico que usa el modelo para generar tokens
# max_length: cuántos tokens máximo queremos en la salida (incluyendo el prompt)
# num_return_sequences: cuántas secuencias diferentes queremos generar
# no_repeat_ngram_size: evita que se repitan secuencias de N tokens para mayor variedad
print("Generando texto...")
output_ids = model.generate(
    input_ids,
    max_length=80, # Generar hasta 50 tokens
    num_return_sequences=1, # Generar 1 secuencia
    no_repeat_ngram_size=2, # Evitar repetir bigramas
    pad_token_id=tokenizer.eos_token_id # Importante para modelos sin pad_token
)

# 5. Decodificar la salida
# decode() convierte los IDs (tokens) de vuelta a texto legible
generated_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)

# 6. Imprimir el resultado
print("\nTexto generado:")
print(generated_text)

print("\n¡Ejemplo completado!")

  from .autonotebook import tqdm as notebook_tqdm


Cargando tokenizer y modelo 'distilgpt2'...


The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Usando dispositivo: cpu

Prompt de entrada: 'El clima hoy está seco y humedo'
Generando texto...

Texto generado:
El clima hoy está seco y humedo.

The first time I saw the sun, I was in awe. I had never seen the moon before. It was a beautiful day. The sun was shining in the sky. And I knew that it was the first day of my life.

¡Ejemplo completado!
