# Generación de Texto con Modelos de Lenguaje

Este notebook explica paso a paso cómo generar texto con un modelo preentrenado utilizando la biblioteca `transformers` de Hugging Face.

## 1. Instalación y Configuración de Librerías

In [1]:
!pip install transformers torch




[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


## 2. Importación de Librerías Necesarias

In [2]:
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

  from .autonotebook import tqdm as notebook_tqdm


## 3. Carga del Modelo y Tokenizador

In [3]:
MODEL_NAME = "gpt2"

In [4]:
# Cargamos el tokenizador y el modelo.
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)

## 4. Configuración del Dispositivo

In [5]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

## 5. Función de Generación de Texto

In [6]:
def generate_text(prompt, max_length=50, temperature=1.0, top_k=50):
    """
    Genera texto utilizando un modelo de lenguaje.

    Args:
        prompt (str): Texto inicial que guía la generación.
        max_length (int): Longitud máxima del texto generado.
        temperature (float): Controla la aleatoriedad (valores bajos = texto más predecible).
        top_k (int): Limita el número de palabras candidatas en cada paso.

    Returns:
        str: Texto generado por el modelo.
    """
    # Tokenizamos el prompt.
    input_ids = tokenizer.encode(prompt, return_tensors="pt").to(device)

    # Generamos el texto.
    output = model.generate(
        input_ids,
        max_length=max_length,
        temperature=temperature,
        top_k=top_k,
        do_sample=True
    )

    # Decodificamos el texto generado.
    generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
    return generated_text

## 6. Ejemplo Práctico de Generación

In [7]:
prompt = "Había una vez en un mundo lleno de misterios"
generated_text = generate_text(prompt, max_length=100, temperature=0.7, top_k=50)

print("\n=== Texto Generado ===\n")
print(generated_text)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.



=== Texto Generado ===

Había una vez en un mundo lleno de misteriosa, si un á la fuerza.

La familia no según hizo están con lucha de la ménós y los más de la cuatro.

La mésophora para ha más quiel eston a las haciendas de la ménós y los más de las cuatro.

Méso
