# Generate jokes

In [7]:
# cargo modelo de huggingface

import torch
from transformers import (AutoModelForCausalLM, StoppingCriteria, StoppingCriteriaList, AutoTokenizer)

## Modelo en español 

In [8]:
# cargo modelo with stop - base en español
model = AutoModelForCausalLM.from_pretrained(
    'kevmansilla/generate_jokes_with_stop')
tokenizer = AutoTokenizer.from_pretrained(
    'kevmansilla/generate_jokes_with_stop')

model.safetensors:  24%|##4       | 346M/1.42G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/119 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/2.65k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/840k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/498k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/2.19M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/771 [00:00<?, ?B/s]

In [12]:
def generate_humor_comment(prompt: str, max_length: int = 150, num_return_sequences: int = 1) -> str:
    '''
    Genera un comentario humorístico basado en un prompt usando el modelo GPT-2 entrenado.
    
    Args:
    - prompt (str): El texto o conjunto de palabras inicial para generar el comentario.
    - max_length (int): La longitud máxima del comentario generado.
    - num_return_sequences (int): El número de secuencias generadas. 
    
    Returns:
    - str: El comentario humorístico generado.
    '''
    model.eval()  # Poner el modelo en modo evaluación

    # Tokenizamos el prompt con padding y truncation en la fase de tokenización
    inputs = tokenizer(prompt, return_tensors="pt", padding=True,
                       truncation=True, max_length=max_length)

    # Generamos texto con el modelo entrenado
    with torch.no_grad():
        outputs = model.generate(
            input_ids=inputs['input_ids'],
            max_length=max_length,
            num_return_sequences=num_return_sequences,
            no_repeat_ngram_size=2,  # Evitar repetición de n-gramas
            top_k=50,  # Reducir el espacio de búsqueda
            top_p=0.95,  # Aplicar nucleus sampling
            temperature=0.7,  # Ajustar la creatividad de la generación
            do_sample=True  # Permitir sampling en vez de greedy decoding
        )

    # Decodificar el texto generado de nuevo a formato legible
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    return generated_text

In [13]:
# Ejemplo de uso
keywords = "profesor jaimito"
comentario_generado = generate_humor_comment(keywords, max_length=150)
print(comentario_generado)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


profesor jaimito, te cuento una historia de tu vida.
- ¿Cómo te llamas?
-¿ Jaimita? ¿Y cómo te fue en la escuela? 
Jaimitos, Jaime, si te soy sincero yo no sabía que fueras español. Te llamaba Jaimado, porque el único español que se acuerda es el del penalty.....
..... el penalti!...porque el que te habla es Jaimi!
-¡Jaime!, me acuerdo de Jaibo!... ¿El que me habla?... ¡el que ríe!. ¡El del bigamia! ¡Jaimi Jaume!......el del chulo!.....¡el de la cara de leche


In [14]:
def generate_humor_comment(keywords: list, max_length: int = 150, num_return_sequences: int = 1) -> str:
    '''
    Genera un comentario humorístico basado en una lista de keywords usando el modelo GPT-2 entrenado.
    
    Args:
    - keywords (list): Lista de palabras clave para generar el comentario.
    - max_length (int): La longitud máxima del comentario generado.
    - num_return_sequences (int): El número de secuencias generadas. 
    
    Returns:
    - str: El comentario humorístico generado.
    '''
    model.eval()  # Poner el modelo en modo evaluación

    # Unir las palabras clave en una cadena
    prompt = ' '.join(keywords)

    # Tokenizamos el prompt con padding y truncation en la fase de tokenización
    inputs = tokenizer(prompt, return_tensors="pt", padding=True,
                       truncation=True, max_length=max_length)

    # Generamos texto con el modelo entrenado
    with torch.no_grad():
        outputs = model.generate(
            input_ids=inputs['input_ids'],
            max_length=max_length,
            num_return_sequences=num_return_sequences,
            no_repeat_ngram_size=2,  # Evitar repetición de n-gramas
            top_k=50,  # Reducir el espacio de búsqueda
            top_p=0.95,  # Aplicar nucleus sampling
            temperature=0.7,  # Ajustar la creatividad de la generación
            do_sample=True  # Permitir sampling en vez de greedy decoding
        )

    # Decodificar el texto generado de nuevo a formato legible
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

    return generated_text

In [15]:
# Ejemplo de uso
keywords = ['jaimito', 'profesor']
comentario_generado = generate_humor_comment(keywords, max_length=150)
print(comentario_generado)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


jaimito profesor: 
- ¿Sabes que te he dado 5 veces el mismo bofetón que tu padre? .... ..........
-...
-¡¡¡AAAAAHH!!!!!... ¿Cuánto es un bofetonazo?.  ¿Qué te ha dado?....
-¿Cuánto?.. ¡¡HANAAHAAATH!!!... ¡AAASAAAMH!.!!.. ¡HASAMAAADORO! ;.. ¡¡AAARHAThAAGHOR!! ¡¡¡NOAAAPHYAA!!!!!. ¡¡HECHAMÁ!!... ¡¡NOHENHÁHE!!! ¡¡¿QU


## Modelo con base en ingles

In [None]:
# cargo modelo con base en ingles
model2 = AutoModelForCausalLM.from_pretrained(
    'kevmansilla/generate_jokes_english')
tokenizer2 = AutoTokenizer.from_pretrained(
    'kevmansilla/generate_jokes_english')

## Modelo con bigramas

In [17]:
# cargo modelo con bigrama
model3 = AutoModelForCausalLM.from_pretrained(
    'kevmansilla/generate_jokes_bigram')
tokenizer3 = AutoTokenizer.from_pretrained(
    'kevmansilla/generate_jokes_bigram')

model.safetensors:   0%|          | 0.00/1.42G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/119 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/2.46k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/840k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/498k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/2.19M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/771 [00:00<?, ?B/s]

In [20]:
class StopOnRepetition(StoppingCriteria):
    def __init__(self, tokenizer, max_repeats=2):
        self.tokenizer = tokenizer
        self.max_repeats = max_repeats

    def __call__(self, input_ids, scores, **kwargs):
        decoded_text = self.tokenizer.decode(
            input_ids[0], skip_special_tokens=True)
        words = decoded_text.split()

        # Detectar si hay demasiadas repeticiones consecutivas
        if len(words) > 3 and len(set(words[-self.max_repeats:])) == 1:
            return True
        return False


def generate_joke_from_prompt(prompt: str, max_length: int = 100, temperature: float = 0.7) -> str:
    '''
    Genera un chiste coherente a partir de un prompt usando el modelo entrenado.

    Args:
        prompt (str): Inicio o tema del chiste.
        max_length (int): Longitud máxima del texto generado.
        temperature (float): Controla la creatividad del modelo.

    Returns:
        str: El chiste generado.
    '''
    # Tokenizar el prompt
    input_ids = tokenizer3(prompt, return_tensors='pt').input_ids

    # Crear el criterio de parada
    stopping_criteria = StoppingCriteriaList([StopOnRepetition(tokenizer3)])

    # Generar chiste con parámetros optimizados
    output = model3.generate(
        input_ids=input_ids,
        max_length=max_length,
        temperature=temperature,
        top_k=50,  # Limitar las opciones para cada palabra
        top_p=0.9,  # Nucleus sampling para mayor diversidad
        repetition_penalty=1.5,
        no_repeat_ngram_size=2,  # Evitar repeticiones de bigramas
        stopping_criteria=stopping_criteria,
        early_stopping=True,
        pad_token_id=tokenizer3.eos_token_id
    )

    # Decodificar el texto generado
    joke = tokenizer3.decode(output[0], skip_special_tokens=True)
    return joke

In [21]:
# Ejemplo de uso
prompt = 'Un doctor le dice a su paciente'
chiste = generate_joke_from_prompt(prompt, max_length=60)
print(f'Chiste generado: {chiste}')



Chiste generado: Un doctor le dice a su paciente:
- Doctor, tengo un problema. Un médico me ha dicho que tiene usted una enfermedad venérea y no sé cómo se llama la enfermedad pero si lo sabe es porque el otro día vino al consultorio del cirujano para decirme que tenía problemas de corazón.


## Modelo question answer

In [22]:
# cargo el modelo de hugging face
model4 = AutoModelForCausalLM.from_pretrained(
    'kevmansilla/generate_jokes_question_answer')
tokenizer4 = AutoTokenizer.from_pretrained(
    'kevmansilla/generate_jokes_question_answer')

config.json:   0%|          | 0.00/1.02k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.42G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/119 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/2.46k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/840k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/498k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/2.19M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/771 [00:00<?, ?B/s]

In [23]:
def generate_short_joke(prompt, max_length=50, temperature=0.7, top_k=30, top_p=0.9) -> str:
    '''
    Genera un chiste breve basado en el prompt proporcionado.

    Args:
        prompt (str): El texto inicial para el chiste.
        max_length (int): Longitud máxima del chiste generado.
        temperature (float): Controla la aleatoriedad.
        top_k (int): Tokens más probables considerados en cada paso.
        top_p (float): Probabilidad acumulativa para top-p sampling.

    Returns:
        str: El chiste generado.
    '''
    # Tokenizar el prompt
    input_ids = tokenizer4(prompt, return_tensors='pt').input_ids

    # Generar el chiste con parámetros optimizados
    output = model4.generate(
        input_ids=input_ids,
        max_length=max_length,
        temperature=temperature,
        top_k=top_k,
        top_p=top_p,
        num_return_sequences=1,
        do_sample=True,
        pad_token_id=tokenizer4.eos_token_id,
        eos_token_id=tokenizer4.convert_tokens_to_ids(
            '<END>')  # Detener al encontrar <END>
    )

    # Decodificar el chiste generado
    joke = tokenizer4.decode(output[0], skip_special_tokens=True)

    return joke

In [24]:
# Ejemplo de uso
prompt = '<START>[QUESTION] ¿Que le dijo un judio al otro?'
chiste = generate_short_joke(prompt)

print(f'Chiste generado:\n{chiste}')

Chiste generado:
<START>[QUESTION] ¿Que le dijo un judio al otro?
[ANSWER] Que lo que me dijo el otro fue que le había dicho que se lo hiciera a otro.
<END
