# Algunos programas (Python) para generar resúmenes


En este notebook, vamos a presentar algunos programas que puedes utilizar directamente para generar resúmenes.



## BERT

En el siguiente código, aprenderemos a utilizar la librería **bert-extractive-summarizer**. Esta librería proporciona una interfaz sencilla para trabajar con un modelo BERT, que fue ajustado a la tarea de generación de resúmenes extractiva. En este enfoque, las oraciones se clasifican según su importancia y las oraciones más relevantes se seleccionan para formar el resumen.



In [1]:
!pip install bert-extractive-summarizer


Collecting bert-extractive-summarizer
  Downloading bert_extractive_summarizer-0.10.1-py3-none-any.whl.metadata (15 kB)
Downloading bert_extractive_summarizer-0.10.1-py3-none-any.whl (25 kB)
Installing collected packages: bert-extractive-summarizer
Successfully installed bert-extractive-summarizer-0.10.1


In [2]:
from summarizer import Summarizer
summarizer = Summarizer()

# Texto original
input_text = """
The superstition surrounding Friday the 13th stems from a blend of religious, historical, and cultural influences.
In Christianity, the number 13 is considered unlucky because Judas Iscariot,
the betrayer of Jesus, was the 13th guest at the Last Supper.
Additionally, Jesus was crucified on a Friday, reinforcing the idea that both Friday and the number 13 are associated
with misfortune.

Other influences include Norse mythology, where the trickster god Loki was the uninvited
13th guest at a dinner party that led to the death of Balder, the god of joy. Historically,
the mass arrest of the Knights Templar on Friday, October 13, 1307, also solidified the
date's connection to bad luck.

These beliefs, combined with cultural references in literature, such as Thomas W. Lawson's 1907 novel Friday,
the Thirteenth, and popular horror films, have helped turn Friday the 13th into a widely recognized
symbol of bad luck in modern times.
"""


summary = summarizer(input_text, min_length=50, max_length=150)  # Puedes ajustar los parámetros min_length y max_length
# Output the summary
print("Texto orignal:")
print(input_text)
print("\nResumen:")
print(summary)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/571 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.34G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]



Texto orignal:

The superstition surrounding Friday the 13th stems from a blend of religious, historical, and cultural influences.
In Christianity, the number 13 is considered unlucky because Judas Iscariot,
the betrayer of Jesus, was the 13th guest at the Last Supper.
Additionally, Jesus was crucified on a Friday, reinforcing the idea that both Friday and the number 13 are associated
with misfortune.

Other influences include Norse mythology, where the trickster god Loki was the uninvited
13th guest at a dinner party that led to the death of Balder, the god of joy. Historically,
the mass arrest of the Knights Templar on Friday, October 13, 1307, also solidified the
date's connection to bad luck.

These beliefs, combined with cultural references in literature, such as Thomas W. Lawson's 1907 novel Friday,
the Thirteenth, and popular horror films, have helped turn Friday the 13th into a widely recognized
symbol of bad luck in modern times.


Resumen:
The superstition surrounding Friday 

  super()._check_params_vs_input(X, default_n_init=10)


## T5 (Text-to-Text Transfer Transformer)
 T5 es un modelo transformer que puede aplicarse a muchas de las tareas de PLN, incluyendo la generación de resúmenes.

 En concreto, T5 crea resúmenes abstractivos:

In [3]:
from transformers import T5Tokenizer, T5ForConditionalGeneration

# Load pre-trained T5 model and tokenizer
model_name = "t5-small"
tokenizer = T5Tokenizer.from_pretrained(model_name)
model = T5ForConditionalGeneration.from_pretrained(model_name)


tokenizer_config.json:   0%|          | 0.00/2.32k [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/792k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.39M [00:00<?, ?B/s]

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


config.json:   0%|          | 0.00/1.21k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/242M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/147 [00:00<?, ?B/s]

In [4]:

# Texto original
input_text = """
The superstition surrounding Friday the 13th stems from a blend of religious, historical, and cultural influences.
In Christianity, the number 13 is considered unlucky because Judas Iscariot,
the betrayer of Jesus, was the 13th guest at the Last Supper.
Additionally, Jesus was crucified on a Friday, reinforcing the idea that both Friday and the number 13 are associated
with misfortune.

Other influences include Norse mythology, where the trickster god Loki was the uninvited
13th guest at a dinner party that led to the death of Balder, the god of joy. Historically,
the mass arrest of the Knights Templar on Friday, October 13, 1307, also solidified the
date's connection to bad luck.

These beliefs, combined with cultural references in literature, such as Thomas W. Lawson's 1907 novel Friday,
the Thirteenth, and popular horror films, have helped turn Friday the 13th into a widely recognized
symbol of bad luck in modern times.
"""

# Tokenize and summarize the input text using T5
inputs = tokenizer.encode("summarize: " + input_text, return_tensors="pt", max_length=1024, truncation=True)
summary_ids = model.generate(inputs, max_length=150, min_length=50, length_penalty=2.0, num_beams=4, early_stopping=True)

# Decode and output the summary
summary_t5 = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print("Texto orignal:")
print(input_text)
print("\nResumen:")
print(summary_t5)

Texto orignal:

The superstition surrounding Friday the 13th stems from a blend of religious, historical, and cultural influences.
In Christianity, the number 13 is considered unlucky because Judas Iscariot,
the betrayer of Jesus, was the 13th guest at the Last Supper.
Additionally, Jesus was crucified on a Friday, reinforcing the idea that both Friday and the number 13 are associated
with misfortune.

Other influences include Norse mythology, where the trickster god Loki was the uninvited
13th guest at a dinner party that led to the death of Balder, the god of joy. Historically,
the mass arrest of the Knights Templar on Friday, October 13, 1307, also solidified the
date's connection to bad luck.

These beliefs, combined with cultural references in literature, such as Thomas W. Lawson's 1907 novel Friday,
the Thirteenth, and popular horror films, have helped turn Friday the 13th into a widely recognized
symbol of bad luck in modern times.


Resumen:
in Christianity, the number 13 is co

## BART


In [5]:
from transformers import BartTokenizer, BartForConditionalGeneration

# Load pre-trained BART model and tokenizer
model_name = "facebook/bart-large-cnn"
tokenizer = BartTokenizer.from_pretrained(model_name)
model = BartForConditionalGeneration.from_pretrained(model_name)


vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

config.json:   0%|          | 0.00/1.58k [00:00<?, ?B/s]



model.safetensors:   0%|          | 0.00/1.63G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/363 [00:00<?, ?B/s]

In [6]:
# Tokenize and summarize the input text using BART
inputs = tokenizer.encode("summarize: " + input_text, return_tensors="pt", max_length=1024, truncation=True)
summary_ids = model.generate(inputs, max_length=100, min_length=50, length_penalty=2.0, num_beams=4, early_stopping=True)

# Decode and output the summary
summary_bart = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print("Texto orignal:")
print(input_text)
print("\nResumen:")
print(summary_bart)

Texto orignal:

The superstition surrounding Friday the 13th stems from a blend of religious, historical, and cultural influences.
In Christianity, the number 13 is considered unlucky because Judas Iscariot,
the betrayer of Jesus, was the 13th guest at the Last Supper.
Additionally, Jesus was crucified on a Friday, reinforcing the idea that both Friday and the number 13 are associated
with misfortune.

Other influences include Norse mythology, where the trickster god Loki was the uninvited
13th guest at a dinner party that led to the death of Balder, the god of joy. Historically,
the mass arrest of the Knights Templar on Friday, October 13, 1307, also solidified the
date's connection to bad luck.

These beliefs, combined with cultural references in literature, such as Thomas W. Lawson's 1907 novel Friday,
the Thirteenth, and popular horror films, have helped turn Friday the 13th into a widely recognized
symbol of bad luck in modern times.


Resumen:
In Christianity, the number 13 is co

## Generación de resúmenes en español

In [7]:
import torch
from transformers import BertTokenizerFast, EncoderDecoderModel
device = 'cuda' if torch.cuda.is_available() else 'cpu'
ckpt = 'mrm8488/bert2bert_shared-spanish-finetuned-summarization'
tokenizer = BertTokenizerFast.from_pretrained(ckpt)
model = EncoderDecoderModel.from_pretrained(ckpt).to(device)


tokenizer_config.json:   0%|          | 0.00/520 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/242k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/4.51k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/555M [00:00<?, ?B/s]

The following encoder weights were not tied to the decoder ['bert/pooler']
The following encoder weights were not tied to the decoder ['bert/pooler']
The following encoder weights were not tied to the decoder ['bert/pooler']
The following encoder weights were not tied to the decoder ['bert/pooler']


In [8]:
def generate_summary(text):

   inputs = tokenizer([text], padding="max_length", truncation=True, max_length=512, return_tensors="pt")
   input_ids = inputs.input_ids.to(device)
   attention_mask = inputs.attention_mask.to(device)
   output = model.generate(input_ids, attention_mask=attention_mask)
   return tokenizer.decode(output[0], skip_special_tokens=True)

input_text = """La superstición en torno al viernes 13 proviene de una combinación de influencias religiosas, históricas y culturales. En el cristianismo, el número 13 se considera de mala suerte porque Judas Iscariote, el traidor de Jesús, fue el decimotercer invitado en la Última Cena. Además, Jesús fue crucificado un viernes, lo que refuerza la idea de que tanto el viernes como el número 13 están asociados con la desgracia.

Otras influencias incluyen la mitología nórdica, donde el dios embaucador Loki fue el decimotercer invitado no deseado en una fiesta que llevó a la muerte de Balder, el dios de la alegría. Históricamente, la detención masiva de los Caballeros Templarios el viernes 13 de octubre de 1307 también consolidó la conexión de la fecha con la mala suerte.

Estas creencias, combinadas con referencias culturales en la literatura, como la novela Friday, the Thirteenth de Thomas W. Lawson de 1907, y películas de terror populares, han ayudado a convertir el viernes 13 en un símbolo ampliamente reconocido de mala suerte en tiempos modernos."""
summary= generate_summary(input_text)


print("Texto orignal:")
print(input_text)
print("\nResumen:")
print(summary)

Texto orignal:
La superstición en torno al viernes 13 proviene de una combinación de influencias religiosas, históricas y culturales. En el cristianismo, el número 13 se considera de mala suerte porque Judas Iscariote, el traidor de Jesús, fue el decimotercer invitado en la Última Cena. Además, Jesús fue crucificado un viernes, lo que refuerza la idea de que tanto el viernes como el número 13 están asociados con la desgracia.

Otras influencias incluyen la mitología nórdica, donde el dios embaucador Loki fue el decimotercer invitado no deseado en una fiesta que llevó a la muerte de Balder, el dios de la alegría. Históricamente, la detención masiva de los Caballeros Templarios el viernes 13 de octubre de 1307 también consolidó la conexión de la fecha con la mala suerte.

Estas creencias, combinadas con referencias culturales en la literatura, como la novela Friday, the Thirteenth de Thomas W. Lawson de 1907, y películas de terror populares, han ayudado a convertir el viernes 13 en un sí

In [9]:
from transformers import pipeline

summarizer = pipeline("summarization", model="ELiRF/mt5-base-dacsa-es")


config.json:   0%|          | 0.00/1.11k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.33G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/425 [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/4.31M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/65.0 [00:00<?, ?B/s]



Texto orignal:
La superstición en torno al viernes 13 proviene de una combinación de influencias religiosas, históricas y culturales. En el cristianismo, el número 13 se considera de mala suerte porque Judas Iscariote, el traidor de Jesús, fue el decimotercer invitado en la Última Cena. Además, Jesús fue crucificado un viernes, lo que refuerza la idea de que tanto el viernes como el número 13 están asociados con la desgracia.

Otras influencias incluyen la mitología nórdica, donde el dios embaucador Loki fue el decimotercer invitado no deseado en una fiesta que llevó a la muerte de Balder, el dios de la alegría. Históricamente, la detención masiva de los Caballeros Templarios el viernes 13 de octubre de 1307 también consolidó la conexión de la fecha con la mala suerte.

Estas creencias, combinadas con referencias culturales en la literatura, como la novela Friday, the Thirteenth de Thomas W. Lawson de 1907, y películas de terror populares, han ayudado a convertir el viernes 13 en un sí

In [10]:
summary = summarizer(input_text, truncation=True)

print("Texto orignal:")
print(input_text)
print("\nResumen:")
print(summary)

Texto orignal:
La superstición en torno al viernes 13 proviene de una combinación de influencias religiosas, históricas y culturales. En el cristianismo, el número 13 se considera de mala suerte porque Judas Iscariote, el traidor de Jesús, fue el decimotercer invitado en la Última Cena. Además, Jesús fue crucificado un viernes, lo que refuerza la idea de que tanto el viernes como el número 13 están asociados con la desgracia.

Otras influencias incluyen la mitología nórdica, donde el dios embaucador Loki fue el decimotercer invitado no deseado en una fiesta que llevó a la muerte de Balder, el dios de la alegría. Históricamente, la detención masiva de los Caballeros Templarios el viernes 13 de octubre de 1307 también consolidó la conexión de la fecha con la mala suerte.

Estas creencias, combinadas con referencias culturales en la literatura, como la novela Friday, the Thirteenth de Thomas W. Lawson de 1907, y películas de terror populares, han ayudado a convertir el viernes 13 en un sí

In [11]:
summary = summarizer(input_text)

print("Texto orignal:")
print(input_text)
print("\nResumen:")
print(summary)

Texto orignal:
La superstición en torno al viernes 13 proviene de una combinación de influencias religiosas, históricas y culturales. En el cristianismo, el número 13 se considera de mala suerte porque Judas Iscariote, el traidor de Jesús, fue el decimotercer invitado en la Última Cena. Además, Jesús fue crucificado un viernes, lo que refuerza la idea de que tanto el viernes como el número 13 están asociados con la desgracia.

Otras influencias incluyen la mitología nórdica, donde el dios embaucador Loki fue el decimotercer invitado no deseado en una fiesta que llevó a la muerte de Balder, el dios de la alegría. Históricamente, la detención masiva de los Caballeros Templarios el viernes 13 de octubre de 1307 también consolidó la conexión de la fecha con la mala suerte.

Estas creencias, combinadas con referencias culturales en la literatura, como la novela Friday, the Thirteenth de Thomas W. Lawson de 1907, y películas de terror populares, han ayudado a convertir el viernes 13 en un sí

## ChatGPT

Pidele a ChatGPT que genere un resumen para ese mismo texto. Compara las resúmenes generados por BERT, T5, BART y ChatGPT.  ¿Qué diferencias observas?, ¿alguno es mejor?.


Pruebas con otros textos: