# Aplicaciones de Transformers en Procesamiento de Lenguaje Natural

Este cuaderno explora distintas aplicaciones de los modelos Transformers en tareas de procesamiento de lenguaje natural (PLN), utilizando ejemplos pr√°cticos y explicaciones te√≥ricas.

---

## ¬øQu√© es la arquitectura Transformer?

La **arquitectura Transformer** es un tipo de red neuronal propuesta por Vaswani et al. en 2017. Su principal innovaci√≥n es el mecanismo de *atenci√≥n*, que permite al modelo enfocarse en diferentes partes de la entrada para procesar informaci√≥n contextual de manera eficiente. Los Transformers reemplazaron a modelos anteriores como LSTM y GRU en muchas tareas de PLN debido a su capacidad para manejar secuencias largas y aprender dependencias complejas.

---

## ¬øQu√© es la librer√≠a Transformers de Hugging Face?

La **librer√≠a Transformers de Hugging Face** es una biblioteca de Python que proporciona implementaciones preentrenadas de modelos basados en la arquitectura Transformer (como BERT, GPT, T5, etc.) para tareas de PLN. Permite cargar modelos f√°cilmente y utilizarlos en tareas como clasificaci√≥n, traducci√≥n, resumen, etc., sin necesidad de entrenarlos desde cero. Podes explorar los modelos disponibles en la [p√°gina de modelos de Hugging Face](https://huggingface.co/models).

---

## ¬øQu√© es un pipeline en Hugging Face?

Un **pipeline** en Hugging Face es una interfaz de alto nivel que simplifica el uso de modelos preentrenados para tareas espec√≠ficas. Permite ejecutar tareas como clasificaci√≥n de texto, reconocimiento de entidades, traducci√≥n, etc., con solo unas pocas l√≠neas de c√≥digo, ocultando detalles complejos de preprocesamiento y postprocesamiento.


## 1. Definir el texto de ejemplo

A continuaci√≥n, se presenta un texto de ejemplo que ser√° utilizado en las distintas aplicaciones de modelos Transformers. Este texto simula una queja de un cliente sobre un pedido equivocado, lo que nos permitir√° explorar tareas como clasificaci√≥n, reconocimiento de entidades, respuesta a preguntas, resumen, traducci√≥n y generaci√≥n de texto.

In [None]:
texto = """Querido MercadoLibre, la semana pasada ped√≠ una figura de acci√≥n de Optimus Prime desde su tienda online.
Para mi sorpresa, cuando abr√≠ el paquete, descubr√≠ horrorizado que me hab√≠an enviado una figura de Megatron.
Como fan de los Autobots, espero que entiendan mi decepci√≥n. Solicito un cambio urgente del producto."""

## 2. Clasificaci√≥n de texto con Transformers

La **clasificaci√≥n de texto** es una tarea fundamental en PLN que consiste en asignar una o varias etiquetas a un texto, como por ejemplo identificar el sentimiento (positivo, negativo, neutro) o la intenci√≥n del mensaje. Los modelos Transformers, gracias a su capacidad para comprender el contexto, demostraron un rendimiento sobresaliente en esta tarea.

Utilizaremos el pipeline `text-classification` de la librer√≠a ü§ó Transformers para analizar el texto de ejemplo y visualizar el resultado de la clasificaci√≥n.

In [None]:
from transformers import pipeline
# Modelo de clasificaci√≥n de texto (sentimiento) en espa√±ol
# Puedes buscar otros modelos en https://huggingface.co/models
classifier = pipeline("text-classification", model="pysentimiento/robertuito-sentiment-analysis")
import pandas as pd
outputs = classifier(texto)
pd.DataFrame(outputs)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/925 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/435M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/384 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.31M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/167 [00:00<?, ?B/s]

Device set to use cpu


Unnamed: 0,label,score
0,NEG,0.913063


## 3. Reconocimiento de entidades nombradas (NER)

El **Reconocimiento de Entidades Nombradas** (NER, por sus siglas en ingl√©s) es la tarea de identificar y clasificar autom√°ticamente nombres propios, lugares, organizaciones y otras entidades relevantes dentro de un texto. Los Transformers permiten realizar NER de manera eficiente y precisa.

A continuaci√≥n, aplicamos el pipeline `ner` al texto de ejemplo para extraer las entidades nombradas presentes.

In [None]:
# Modelo de reconocimiento de entidades nombradas (NER) en espa√±ol
# Puedes buscar otros modelos en https://huggingface.co/models
ner_tagger = pipeline("ner", model="mrm8488/bert-spanish-cased-finetuned-ner", aggregation_strategy="simple")
outputs = ner_tagger(texto)
pd.DataFrame(outputs)

config.json:   0%|          | 0.00/829 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/439M [00:00<?, ?B/s]

Some weights of the model checkpoint at mrm8488/bert-spanish-cased-finetuned-ner were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


model.safetensors:   0%|          | 0.00/439M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/136 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/242k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cpu
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


Unnamed: 0,entity_group,score,word,start,end
0,ORG,0.756585,MercadoLibre,8,20
1,MISC,0.829108,Optimus Prime,68,81
2,MISC,0.763651,Megatron,205,213
3,MISC,0.954693,Autobot,231,238


## 4. Respuesta a preguntas basada en contexto

La tarea de **respuesta a preguntas** (Question Answering) consiste en responder preguntas espec√≠ficas utilizando un contexto dado. Los modelos Transformers pueden comprender el texto y extraer la informaci√≥n relevante para responder de manera precisa.

En el siguiente ejemplo, preguntamos al modelo qu√© desea el cliente, utilizando el pipeline `question-answering`.

In [None]:
# Modelo de respuesta a preguntas en espa√±ol
# Puedes buscar otros modelos en https://huggingface.co/models
reader = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-large-bne-sqac")
question = "¬øQu√© quiere el cliente?"
outputs = reader(question=question, context=texto)
pd.DataFrame([outputs])

config.json:   0%|          | 0.00/665 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/1.42G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.42G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/1.07k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/858k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/516k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.48M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/772 [00:00<?, ?B/s]

Device set to use cpu


Unnamed: 0,score,start,end,answer
0,0.999948,285,315,un cambio urgente del producto


## 5. Resumen autom√°tico de texto

El **resumen autom√°tico** permite condensar la informaci√≥n principal de un texto extenso en una versi√≥n m√°s corta, manteniendo el significado esencial. Los Transformers han revolucionado esta tarea gracias a su capacidad de comprensi√≥n contextual.

A continuaci√≥n, utilizamos el pipeline `summarization` para obtener un resumen del texto de ejemplo.

In [None]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
# Puedes buscar otros modelos en https://huggingface.co/models
model_name = "csebuetnlp/mT5_multilingual_XLSum"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
resumidor = pipeline("summarization", model=model, tokenizer=tokenizer)
resumen = resumidor(texto, max_length=80, min_length=20, do_sample=False)
print(resumen[0]['summary_text'])

tokenizer_config.json:   0%|          | 0.00/375 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/730 [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/4.31M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/65.0 [00:00<?, ?B/s]

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


pytorch_model.bin:   0%|          | 0.00/2.33G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.33G [00:00<?, ?B/s]

Device set to use cpu


Hace unos meses, un paquete de acciones de la tienda online Amazon me envi√≥ una figura de Megatron.


## 6. Traducci√≥n autom√°tica del espa√±ol a ingl√©s

La **traducci√≥n autom√°tica** es una de las aplicaciones m√°s destacadas de los Transformers, permitiendo traducir textos entre diferentes idiomas con alta calidad. Utilizaremos el pipeline `translation_es_to_en` para traducir el texto de ejemplo del espa√±ol al ingl√©s.

In [None]:
# Modelo de traducci√≥n de espa√±ol a ingl√©s
# Puedes buscar otros modelos en https://huggingface.co/models
translator = pipeline("translation_es_to_en", model="Helsinki-NLP/opus-mt-es-en")
outputs = translator(texto)
print(outputs[0]['translation_text'])

config.json:   0%|          | 0.00/1.44k [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


pytorch_model.bin:   0%|          | 0.00/312M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/293 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


tokenizer_config.json:   0%|          | 0.00/44.0 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/312M [00:00<?, ?B/s]

source.spm:   0%|          | 0.00/826k [00:00<?, ?B/s]

target.spm:   0%|          | 0.00/802k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.59M [00:00<?, ?B/s]

Device set to use cpu


Dear MarketFree, last week I asked for an action figure of Optimus Prime from his online store. To my surprise, when I opened the package, I discovered horrified that I had been sent a figure of Megatron. As a fan of Autobots, I hope you understand my disappointment. I request an urgent change of product.


## 7. Generaci√≥n autom√°tica de texto (respuesta de servicio al cliente)

La **generaci√≥n autom√°tica de texto** permite crear o continuar textos de manera coherente a partir de un prompt inicial. Esta capacidad es √∫til, por ejemplo, para redactar respuestas autom√°ticas en atenci√≥n al cliente.

En el siguiente ejemplo, generamos una posible respuesta de servicio al cliente utilizando el pipeline `text-generation`.

In [None]:
# Modelo de generaci√≥n de texto en espa√±ol
# Puedes buscar otros modelos en https://huggingface.co/models
generator = pipeline("text-generation", model="datificate/gpt2-small-spanish")
respuesta_inicial = "Estimado cliente, lamentamos mucho lo ocurrido con su pedido. "
prompt = texto + "\n\nRespuesta del servicio al cliente:\n" + respuesta_inicial
outputs = generator(
    prompt,
    max_new_tokens=150,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.9,
    repetition_penalty=1.3,
    eos_token_id=50256
)
print(outputs[0]['generated_text'])

config.json:   0%|          | 0.00/817 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/510M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/510M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/620 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/850k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/508k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/387 [00:00<?, ?B/s]

Device set to use cpu


Querido MercadoLibre, la semana pasada ped√≠ una figura de acci√≥n de Optimus Prime desde su tienda online.
Para mi sorpresa, cuando abr√≠ el paquete, descubr√≠ horrorizado que me hab√≠an enviado una figura de Megatron.
Como fan de los Autobots, espero que entiendan mi decepci√≥n. Solicito un cambio urgente del producto.

Respuesta del servicio al cliente:
Estimado cliente, lamentamos mucho lo ocurrido con su pedido. ¬†No quiero que esto vuelva a suceder y no dej√© indiferente de verme como si este se hubiese convertido as√≠ despu√©s de que pensara que ser√≠a bueno.
Reactivando mis pensamientos sobre esta noticia es dif√≠cil.
El d√≠a 26 de septiembre, fue anunciado que era el estreno oficial para PlayStation 4 y Xbox One titulado "Transformers", junto con las nuevas entregas de Transformer 2 y Transformers 3; por lo tanto, fue recibido positivamente entre los fan√°ticos m√°s j√≥venes e incluso adultos ya existentes durante todo ese tiempo (ya sea reci√©n llegados o nuevos).
La primera 

---

## Ejercicios aut√≥nomos (40 minutos)

A continuaci√≥n, te proponemos ejercicios pr√°cticos para que pongas en pr√°ctica lo aprendido sobre la arquitectura Transformer, la librer√≠a Transformers de Hugging Face y el uso de pipelines en tareas de PLN.

**Recorda:** Para cada ejercicio, explora la [p√°gina de modelos de Hugging Face](https://huggingface.co/models) y busca modelos que sean apropiados para espa√±ol, o incluso para el contexto argentino si los encontras.

### 1. Clasificaci√≥n de textos propios
- Escribi dos textos breves (pueden ser opiniones, quejas o comentarios sobre servicios o productos en Argentina, por ejemplo sobre colectivos, supermercados, bancos, etc.).
- Busca en Hugging Face un modelo de clasificaci√≥n de texto en espa√±ol y usalo con el pipeline `text-classification` para analizar el sentimiento de cada texto.
- ¬øEl resultado coincide con tu expectativa? Explica brevemente.

### 2. Reconocimiento de entidades en noticias argentinas
- Busca un p√°rrafo de una noticia reciente de un medio argentino (por ejemplo, Clar√≠n, La Naci√≥n, P√°gina/12).
- Busca en Hugging Face un modelo de NER para espa√±ol y apl√≠calo para identificar entidades nombradas.
- Enumera las entidades encontradas y clasif√≠calas (persona, organizaci√≥n, lugar, etc.).

### 3. Respuesta a preguntas personalizada
- Escribi un peque√±o texto narrativo (4-5 l√≠neas) sobre una situaci√≥n cotidiana en Buenos Aires (por ejemplo, un reclamo en una oficina p√∫blica, una experiencia en el subte, etc.).
- Formula dos preguntas sobre el texto y utiliza un modelo de `question-answering` de Hugging Face para responderlas.
- ¬øLas respuestas son correctas y precisas? ¬øPor qu√©?

### 4. Resumen de un texto propio
- Eleg√≠ un texto m√°s largo (puede ser un fragmento de Wikipedia sobre Argentina, una noticia, etc.).
- Busca un modelo de resumen en espa√±ol en Hugging Face y √∫salo con el pipeline `summarization`.
- Compara el resumen generado con el texto original: ¬øqu√© informaci√≥n se perdi√≥ y cu√°l se mantuvo?

### 5. Traducci√≥n y an√°lisis
- Escribi un texto breve en espa√±ol rioplatense y trad√∫cilo al ingl√©s usando un modelo de traducci√≥n de Hugging Face.
- Luego, traduci el resultado nuevamente al espa√±ol (podes usar otro pipeline o Google Translate).
- ¬øEl texto final es igual al original? ¬øQu√© diferencias encontras?

### 6. Generaci√≥n creativa de texto
- Escribe el inicio de una historia o una pregunta abierta relacionada con Buenos Aires.
- Busca un modelo de generaci√≥n de texto en espa√±ol en Hugging Face y √∫salo con el pipeline `text-generation` para continuar el texto.
- Analiza la coherencia y creatividad de la respuesta generada.

---

**Tip:** Para cada ejercicio, explora la [p√°gina de modelos de Hugging Face](https://huggingface.co/models) y lee la descripci√≥n de los modelos antes de usarlos. Si tienes dudas, consulta la documentaci√≥n oficial de [Transformers](https://huggingface.co/docs/transformers/index).

In [None]:
from transformers import pipeline

textos = [
    "Otra vez el colectivo lleg√≥ con 25 minutos de demora. Ya ni s√© para qu√© est√°n los horarios, una falta de respeto total.",
    "Fui al supermercado nuevo del barrio y me encant√≥. Todo estaba limpio, bien organizado y la atenci√≥n fue excelente."
]

clasificador = pipeline("text-classification", model="pysentimiento/robertuito-sentiment-analysis")
resultados = clasificador(textos)

for i, resultado in enumerate(resultados):
    print(f"Texto {i+1}:")
    print(f"  ‚Üí Etiqueta: {resultado['label']}")
    print(f"  ‚Üí Confianza: {resultado['score']:.2f}")

Device set to use cpu


Texto 1:
  ‚Üí Etiqueta: NEG
  ‚Üí Confianza: 0.98
Texto 2:
  ‚Üí Etiqueta: POS
  ‚Üí Confianza: 0.98


In [None]:
import pandas as pd

# Texto de ejemplo basado en noticia argentina
texto = (
    "El presidente Javier Milei anunci√≥ esta ma√±ana en Casa Rosada un nuevo paquete de medidas econ√≥micas "
    "junto al ministro de Econom√≠a, Luis Caputo. La conferencia fue transmitida en vivo por la Televisi√≥n P√∫blica "
    "y seguida de cerca por analistas en Buenos Aires."
)

# Cargar el modelo NER en espa√±ol
ner = pipeline("ner", model="mrm8488/bert-spanish-cased-finetuned-ner", aggregation_strategy="simple")

# Aplicar el modelo al texto
entidades = ner(texto)

# Mostrar resultados en una tabla
pd.DataFrame(entidades)

Some weights of the model checkpoint at mrm8488/bert-spanish-cased-finetuned-ner were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Device set to use cpu
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


Unnamed: 0,entity_group,score,word,start,end
0,PER,0.998498,Javier Milei,14,26
1,LOC,0.99931,Casa Rosada,50,61
2,MISC,0.999771,Econom√≠a,122,130
3,PER,0.99975,Luis Caputo,132,143
4,ORG,0.999277,Televisi√≥n P√∫blica,191,209
5,LOC,0.999503,Buenos Aires,246,258


In [None]:
# Texto narrativo
contexto = (
    "Ayer fui a la oficina de ANSES de la calle C√≥rdoba para hacer un reclamo por un error en mi jubilaci√≥n. "
    "La atenci√≥n fue lenta, pero finalmente me atendi√≥ una se√±ora muy amable que resolvi√≥ mi problema."
)

# Cargar modelo de respuesta a preguntas en espa√±ol
qa = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-large-bne-sqac")

# Preguntas
preguntas = [
    "¬øD√≥nde fue el reclamo?",
    "¬øC√≥mo fue la atenci√≥n recibida?",
    "¬øQui√©n atendi√≥ el reclamo?"
]

# Obtener respuestas
respuestas = [qa(question=p, context=contexto) for p in preguntas]

# Mostrar resultados
pd.DataFrame({
    "Pregunta": preguntas,
    "Respuesta": [r["answer"] for r in respuestas],
    "Confianza": [r["score"] for r in respuestas]
})

Device set to use cpu


Unnamed: 0,Pregunta,Respuesta,Confianza
0,¬øD√≥nde fue el reclamo?,oficina de ANSES de la calle C√≥rdoba,0.883641
1,¬øC√≥mo fue la atenci√≥n recibida?,lenta,0.999893
2,¬øQui√©n atendi√≥ el reclamo?,una se√±ora muy amable,0.999952


In [None]:
# Texto original
texto = (
    "Argentina es un pa√≠s soberano de Am√©rica del Sur, ubicado en el extremo sur y sudeste del subcontinente. "
    "Limita al norte con Bolivia y Paraguay, al noreste con Brasil, al este con Uruguay y el oc√©ano Atl√°ntico Sur, "
    "y al sur y oeste con Chile. Con una superficie de m√°s de 2.7 millones de km¬≤, es el octavo pa√≠s m√°s grande del mundo. "
    "Su capital es Buenos Aires, una ciudad cosmopolita y uno de los principales centros culturales y econ√≥micos del continente. "
    "Argentina es una rep√∫blica federal compuesta por 23 provincias y una ciudad aut√≥noma. "
    "Su econom√≠a es una de las m√°s grandes de Am√©rica Latina, con sectores fuertes como la agricultura, la ganader√≠a, la industria y los servicios."
)

# Cargar modelo de resumen
model_name = "csebuetnlp/mT5_multilingual_XLSum"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

resumidor = pipeline("summarization", model=model, tokenizer=tokenizer)

# Generar resumen
resumen = resumidor(texto, max_length=80, min_length=20, do_sample=False)
print("Resumen generado:")
print(resumen[0]['summary_text'])

Device set to use cpu


Resumen generado:
Argentina es un pa√≠s soberano de Am√©rica del Sur, ubicado en el extremo sur y sudeste del subcontinente.


In [None]:
# Texto original
texto_original = (
    "Che, ayer fui al laburo en bondi y me clav√© un cafecito antes de arrancar. "
    "Estaba hecho percha, pero por suerte el jefe no dijo nada."
)

# Traducci√≥n espa√±ol ‚Üí ingl√©s
traductor_es_en = pipeline("translation", model="Helsinki-NLP/opus-mt-es-en")
texto_en = traductor_es_en(texto_original)[0]['translation_text']

# Traducci√≥n ingl√©s ‚Üí espa√±ol
traductor_en_es = pipeline("translation", model="Helsinki-NLP/opus-mt-en-es")
texto_es_retraducido = traductor_en_es(texto_en)[0]['translation_text']

# Mostrar resultados
print("üîπ Espa√±ol original:\n", texto_original)
print("\nüîπ Traducci√≥n al ingl√©s:\n", texto_en)
print("\nüîπ Retraducci√≥n al espa√±ol:\n", texto_es_retraducido)

Device set to use cpu


config.json:   0%|          | 0.00/1.47k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/312M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/293 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/312M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/44.0 [00:00<?, ?B/s]

source.spm:   0%|          | 0.00/802k [00:00<?, ?B/s]

target.spm:   0%|          | 0.00/826k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.59M [00:00<?, ?B/s]

Device set to use cpu


üîπ Espa√±ol original:
 Che, ayer fui al laburo en bondi y me clav√© un cafecito antes de arrancar. Estaba hecho percha, pero por suerte el jefe no dijo nada.

üîπ Traducci√≥n al ingl√©s:
 Che, yesterday I went to the job in bondi and stuck a coffee before I started. I was hanged, but luckily the boss didn't say anything.

üîπ Retraducci√≥n al espa√±ol:
 Che, ayer fui al trabajo en Bondi y me puse un caf√© antes de empezar. Me colgaron, pero por suerte el jefe no dijo nada.


In [None]:
from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM

# Inicio de historia
prompt = (
    "Eran las dos de la madrugada y la lluvia no paraba en Buenos Aires. "
    "Mart√≠n caminaba por Avenida Corrientes cuando algo llam√≥ su atenci√≥n desde una vieja librer√≠a iluminada..."
)

# Cargar modelo de generaci√≥n (ligero para Colab)
model_name = "tiiuae/falcon-rw-1b"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# Crear pipeline de generaci√≥n
generador = pipeline("text-generation", model=model, tokenizer=tokenizer)

# Generar texto
output = generador(prompt, max_new_tokens=100, do_sample=True, top_k=50, temperature=0.8)

# Mostrar resultado
print("üìù Historia completada:")
print(output[0]["generated_text"])

config.json:   0%|          | 0.00/1.05k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/2.62G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.62G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/115 [00:00<?, ?B/s]

Device set to use cpu
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


üìù Historia completada:
Eran las dos de la madrugada y la lluvia no paraba en Buenos Aires. Mart√≠n caminaba por Avenida Corrientes cuando algo llam√≥ su atenci√≥n desde una vieja librer√≠a iluminada...
It's the middle of the night in Buenos Aires when a woman's attention is drawn to a doorway in an old library. A voice calls to her.
She thinks, "I've heard of this voice before."
She turns to go.
But it's too late.
She stops and turns back.
In her way, a man is coming through the door, heading the opposite direction. He turns toward her and she recognizes him.
She knows what he looks like.
