## 7. Reflexión y discusión

- ¿Cuál de estos pipelines te pareció más sorprendente o útil?
- ¿Creés que estas herramientas podrían usarse en un proyecto real? ¿En cuál?
- ¿Notaste errores o sesgos? ¿Por qué creés que aparecen?



## 8. Actividad libre (opcional si hay tiempo)

Explorá uno de los pipelines y diseñá tu propio experimento:

- Probá frases con sarcasmo o jergas locales.
- Resumí un artículo de Wikipedia.
- Traducí algo complejo (tecnológico, poético, etc.).
- Completá una frase usando estilo formal o informal.

Al final compartimos los hallazgos más interesantes con el grupo 👀



Experimentos con Pipelines de Hugging Face

In [1]:
# Importamos las librerías necesarias
from transformers import pipeline


In [4]:
# Instalación de Hugging Face Transformers

print("Instalando Hugging Face Transformers...")
!pip install -q transformers
print("Instalación completa.")

# Importamos la función 'pipeline' de la librería transformers.
# La funcion nos permite usar modelos preentrenados para tareas específicas con muy pocas líneas de código.
from transformers import pipeline
print("Librería transformers y función pipeline importadas.")

Instalando Hugging Face Transformers...
Instalación completa.
Librería transformers y función pipeline importadas.


1° - Análisis de sentimiento con sarcasmo y jerga

In [5]:
# Cargamos el pipeline de análisis de sentimiento con el modelo entrenado en español.
# El modelo 'finiteautomata/beto-sentiment-analysis' está fine-tuneado para detectar sentimiento positivo/negativo.
sentiment = pipeline("sentiment-analysis", model="finiteautomata/beto-sentiment-analysis")

# Definimos una lista de frases que incluyen sarcasmo y jerga
frases_experimentales = [
    "¡Qué bien! Justo lo que quería, que se rompa el ordenador.",  # Sarcasmo
    "Sí, claro, soy millonario con este sueldo.",              # Sarcasmo
    "La fiesta estuvo brutal, ¡lo pasamos de diez!",          # Jerga (ej. España y otros lugares)
    "Ese chavo es muy buena onda.",                            # Jerga (ej. México)
    "Me da pereza salir hoy.",                                 # Jerga (ej. España)
    "Estoy re manija con este partido.",                       # Jerga (ej. Argentina/Uruguay)
    "Es una ganga, casi me regalan el coche.",                 # Sarcasmo
    "Tremendo quilombo armaron con el evento."                 # Jerga (ej. Argentina/Uruguay)
]

# Iteramos sobre cada frase y aplicamos el análisis de sentimiento
print("--- Análisis de Sentimiento (Sarcasmo y Jerga) ---")
for frase in frases_experimentales:
    # Aplicamos el pipeline a la frase. Devuelve una lista de diccionarios.
    resultado = sentiment(frase)
    # Imprimimos la frase original y el resultado del análisis (etiqueta y score)
    print(f"'{frase}' -> {resultado}")
    # Pausa opcional para facilitar la lectura
    # import time
    # time.sleep(0.5)

Device set to use cpu


--- Análisis de Sentimiento (Sarcasmo y Jerga) ---
'¡Qué bien! Justo lo que quería, que se rompa el ordenador.' -> [{'label': 'POS', 'score': 0.9816330671310425}]
'Sí, claro, soy millonario con este sueldo.' -> [{'label': 'POS', 'score': 0.991821825504303}]
'La fiesta estuvo brutal, ¡lo pasamos de diez!' -> [{'label': 'NEG', 'score': 0.9989134073257446}]
'Ese chavo es muy buena onda.' -> [{'label': 'POS', 'score': 0.9987834095954895}]
'Me da pereza salir hoy.' -> [{'label': 'NEG', 'score': 0.9993433356285095}]
'Estoy re manija con este partido.' -> [{'label': 'POS', 'score': 0.9781509637832642}]
'Es una ganga, casi me regalan el coche.' -> [{'label': 'POS', 'score': 0.9964009523391724}]
'Tremendo quilombo armaron con el evento.' -> [{'label': 'NEG', 'score': 0.9992637038230896}]


2° - Resumen de un fragmento de Wikipedia

In [6]:
# Cargamos el pipeline de resumen con el modelo multi-idioma.
# 'csebuetnlp/mT5_multilingual_XLSum' es un modelo bueno para resumir en varios idiomas, incluyendo español.
summarizer = pipeline(
    "summarization",
    model="csebuetnlp/mT5_multilingual_XLSum",
    tokenizer="csebuetnlp/mT5_multilingual_XLSum"
)

# Fragmento de un artículo de Wikipedia (ejemplo: sobre la inteligencia artificial)
texto_wikipedia = """
La inteligencia artificial (IA) es el campo de la ciencia de la computación dedicado a resolver problemas
cognitivos comúnmente asociados a la inteligencia humana, como el aprendizaje, la resolución de problemas
y el reconocimiento de patrones. La IA se divide en diferentes subcampos, como el aprendizaje automático,
el procesamiento del lenguaje natural, la visión artificial y la robótica.
El aprendizaje automático se centra en el desarrollo de algoritmos que permiten a las computadoras
aprender de datos sin ser programadas explícitamente. Las redes neuronales son un tipo de algoritmo
de aprendizaje automático que se inspira en la estructura del cerebro humano.
El procesamiento del lenguaje natural (PLN) se ocupa de la interacción entre las computadoras y el lenguaje
humano. Esto incluye tareas como la traducción automática, el análisis de sentimientos, la extracción de información
y la generación de texto.
La visión artificial permite a las computadoras "ver" e interpretar imágenes y videos. Se utiliza en
aplicaciones como el reconocimiento facial, la detección de objetos y la conducción autónoma.
La robótica se centra en la creación de robots capaces de realizar tareas de forma autónoma. A menudo
combina elementos de los otros subcampos de la IA.
La IA tiene un amplio rango de aplicaciones en diversos sectores, incluyendo la salud, las finanzas, la educación,
el transporte y el entretenimiento. A pesar de sus avances, la IA también presenta desafíos éticos y sociales,
como la privacidad de los datos, el sesgo algorítmico y el impacto en el empleo.
"""

# Aplicamos el pipeline de resumen. Experimentamos con la longitud máxima y mínima del resumen.
print("\n--- Resumen de Texto (Fragmento de Wikipedia) ---")
# max_length: número máximo de tokens en el resumen generado
# min_length: número mínimo de tokens en el resumen generado
# do_sample=False: Desactiva el muestreo para generar el resumen más probable
resumen_generado = summarizer(texto_wikipedia, max_length=100, min_length=30, do_sample=False)

# El resultado es una lista, extraemos el texto del resumen del primer elemento.
print(resumen_generado[0]['summary_text'])

# Puedes probar a cambiar los valores de max_length y min_length
# resumen_generado_corto = summarizer(texto_wikipedia, max_length=50, min_length=15, do_sample=False)
# print("\n--- Resumen Corto ---")
# print(resumen_generado_corto[0]['summary_text'])

Device set to use cpu



--- Resumen de Texto (Fragmento de Wikipedia) ---
La inteligencia artificial (IA) es el campo de la computación dedicado a resolver problemas cognitivos comúnmente asociados al cerebro humano.


3° - Traducción de texto

In [7]:
# Cargamos el pipeline de traducción de español a inglés.
# 'Helsinki-NLP/opus-mt-es-en' es un modelo entrenado por el grupo de investigación de Helsinki.
translator = pipeline("translation", model="Helsinki-NLP/opus-mt-es-en")

# Definimos una lista de textos para traducir, incluyendo ejemplos técnicos y posiblemente poéticos/figurados.
textos_a_traducir = [
    "La arquitectura de red neuronal convolucional ha demostrado ser eficaz en tareas de visión artificial.", # Técnico
    "El algoritmo de retropropagación ajusta los pesos de la red neuronal.",                             # Técnico
    "En la vasta llanura del tiempo, las horas son gotas de rocío.",                                     # Poético/Figurado
    "El alma que habla por los ojos, también puede besar con la mirada.",                                 # Poético/Figurado (Gustavo Adolfo Bécquer)
    "Más vale pájaro en mano que ciento volando."                                                        # Refrán/Idioma
]

# Iteramos sobre cada texto y aplicamos la traducción
print("\n--- Traducción a Inglés ---")
for texto in textos_a_traducir:
    # Aplicamos el pipeline de traducción
    traduccion = translator(texto)
    # Imprimimos el texto original y la traducción
    print(f"Original: '{texto}'")
    print(f"Traducción: '{traduccion[0]['translation_text']}'")
    # Pausa opcional
    # time.sleep(1)


Device set to use cpu



--- Traducción a Inglés ---
Original: 'La arquitectura de red neuronal convolucional ha demostrado ser eficaz en tareas de visión artificial.'
Traducción: 'Convolutional neural network architecture has proven to be effective in artificial vision tasks.'
Original: 'El algoritmo de retropropagación ajusta los pesos de la red neuronal.'
Traducción: 'The retropropagation algorithm adjusts the weights of the neural network.'
Original: 'En la vasta llanura del tiempo, las horas son gotas de rocío.'
Traducción: 'In the vast plain of time, the hours are drops of dew.'
Original: 'El alma que habla por los ojos, también puede besar con la mirada.'
Traducción: 'The soul that speaks by the eyes, can also kiss with the look.'
Original: 'Más vale pájaro en mano que ciento volando.'
Traducción: 'Better bird in hand than a hundred flying.'


4° - Generación de texto con diferentes estilos

In [8]:
# Cargamos el pipeline de generación de texto con un modelo tipo GPT en español.
# 'PlanTL-GOB-ES/gpt2-base-bne' es un modelo GPT2 base fine-tuneado para español por el PlanTL-GOB-ES.
generator = pipeline("text-generation", model="PlanTL-GOB-ES/gpt2-base-bne")

# Definimos prompts iniciales que sugieren un estilo formal o informal
prompts_estilo = [
    "Estimado/a colega,",                       # Sugiere estilo formal
    "Estimados señores y señoras,",             # Sugiere estilo formal
    "Hola,",                                    # Sugiere estilo informal
    "Che, ¿cómo andás?",                        # Sugiere estilo informal (jerga)
    "Buenas tardes,"                            # Estilo neutral/semi-formal
]

print("\n--- Generación de Texto (Intentando guiar estilo) ---")
for prompt in prompts_estilo:
    print(f"\n--- Prompt: '{prompt}' ---")
    # Generamos texto a partir del prompt. Limitamos la longitud para que no sea demasiado largo.
    # num_return_sequences=1: Generamos solo una secuencia por prompt.
    resultado_generacion = generator(prompt, max_length=50, num_return_sequences=1)
    # Imprimimos el texto generado.
    print(resultado_generacion[0]['generated_text'])
    # Pausa opcional
    # time.sleep(1.5)


Device set to use cpu
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Both `max_new_tokens` (=256) and `max_length`(=51) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)



--- Generación de Texto (Intentando guiar estilo) ---

--- Prompt: 'Estimado/a colega,' ---


Both `max_new_tokens` (=256) and `max_length`(=51) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Estimado/a colega, no, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo duro, no voy a entrar en lo

--- Prompt: 'Estimados señores y señoras,' ---


Both `max_new_tokens` (=256) and `max_length`(=51) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Estimados señores y señoras, 

--- Prompt: 'Hola,' ---


Both `max_new_tokens` (=256) and `max_length`(=51) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Hola, me puedes poner tu fecha, es decir, me. 

--- Prompt: 'Che, ¿cómo andás?' ---


Both `max_new_tokens` (=256) and `max_length`(=51) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Che, ¿cómo andás? bueno, ya sé que en la vida hay muchos que no entienden lo que es la fama, pero... 

--- Prompt: 'Buenas tardes,' ---
Buenas tardes, ¿Qué tal? 
