In [None]:
#Laura Sofia Medina
#Laura Alejandra Barrera 

In [1]:
!pip install datasets evaluate transformers[sentencepiece] --quiet


In [2]:
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu --quiet


In [3]:
import torch
from transformers import pipeline

In [4]:
#Análisis de Sentimientos

In [26]:
classifier = pipeline("sentiment-analysis", model="pysentimiento/robertuito-sentiment-analysis")

resultado = classifier("Me encanta el clima soleado de hoy.")
print(resultado)

Device set to use cpu


[{'label': 'POS', 'score': 0.9774495363235474}]


In [27]:
resultado = classifier("Este servicio es terrible, no lo recomiendo.")
print(resultado)

[{'label': 'NEG', 'score': 0.9755050539970398}]


In [28]:
resultado = classifier("El informe se entregará mañana.")
print(resultado)

[{'label': 'NEU', 'score': 0.8635683655738831}]


In [7]:
#Zero-Shot Classification (Clasificación de texto en categorías)

In [25]:
classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")

resultado = classifier(
    "El cambio climático es un problema global que requiere acciones inmediatas.",
    candidate_labels=["medio ambiente", "tecnología", "salud"],
    hypothesis_template="Este texto trata sobre {}."
)
print(resultado)

Device set to use cpu


{'sequence': 'El cambio climático es un problema global que requiere acciones inmediatas.', 'labels': ['medio ambiente', 'tecnología', 'salud'], 'scores': [0.9568902850151062, 0.022192124277353287, 0.020917586982250214]}


In [9]:
#Generación de texto 

In [33]:
generator = pipeline("text-generation", model="DeepESP/gpt2-spanish")

resultado = generator(
    "En este curso aprenderás sobre inteligencia artificial",
    max_length=50,
    num_return_sequences=2
)

print(resultado)

Device set to use cpu
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.


[{'generated_text': 'En este curso aprenderás sobre inteligencia artificial que todo eso te pertenece, te lo prometo, pero no es así. Cuando seas profesora, podrás aprender a elegir, a elegir, a elegir. \n\nEn ese momento, a lo primero de la tarde'}, {'generated_text': 'En este curso aprenderás sobre inteligencia artificial. En este momento te explicaré de dónde es el cerebro, porque así lo conocerás. En este mundo, el cerebro es el órgano del deseo y el sentimiento. Pero si ese sentido tiene su origen en algo'}]


In [34]:
resultado = generator(
    "La inteligencia artificial está transformando",
    max_length=50,
    num_return_sequences=2
)
print(resultado)

[{'generated_text': 'La inteligencia artificial está transformando a los humanos y a las civilizaciones primitivas. \n\nLos genes en nuestro entorno se basan no en la inteligencia artificial: en particular, la población individual. \n\nLos ordenadores no se basan únicamente en los ordenadores humanos y se'}, {'generated_text': 'La inteligencia artificial está transformando en energía y energía de una única persona de la cual todo es real, sin importar cuán profundamente haya en él y los efectos que ello sea. Cada segundo en que una persona se da cuenta de que ha sido destruida, la'}]


In [35]:
resultado = generator(
    "En el futuro, los robots podrán",
    max_length=50,
    num_return_sequences=2
)
print(resultado)

[{'generated_text': 'En el futuro, los robots podrán volver a la nave y volver a conectar el ordenador. \n\n—Muy bien. \n\n—Adiós, señora McFatey. \n\n—Adiós, Robert, Adiós. Adiós, señora McFate'}, {'generated_text': 'En el futuro, los robots podrán controlarte, pero si estás con la mujer, entonces será tu destino. \n\n—¿Cómo? —murmuró. \n\n—Lo mejor es que, a pesar de todo, tengáis razón. \n\n*'}]


In [7]:
generator = pipeline("text-generation", model="DeepESP/gpt2-spanish")

resultado = generator(
    "En este curso aprenderás sobre inteligencia artificial",
)
print(resultado)

Device set to use cpu


[{'generated_text': 'En este curso aprenderás sobre inteligencia artificial, y cómo aprenderás sobre las "realidad mental" cuando estas nuevas creencias te la hagan. Las creencias no serán nunca usadas por hombres como la "vida libre" o la "realidad humana". Por'}]


In [12]:
#Completar el texto con la palabra más probable (Fill-Mask)

In [36]:
unmasker = pipeline("fill-mask", model="dccuchile/bert-base-spanish-wwm-cased")

resultado = unmasker("Este curso enseña sobre modelos [MASK].", top_k=3)

print(resultado)

Device set to use cpu


[{'score': 0.08100215345621109, 'token': 3792, 'token_str': 'sociales', 'sequence': 'Este curso enseña sobre modelos sociales.'}, {'score': 0.06293947249650955, 'token': 6156, 'token_str': 'económicos', 'sequence': 'Este curso enseña sobre modelos económicos.'}, {'score': 0.027612948790192604, 'token': 3, 'token_str': '[UNK]', 'sequence': 'Este curso enseña sobre modelos.'}]


In [37]:
resultado = unmasker("El clima en la montaña es muy [MASK].", top_k=3)
print(resultado)

[{'score': 0.19103224575519562, 'token': 22339, 'token_str': 'húmedo', 'sequence': 'El clima en la montaña es muy húmedo.'}, {'score': 0.1390262395143509, 'token': 7789, 'token_str': 'agradable', 'sequence': 'El clima en la montaña es muy agradable.'}, {'score': 0.12316220253705978, 'token': 7286, 'token_str': 'frío', 'sequence': 'El clima en la montaña es muy frío.'}]


In [38]:
resultado = unmasker("El [MASK] es una rama de las matemáticas.", top_k=3)
print(resultado)

[{'score': 0.7116380333900452, 'token': 9823, 'token_str': 'cálculo', 'sequence': 'El cálculo es una rama de las matemáticas.'}, {'score': 0.06353506445884705, 'token': 4266, 'token_str': 'análisis', 'sequence': 'El análisis es una rama de las matemáticas.'}, {'score': 0.03623092547059059, 'token': 21403, 'token_str': 'cómputo', 'sequence': 'El cómputo es una rama de las matemáticas.'}]


In [14]:
#Identificar nombres propios en un texto (Entidades) 

In [39]:
ner = pipeline("ner", model="mrm8488/bert-spanish-cased-finetuned-ner", grouped_entities=True)
resultado = ner("Me llamo Pedro y trabajo en Telefónica en Madrid.")
print(resultado)

Some weights of the model checkpoint at mrm8488/bert-spanish-cased-finetuned-ner were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Device set to use cpu
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


[{'entity_group': 'PER', 'score': np.float32(0.9989525), 'word': 'Pedro', 'start': 9, 'end': 14}, {'entity_group': 'ORG', 'score': np.float32(0.90264404), 'word': 'Telefónica', 'start': 28, 'end': 38}, {'entity_group': 'LOC', 'score': np.float32(0.9998223), 'word': 'Madrid', 'start': 42, 'end': 48}]


In [40]:
resultado = ner("Google anunció una nueva actualización de su sistema operativo.")
print(resultado)

[{'entity_group': 'ORG', 'score': np.float32(0.99937135), 'word': 'Google', 'start': 0, 'end': 6}]


In [41]:
resultado = ner("La Segunda Guerra Mundial terminó en 1945.")
print(resultado)

[{'entity_group': 'MISC', 'score': np.float32(0.9958806), 'word': 'Segunda Guerra Mundial', 'start': 3, 'end': 25}]


In [17]:
#Extraer respuestas a preguntas en un contexto dado (Question Answering)

In [42]:
qa = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-large-bne-sqac")

resultado = qa(
    question="¿Cuál es la capital de Francia?",
    context="Francia es un país de Europa. Su capital es París."
)
print(resultado)

Device set to use cpu


{'score': 0.9999936819076538, 'start': 44, 'end': 49, 'answer': 'París'}


In [43]:
resultado = qa(
    question="¿Cuándo se fundó Google?",
    context="Google fue fundado en 1998 por Larry Page y Sergey Brin. Es una de las empresas más importantes del mundo."
)
print(resultado)

{'score': 0.9096104502677917, 'start': 19, 'end': 26, 'answer': 'en 1998'}


In [48]:
resultado = qa(
    question="¿Qué edad tiene Juan?",
    context="Juan nació en 1990. Hoy es el año 2025."
)
print(resultado)

{'score': 0.998665452003479, 'start': 14, 'end': 18, 'answer': '1990'}


In [19]:
#Resumen de Texto

In [50]:
summarizer = pipeline("summarization", model="csebuetnlp/mT5_multilingual_XLSum")

texto = """
La inteligencia artificial (IA) está transformando rápidamente el mundo en el que vivimos. 
En el sector salud, los algoritmos de IA permiten diagnósticos más precisos y tratamientos personalizados.
Por ejemplo, sistemas de aprendizaje profundo analizan imágenes médicas para detectar enfermedades como el cáncer en etapas tempranas.

En el ámbito educativo, plataformas adaptativas utilizan IA para personalizar el aprendizaje según las necesidades de cada estudiante, mejorando su rendimiento académico.
En el transporte, los vehículos autónomos impulsados por IA prometen reducir los accidentes de tráfico y optimizar el flujo del tráfico. 
Empresas como Tesla y Waymo lideran este campo, aunque aún existen desafíos técnicos y regulatorios. 
Sin embargo, la IA también plantea preocupaciones, como la pérdida de empleos debido a la automatización y los riesgos asociados con la privacidad de los datos.

Además, la ética en la IA es un tema crucial. Los sistemas de IA pueden perpetuar sesgos si no se diseñan adecuadamente, lo que podría llevar a decisiones injustas en áreas como la contratación o los préstamos. 
Por ello, es esencial que los desarrolladores y reguladores trabajen juntos para garantizar que la IA se utilice de manera responsable y equitativa.
"""

resultado = summarizer(texto)

print(resultado)

Device set to use cpu


[{'summary_text': 'La inteligencia artificial (IA) está transformando rápidamente el mundo en el que vivimos.'}]


In [21]:
#Traducción de texto

In [51]:

translator = pipeline("translation", model="Helsinki-NLP/opus-mt-es-en")

resultado = translator("Este curso es producido por Hugging Face.")

print(resultado)

Device set to use cpu


[{'translation_text': 'This course is produced by Hugging Face.'}]


In [52]:
resultado = translator("La red neuronal convolucional es utilizada en el procesamiento de imágenes.")
print(resultado)

[{'translation_text': 'The convolutional neural network is used in image processing.'}]


In [53]:
resultado = translator("Estar en las nubes.")
print(resultado)

[{'translation_text': 'Being in the clouds.'}]


In [54]:
resultado = translator("El cambio climático es un problema global que requiere la cooperación de todos los países para ser resuelto.")
print(resultado)

[{'translation_text': 'Climate change is a global problem that requires the cooperation of all countries to be resolved.'}]
