In [1]:
#Laura Sofia Medina
#Laura Alejandra Barrera 

In [2]:
!pip install datasets evaluate transformers[sentencepiece] --quiet


In [3]:
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu --quiet


In [4]:
import torch
from transformers import pipeline

In [5]:
#Análisis de Sentimientos

In [35]:
classifier = pipeline("sentiment-analysis", model="pysentimiento/robertuito-sentiment-analysis")

resultado = classifier("Me encanta el clima soleado.")
print(resultado)

Device set to use cpu


[{'label': 'POS', 'score': 0.9688300490379333}]


In [36]:
resultado = classifier("Este servicio es terrible, no lo recomiendo en absoluto.")
print(resultado)

[{'label': 'NEG', 'score': 0.9765346050262451}]


In [37]:
resultado = classifier("El informe se entregará mañana. No lo olvides")
print(resultado)

[{'label': 'NEU', 'score': 0.814404308795929}]


In [9]:
#Zero-Shot Classification (Clasificación de texto en categorías)

In [38]:
classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")

resultado = classifier(
    "El cambio climático es un problema global que requiere acciones inmediatas.",
    candidate_labels=["medio ambiente", "tecnología", "salud",'entretenimiento'],
    hypothesis_template="Este texto trata sobre {}."
)
print(resultado)

Device set to use cpu


{'sequence': 'El cambio climático es un problema global que requiere acciones inmediatas.', 'labels': ['medio ambiente', 'entretenimiento', 'tecnología', 'salud'], 'scores': [0.9210784435272217, 0.03742522373795509, 0.0213615782558918, 0.020134741440415382]}


In [11]:
#Generación de texto 

In [44]:
generator = pipeline("text-generation", model="DeepESP/gpt2-spanish")

resultado = generator(
    "En este curso aprenderás sobre procesamiento de lenguaje natural, por lo que",
    max_length=50,
    num_return_sequences=2
)

print(resultado)

Device set to use cpu
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.


[{'generated_text': 'En este curso aprenderás sobre procesamiento de lenguaje natural, por lo que podrás disfrutar de un empleo. A partir de ahora, podrás disfrutar más allá del mundo físico y a partir del trabajo. A partir del trabajo y de la amistad. Una vez que'}, {'generated_text': 'En este curso aprenderás sobre procesamiento de lenguaje natural, por lo que las personas no deben usar su propia jerga con frecuencia. \n\nComo en nuestro segundo año aquí, somos tan competentes. Sabemos que debemos aprender a usar los genes: información genética'}]


In [13]:
resultado = generator(
    "La inteligencia artificial está transformando",
    max_length=50,
    num_return_sequences=2
)
print(resultado)

[{'generated_text': 'La inteligencia artificial está transformando su capacidad de razonar las estructuras mentales existentes? En un concepto particular, los conceptos morales no son comprendidos. Cuando consideramos que los principios morales eran esenciales para la práctica, la validez de la naturaleza ética cambia la realidad y la'}, {'generated_text': 'La inteligencia artificial está transformando en ficción material. Las experiencias físicas recientes y técnicas de la inteligencia artificial han proporcionado tales conocimientos técnicos. La observación como el resultado de una exploración en el espacio, la investigación de los orígenes de la evolución, la tecnología de la'}]


In [40]:
resultado = generator(
    "En el futuro, los robots serán capaces de: ",
    max_length=100,
)
print(resultado)

[{'generated_text': 'En el futuro, los robots serán capaces de: ^^^^^^^a no será fácil. La cosa no tiene solución. \n\n—Y, por tanto, lo que les dará la respuesta la respuesta automática: \n\n—Lo que es seguro es: un ser humano muerto. Un ser humano muerto no puede vivir más que en un mundo en el que las leyes son infinitas… Hasta ahora no han pasado sin un fin. \n\n—Pero ¿con qué derecho? \n'}]


In [16]:
#Completar el texto con la palabra más probable (Fill-Mask)

In [17]:
unmasker = pipeline("fill-mask", model="dccuchile/bert-base-spanish-wwm-cased")

resultado = unmasker("Este curso enseña sobre modelos [MASK].", top_k=3)

print(resultado)

BertForMaskedLM has generative capabilities, as `prepare_inputs_for_generation` is explicitly overwritten. However, it doesn't directly inherit from `GenerationMixin`. From 👉v4.50👈 onwards, `PreTrainedModel` will NOT inherit from `GenerationMixin`, and this model will lose the ability to call `generate` and other related functions.
  - If you are the owner of the model architecture code, please modify your model class such that it inherits from `GenerationMixin` (after `PreTrainedModel`, otherwise you'll get an exception).
  - If you are not the owner of the model architecture class, please contact the model code owner to update it.
Device set to use cpu


[{'score': 0.08100215345621109, 'token': 3792, 'token_str': 'sociales', 'sequence': 'Este curso enseña sobre modelos sociales.'}, {'score': 0.06293947249650955, 'token': 6156, 'token_str': 'económicos', 'sequence': 'Este curso enseña sobre modelos económicos.'}, {'score': 0.027612948790192604, 'token': 3, 'token_str': '[UNK]', 'sequence': 'Este curso enseña sobre modelos.'}]


In [18]:
resultado = unmasker("El clima en la montaña es muy [MASK].", top_k=3)
print(resultado)

[{'score': 0.19103224575519562, 'token': 22339, 'token_str': 'húmedo', 'sequence': 'El clima en la montaña es muy húmedo.'}, {'score': 0.1390262395143509, 'token': 7789, 'token_str': 'agradable', 'sequence': 'El clima en la montaña es muy agradable.'}, {'score': 0.12316220253705978, 'token': 7286, 'token_str': 'frío', 'sequence': 'El clima en la montaña es muy frío.'}]


In [19]:
resultado = unmasker("El [MASK] es una rama de las matemáticas.", top_k=3)
print(resultado)

[{'score': 0.7116380333900452, 'token': 9823, 'token_str': 'cálculo', 'sequence': 'El cálculo es una rama de las matemáticas.'}, {'score': 0.06353506445884705, 'token': 4266, 'token_str': 'análisis', 'sequence': 'El análisis es una rama de las matemáticas.'}, {'score': 0.03623092547059059, 'token': 21403, 'token_str': 'cómputo', 'sequence': 'El cómputo es una rama de las matemáticas.'}]


In [20]:
#Identificar nombres propios en un texto (Entidades) 

In [41]:
ner = pipeline("ner", model="mrm8488/bert-spanish-cased-finetuned-ner", grouped_entities=True)
resultado = ner("Me llamo Laura y trabajo en una farmacia en Madrid.")
print(resultado)


Some weights of the model checkpoint at mrm8488/bert-spanish-cased-finetuned-ner were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Device set to use cpu
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


[{'entity_group': 'PER', 'score': np.float32(0.99841666), 'word': 'Laura', 'start': 9, 'end': 14}, {'entity_group': 'LOC', 'score': np.float32(0.99990034), 'word': 'Madrid', 'start': 44, 'end': 50}]


In [22]:
resultado = ner("Google anunció una nueva actualización de su sistema operativo.")
print(resultado)

[{'entity_group': 'ORG', 'score': np.float32(0.99937135), 'word': 'Google', 'start': 0, 'end': 6}]


In [23]:
resultado = ner("La Segunda Guerra Mundial terminó en 1945.")
print(resultado)

[{'entity_group': 'MISC', 'score': np.float32(0.9958806), 'word': 'Segunda Guerra Mundial', 'start': 3, 'end': 25}]


In [24]:
#Extraer respuestas a preguntas en un contexto dado (Question Answering)

In [25]:
qa = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-large-bne-sqac")

resultado = qa(
    question="¿Cuál es la capital de Francia?",
    context="Francia es un país de Europa. Su capital es París."
)
print(resultado)

Device set to use cpu


{'score': 0.9999936819076538, 'start': 44, 'end': 49, 'answer': 'París'}


In [26]:
resultado = qa(
    question="¿Cuándo se fundó Google?",
    context="Google fue fundado en 1998 por Larry Page y Sergey Brin. Es una de las empresas más importantes del mundo."
)
print(resultado)

{'score': 0.9096104502677917, 'start': 19, 'end': 26, 'answer': 'en 1998'}


In [27]:
resultado = qa(
    question="¿Qué edad tiene Juan?",
    context="Juan nació en 1990. Hoy es el año 2025."
)
print(resultado)

{'score': 0.998665452003479, 'start': 14, 'end': 18, 'answer': '1990'}


In [28]:
#Resumen de Texto

In [29]:
summarizer = pipeline("summarization", model="csebuetnlp/mT5_multilingual_XLSum")

texto = """
La inteligencia artificial (IA) está transformando rápidamente el mundo en el que vivimos. 
En el sector salud, los algoritmos de IA permiten diagnósticos más precisos y tratamientos personalizados.
Por ejemplo, sistemas de aprendizaje profundo analizan imágenes médicas para detectar enfermedades como el cáncer en etapas tempranas.

En el ámbito educativo, plataformas adaptativas utilizan IA para personalizar el aprendizaje según las necesidades de cada estudiante, mejorando su rendimiento académico.
En el transporte, los vehículos autónomos impulsados por IA prometen reducir los accidentes de tráfico y optimizar el flujo del tráfico. 
Empresas como Tesla y Waymo lideran este campo, aunque aún existen desafíos técnicos y regulatorios. 
Sin embargo, la IA también plantea preocupaciones, como la pérdida de empleos debido a la automatización y los riesgos asociados con la privacidad de los datos.

Además, la ética en la IA es un tema crucial. Los sistemas de IA pueden perpetuar sesgos si no se diseñan adecuadamente, lo que podría llevar a decisiones injustas en áreas como la contratación o los préstamos. 
Por ello, es esencial que los desarrolladores y reguladores trabajen juntos para garantizar que la IA se utilice de manera responsable y equitativa.
"""

resultado = summarizer(texto)

print(resultado)

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565
Device set to use cpu


[{'summary_text': 'La inteligencia artificial (IA) está transformando rápidamente el mundo en el que vivimos.'}]


In [30]:
#Traducción de texto

In [42]:

translator = pipeline("translation", model="Helsinki-NLP/opus-mt-es-en")

resultado = translator("Tres tristes tigres comen trigo en un trigal.")

print(resultado)

Device set to use cpu


[{'translation_text': 'Three sad tigers eat wheat in a trigal.'}]


In [32]:
resultado = translator("La red neuronal convolucional es utilizada en el procesamiento de imágenes.")
print(resultado)

[{'translation_text': 'The convolutional neural network is used in image processing.'}]


In [33]:
resultado = translator("Estar en las nubes.")
print(resultado)

[{'translation_text': 'Being in the clouds.'}]


In [34]:
resultado = translator("El cambio climático es un problema global que requiere la cooperación de todos los países para ser resuelto.")
print(resultado)

[{'translation_text': 'Climate change is a global problem that requires the cooperation of all countries to be resolved.'}]
