# Trabajando con pipelines de Hugging Face

Los [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) son la forma más sencilla de utilizar modelos ya pre-entrenados.


Soporta muchas funciones muy comunes como:

**Text**:
* Sentiment analysis: clasificar un texto dado por ejemplo diciendo si es toxico o no.
* Text generation (in English): generar texto dando un input concreto.
* Name entity recognition (NER): etiquetar cada palabra con una entidad que la representa como por ejemplo persona, fecha, localización, ...
* Question answering: extraer una respuesta de un contexto dado, dado un contexto y una pregunta.
* Fill-mask: rellenar un espacio en blanco dentro de un texto.
* Summarization: generar resumenes de textos.
* Translation: traducir texto a otro lenguaje.

**Image**:
* Image classification: clasificar una imagen
* Image segmentation: clasificar cada pixel de una imagen.
* Object detection: detectar objetos en una imagen.

**Audio**:
* Audio classification: asignar una etiqueta a un fragmento de audio.
* Automatic speech recognition (ASR): transcribir audio a texto.

<Tip>

Para más detalles sobre [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) and sus tareas asociadas, puedes hacer clic [aqui](https://huggingface.co/docs/transformers/main/en/./main_classes/pipelines).

</Tip>




## Instalar librerías

En el siguiente código vemos como instalar las librerías necesarias para que llevar a cabo determinadas funcionalidades relacionadas con la Inteligencia Artificial.

In [None]:
#asegurarse que en la configuración del cuaderno está activada la GPU (para generación de imágenes)

!pip install torch
!pip install tensorflow
!pip install transformers
!pip install diffusers --upgrade
!pip install invisible_watermark accelerate safetensors

#reiniciar entorno después de instalarlas (Entorno de ejecución --> Reiniciar entorno de ejecución)

Defaulting to user installation because normal site-packages is not writeable
Collecting torch
  Downloading torch-2.5.1-cp312-cp312-win_amd64.whl.metadata (28 kB)
Collecting filelock (from torch)
  Downloading filelock-3.16.1-py3-none-any.whl.metadata (2.9 kB)
Collecting networkx (from torch)
  Downloading networkx-3.4.2-py3-none-any.whl.metadata (6.3 kB)
Collecting fsspec (from torch)
  Downloading fsspec-2024.10.0-py3-none-any.whl.metadata (11 kB)
Collecting sympy==1.13.1 (from torch)
  Downloading sympy-1.13.1-py3-none-any.whl.metadata (12 kB)
Collecting mpmath<1.4,>=1.1.0 (from sympy==1.13.1->torch)
  Downloading mpmath-1.3.0-py3-none-any.whl.metadata (8.6 kB)
Downloading torch-2.5.1-cp312-cp312-win_amd64.whl (203.0 MB)
   ---------------------------------------- 0.0/203.0 MB ? eta -:--:--
   ---------------------------------------- 1.6/203.0 MB 12.0 MB/s eta 0:00:17
   - -------------------------------------- 5.8/203.0 MB 16.8 MB/s eta 0:00:12
   - -------------------------------

## Tareas comunes en IA utilizando pipeline

En primer lugar importo pipeline desde transformers

In [None]:
from transformers import pipeline

Construyo el clasificador como un pipeline. La utilización de pipeline será muy sencilla:


```python
inteligenciaArtificial = pipeline(task="<tarea>", model="<modelo a utilizar>")

```

*   **tarea** será la tarea que llevaremos a cabo;por ejemplo, text-generation, text-classification, audio-classification, ...
*   **modelo a utilizar** puedes utilizar cualquier modelo de https://huggingface.co/models

### Generar texto acorde

En este ejemplo veremos como generar texto acorde a una entrada, utilizaremos la tarea *text-generation* con el modelo *gpt2*

In [None]:
text_generator = pipeline(task="text-generation", model="gpt2")
texto1=text_generator("My name is Carlos Saenz Adan and I'm teaching IA")

print(texto1)

### Identificar imágenes

En primer lugar, lo que tengo que hacer es descargar una foto. En este caso es importante que se guarde con el nombre "gato.jpg" para que funcione el resto del código.

In [None]:
from google.colab import files
#si utilizas chrome
#uploaded = files.upload()

#descarga directa
!wget -O ./gato.jpg https://st2.depositphotos.com/1814571/44220/i/1600/depositphotos_442208054-free-stock-photo-cute-sweet-little-gray-cat.jpg

Utilizaremos la tarea *image-classification* con el modelo *microsoft/beit-base-patch16-224-pt22k-ft22k*



In [None]:
classify_image = pipeline("image-classification", model="google/vit-base-patch16-224")
classify_image("gato.jpg")

### Preguntar sobre una imagen

In [None]:
picture_question = pipeline(task="visual-question-answering", model="dandelin/vilt-b32-finetuned-vqa")

In [None]:
picture_question(image="gato.jpg", question="is it the barcelona football team?")

In [None]:
picture_question(image="gato.jpg", question="is it the real madrid football team?")

In [None]:
picture_question(image="gato.jpg", question="is it an animal?")

In [None]:
picture_question(image="gato.jpg", question="is it a dog?")

In [None]:
picture_question(image="gato.jpg", question="is it a human?")

In [None]:
picture_question(image="gato.jpg", question="is it a human dressed as a cat?")

### Describir una imagen

In [None]:
clasificador = pipeline("image-to-text", model="Salesforce/blip-image-captioning-large")
texto1=clasificador("gato.jpg")

print(texto1[0]["generated_text"])

### Generar una imagen

Resource:
https://huggingface.co/segmind/SSD-1B

In [None]:
!pip install git+https://github.com/huggingface/diffusers

In [None]:
!pip install transformers accelerate safetensors

In [None]:
from diffusers import StableDiffusionXLPipeline
import torch
pipe = StableDiffusionXLPipeline.from_pretrained("segmind/SSD-1B", torch_dtype=torch.float16, use_safetensors=True, variant="fp16")
pipe.to("cuda")
# if using torch < 2.0
# pipe.enable_xformers_memory_efficient_attention()
prompt = "An astronaut riding a green horse" # Your prompt here
neg_prompt = "ugly, blurry, poor quality" # Negative prompt here
image = pipe(prompt=prompt, negative_prompt=neg_prompt).images[0]

In [None]:
image.save("image.jpeg") #guardo la imagen

In [None]:
prompt = "A computer science teacher inside a class with students" # Your prompt here
neg_prompt = "ugly, blurry, poor quality" # Negative prompt here
image = pipe(prompt=prompt, negative_prompt=neg_prompt).images[0]

In [None]:
image.save("image2.jpeg") #guardo la imagen