# Trabajando con pipelines de Hugging Face

Los [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) son la forma más sencilla de utilizar modelos ya pre-entrenados.


Soporta muchas funciones muy comunes como:

**Text**:
* Sentiment analysis: clasificar un texto dado por ejemplo diciendo si es toxico o no.
* Text generation (in English): generar texto dando un input concreto.
* Name entity recognition (NER): etiquetar cada palabra con una entidad que la representa como por ejemplo persona, fecha, localización, ...
* Question answering: extraer una respuesta de un contexto dado, dado un contexto y una pregunta.
* Fill-mask: rellenar un espacio en blanco dentro de un texto.
* Summarization: generar resumenes de textos.
* Translation: traducir texto a otro lenguaje.

**Image**:
* Image classification: clasificar una imagen
* Image segmentation: clasificar cada pixel de una imagen.
* Object detection: detectar objetos en una imagen.

**Audio**:
* Audio classification: asignar una etiqueta a un fragmento de audio.
* Automatic speech recognition (ASR): transcribir audio a texto.

<Tip>

Para más detalles sobre [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) and sus tareas asociadas, puedes hacer clic [aqui](https://huggingface.co/docs/transformers/main/en/./main_classes/pipelines).

</Tip>




## Instalar librerías

En el siguiente código vemos como instalar las librerías necesarias para que llevar a cabo determinadas funcionalidades relacionadas con la Inteligencia Artificial.

In [None]:
#asegurarse que en la configuración del cuaderno está activada la GPU (para generación de imágenes)

!pip install torch
!pip install tensorflow
!pip install transformers
!pip install diffusers --upgrade
!pip install invisible_watermark accelerate safetensors

#reiniciar entorno después de instalarlas (Entorno de ejecución --> Reiniciar entorno de ejecución)



## Tareas comunes en IA utilizando pipeline

En primer lugar importo pipeline desde transformers

In [None]:
from transformers import pipeline

Construyo el clasificador como un pipeline. La utilización de pipeline será muy sencilla:


```python
inteligenciaArtificial = pipeline(task="<tarea>", model="<modelo a utilizar>")

```

*   **tarea** será la tarea que llevaremos a cabo;por ejemplo, text-generation, text-classification, audio-classification, ...
*   **modelo a utilizar** puedes utilizar cualquier modelo de https://huggingface.co/models

### Generar texto acorde

En este ejemplo veremos como generar texto acorde a una entrada, utilizaremos la tarea *text-generation* con el modelo *gpt2*

In [None]:
text_generator = pipeline(task="text-generation", model="gpt2")
texto1=text_generator("My name is Carlos Saenz Adan and I'm teaching IA")

print(texto1)

### Identificar imágenes

En primer lugar, lo que tengo que hacer es descargar una foto. En este caso es importante que se guarde con el nombre "gato.jpg" para que funcione el resto del código.

In [None]:
from google.colab import files
#si utilizas chrome
#uploaded = files.upload()

#descarga directa
!wget -O ./gato.jpg https://st2.depositphotos.com/1814571/44220/i/1600/depositphotos_442208054-free-stock-photo-cute-sweet-little-gray-cat.jpg

Utilizaremos la tarea *image-classification* con el modelo *microsoft/beit-base-patch16-224-pt22k-ft22k*



In [None]:
classify_image = pipeline("image-classification", model="google/vit-base-patch16-224")
classify_image("gato.jpg")

### Preguntar sobre una imagen

In [None]:
picture_question = pipeline(task="visual-question-answering", model="dandelin/vilt-b32-finetuned-vqa")

In [None]:
picture_question(image="gato.jpg", question="is it the barcelona football team?")

In [None]:
picture_question(image="gato.jpg", question="is it the real madrid football team?")

In [None]:
picture_question(image="gato.jpg", question="is it an animal?")

In [None]:
picture_question(image="gato.jpg", question="is it a dog?")

In [None]:
picture_question(image="gato.jpg", question="is it a human?")

In [None]:
picture_question(image="gato.jpg", question="is it a human dressed as a cat?")

[{'score': 0.9402719736099243, 'answer': 'no'},
 {'score': 0.603549063205719, 'answer': 'yes'},
 {'score': 0.009658824652433395, 'answer': 'cat'},
 {'score': 0.0014733534771949053, 'answer': 'no cat'},
 {'score': 0.001445657224394381, 'answer': 'unknown'}]

### Describir una imagen

In [None]:
clasificador = pipeline("image-to-text", model="Salesforce/blip-image-captioning-large")
texto1=clasificador("gato.jpg")

print(texto1[0]["generated_text"])

config.json:   0%|          | 0.00/4.60k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.88G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/527 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/711k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/125 [00:00<?, ?B/s]

preprocessor_config.json:   0%|          | 0.00/445 [00:00<?, ?B/s]



there is a cat that is laying down on a couch


### Generar una imagen

Resource:
https://huggingface.co/segmind/SSD-1B

In [None]:
!pip install git+https://github.com/huggingface/diffusers

Collecting git+https://github.com/huggingface/diffusers
  Cloning https://github.com/huggingface/diffusers to /tmp/pip-req-build-0tfzd7m7
  Running command git clone --filter=blob:none --quiet https://github.com/huggingface/diffusers /tmp/pip-req-build-0tfzd7m7
  Resolved https://github.com/huggingface/diffusers to commit 96c376a5ff201a31d676091a59a011c8c29d095b
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone


In [None]:
!pip install transformers accelerate safetensors



In [None]:
from diffusers import StableDiffusionXLPipeline
import torch
pipe = StableDiffusionXLPipeline.from_pretrained("segmind/SSD-1B", torch_dtype=torch.float16, use_safetensors=True, variant="fp16")
pipe.to("cuda")
# if using torch < 2.0
# pipe.enable_xformers_memory_efficient_attention()
prompt = "An astronaut riding a green horse" # Your prompt here
neg_prompt = "ugly, blurry, poor quality" # Negative prompt here
image = pipe(prompt=prompt, negative_prompt=neg_prompt).images[0]

Loading pipeline components...:   0%|          | 0/7 [00:00<?, ?it/s]

RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from http://www.nvidia.com/Download/index.aspx

In [None]:
image.save("image.jpeg") #guardo la imagen

In [None]:
prompt = "A computer science teacher inside a class with students" # Your prompt here
neg_prompt = "ugly, blurry, poor quality" # Negative prompt here
image = pipe(prompt=prompt, negative_prompt=neg_prompt).images[0]

In [None]:
image.save("image2.jpeg") #guardo la imagen

In [None]:
import os
import torch
from transformers import pipeline
import hashlib

# Función para que el usuario introduzca un animal
def introduceAnimal():
  animal = input("¿Que animal quieres buscar? (lion, cat, dog, snake, cow)").strip().lower()
  return animal

# Funcion que devuelve si la imagen es el animal puesto por el usuario o no
def esAnimal(imagen,animal):
  picture_question = pipeline(task="visual-question-answering", model="dandelin/vilt-b32-finetuned-vqa")
  resultado = picture_question(image=f"Imagenes/{imagen}", question=f"is it a {animal}?")
  return resultado[0]

# Función para calcular el hash de la imagen, evitando duplicados
def calcular_hash(imagen_path):
    with open(imagen_path, "rb") as f:
        contenido = f.read()
    return hashlib.md5(contenido).hexdigest()  # Usamos MD5 para el hash

# Función que procesa las imágenes en una carpeta
def buscarAnimal():
  # Ruta de la carpeta
  carpeta = "Imagenes"
  # Verificar si la carpeta existe
  if not os.path.exists(carpeta):
    print(f"La carpeta '{carpeta}' no existe. Crea una carpeta llamada 'Imagenes' con imagenes de animales")
  else:
    # Obtener las imágenes de la carpeta
    archivos = os.listdir(carpeta)

    animal= introduceAnimal()

    elementos = set()  # Para almacenar los nombres de las imágenes
    hashes = set()     # Para almacenar los hashes de las imágenes

    for imagen in archivos:
      ruta_imagen = os.path.join(carpeta, imagen)
      imagen_hash = calcular_hash(ruta_imagen)

      # Verificar si el hash ya fue procesado
      if imagen_hash not in hashes:
        hashes.add(imagen_hash)
        resultado = esAnimal(imagen, animal)
        if resultado['answer'] == 'yes' and resultado['score'] > 0.7:
          print(imagen, ": Cumple con las condiciones")
          elementos.add(imagen)
        else:
          print(imagen, ": No cumple con las condiciones")
    print("Los elementos encontrados son: ", elementos)

def main():
  buscarAnimal()


if __name__ == "__main__":
    main()

Archivos en la carpeta: 16
¿Que animal quieres buscar? (lion, cat, dog, snake, cow)lion


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


01-lion-populations-nationalgeographic_1777804.jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


Dairy_cow (1).jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


1.jpg : Cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


FELV-cat (1).jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


frisona.jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


KOA_Nassau_2697x1517.jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


shutterstock_26879694_2327358941_240415112130_800x800.jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


Golden+Retrievers+dans+pet+care.jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


download (1).jpg : Cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


Cat_November_2010-1a.jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


Cat03.jpg : No cumple con las condiciones


Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


download.jpg : No cumple con las condiciones
Los elementos encontrados son:  {'download (1).jpg', '1.jpg'}
