# Trabajando con pipelines de Hugging Face

Los [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) son la forma más sencilla de utilizar modelos ya pre-entrenados. 


Soporta muchas funciones muy comunes como:

**Text**:
* Sentiment analysis: clasificar un texto dado por ejemplo diciendo si es toxico o no. 
* Text generation (in English): generar texto dando un input concreto. 
* Name entity recognition (NER): etiquetar cada palabra con una entidad que la representa como por ejemplo persona, fecha, localización, ...
* Question answering: extraer una respuesta de un contexto dado, dado un contexto y una pregunta. 
* Fill-mask: rellenar un espacio en blanco dentro de un texto. 
* Summarization: generar resumenes de textos. 
* Translation: traducir texto a otro lenguaje. 

**Image**:
* Image classification: clasificar una imagen
* Image segmentation: clasificar cada pixel de una imagen. 
* Object detection: detectar objetos en una imagen. 

**Audio**:
* Audio classification: asignar una etiqueta a un fragmento de audio. 
* Automatic speech recognition (ASR): transcribir audio a texto. 

<Tip>

Para más detalles sobre [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) and sus tareas asociadas, puedes hacer clic [aqui](https://huggingface.co/docs/transformers/main/en/./main_classes/pipelines).

</Tip>




## Instalar librerías

En el siguiente código vemos como instalar las librerías necesarias para que llevar a cabo determinadas funcionalidades relacionadas con la Inteligencia Artificial.

In [1]:
# Transformers installation
!pip install transformers
# To install from source instead of the last release, comment the command above and uncomment the following one.
#!pip install git+https://github.com/huggingface/transformers.git

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting transformers
  Downloading transformers-4.24.0-py3-none-any.whl (5.5 MB)
[K     |████████████████████████████████| 5.5 MB 8.8 MB/s 
Collecting tokenizers!=0.11.3,<0.14,>=0.11.1
  Downloading tokenizers-0.13.2-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (7.6 MB)
[K     |████████████████████████████████| 7.6 MB 44.3 MB/s 
[?25hCollecting huggingface-hub<1.0,>=0.10.0
  Downloading huggingface_hub-0.11.0-py3-none-any.whl (182 kB)
[K     |████████████████████████████████| 182 kB 50.6 MB/s 
Installing collected packages: tokenizers, huggingface-hub, transformers
Successfully installed huggingface-hub-0.11.0 tokenizers-0.13.2 transformers-4.24.0


In [2]:
!pip install torch
!pip install tensorflow

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


## Tareas comunes en IA utilizando pipeline

En primer lugar importo pipeline desde transformers

In [3]:
from transformers import pipeline

La utilización de pipeline será muy sencilla:

```python
inteligenciaArtificial = pipeline(task="<tarea>", model="<modelo a utilizar>")

```



*   **tarea** será la tarea que llevaremos a cabo;por ejemplo, text-generation, text-classification, audio-classification, ...
*   **modelo a utilizar** puedes utilizar cualquier modelo de https://huggingface.co/models





### Generar texto acorde

En este ejemplo veremos como generar texto acorde a una entrada, utilizaremos la tarea *text-generation* con el modelo *gpt2*

In [None]:
text_generator = pipeline(task="text-generation", model="gpt2")
texto1=text_generator("My name is Carlos Saenz Adan and I'm teaching IA")

print(texto1)

Downloading:   0%|          | 0.00/665 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/548M [00:00<?, ?B/s]

KeyboardInterrupt: ignored

### Frases positivas/negativas

En el siguiente ejemplo se verá como identificar si una frase se podría considerar buying o no. Utilizaremos la tarea *text-classification* y el modelo *JonatanGk/roberta-base-bne-finetuned-cyberbullying-spanish*. En este caso el modelo nos permite utilizar el castellano. 

In [None]:
text_classificator = pipeline("text-classification", model='JonatanGk/roberta-base-bne-finetuned-cyberbullying-spanish')


Downloading:   0%|          | 0.00/911 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/499M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.12k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/851k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/509k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.46M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/772 [00:00<?, ?B/s]

For more than one sentence, pass a list of sentences to the [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) which returns a list of dictionaries:

In [None]:
frases = ["Estamos muy contentos de mostrarte la libreria Transformers", 
          "Tienes la nariz demasiado grande para esa cara",
          "Erase una vez un hombre a una nariz pegada.",
          "¿Por qué no te mueres?",
          "Érase un hombre a una nariz pegado, érase una nariz superlativa"]
results = text_classificator(frases)

i=0
for result in results:
  print(frases[i])
  print(result['score'])
  print()
  i = i+1


Estamos muy contentos de mostrarte la libreria Transformers
0.9995750784873962

Tienes la nariz demasiado grande para esa cara
0.9655522704124451

Erase una vez un hombre a una nariz pegada.
0.9984070658683777

¿Por qué no te mueres?
0.9912983179092407

Érase un hombre a una nariz pegado, érase una nariz superlativa
0.9994046688079834



### Identificar imágenes

En primer lugar, lo que tengo que hacer es descargar una foto. En este caso es importante que se guarde con el nombre "gato.jpg" para que funcione el resto del código. 

In [None]:
from google.colab import files
#si utilizas chrome
#uploaded = files.upload()

#descarga directa
!wget -O ./gato.jpg https://st2.depositphotos.com/1814571/44220/i/1600/depositphotos_442208054-free-stock-photo-cute-sweet-little-gray-cat.jpg

Utilizaremos la tarea *image-classification* con el modelo 

1.   Elemento de lista
2.   Elemento de lista

*microsoft/beit-base-patch16-224-pt22k-ft22k*

In [None]:
classify_image = pipeline("image-classification", "microsoft/beit-base-patch16-224-pt22k-ft22k")
classify_image("gato.jpg")

### Preguntar sobre una imagen

In [None]:
picture_question = pipeline(task="visual-question-answering", model="dandelin/vilt-b32-finetuned-vqa")

#picture_question(image="gato.jpg", question="how many people are there?")
picture_question(image="gato.jpg", question="is it a football team?")

In [None]:
picture_question(image="gato.jpg", question="is it the barcelona football team?")


In [None]:
picture_question(image="gato.jpg", question="is it the real madrid football team?")


In [None]:
picture_question(image="gato.jpg", question="is it an animal?")


In [None]:
picture_question(image="gato.jpg", question="is it a cat?")


### Conversaciones

In [5]:
from transformers import Conversation

Construiremos el pipeline para la conversacion utilizando el modelo *facebook/blenderbot-400M-distill*

In [6]:
conversational_pipeline = pipeline("conversational", model="facebook/blenderbot-400M-distill")

Downloading:   0%|          | 0.00/1.57k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/730M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.15k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/127k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/62.9k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/16.0 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/772 [00:00<?, ?B/s]

Ahora comenzaremos a conversar, en primer lugar indicaremos una frase de inicio, y veremos qué contesta. 

In [8]:
conv1_start = "user: Hey my name is Carlos! How are you?"
print(conv1_start)

responses = list()
conv1 = Conversation(conv1_start, generated_responses=responses)
conversational_pipeline(conv1)
conv1.mark_processed()
print(f"bot: {responses[-1]}")

#aniado un nuevo input
user_answer = "fine! I'm working"
print("user: "+user_answer)

conv1.add_user_input(user_answer)
conversational_pipeline(conv1)
conv1.mark_processed()
print(f"bot: {responses[-1]}")

user: Hey my name is Carlos! How are you?
bot:  Hi Carl! I'm doing well, how are you doing? I'm Carl.
user: fine! I'm working
bot:  What do you do for a living? I work at a grocery store as a cashier.
