# Usando Pipelines - Hugging Face


Esse notebook possui diversos Pipelines prontos para uso. Antes de cada uso, existe uma explicação de qual é sua utilidade.


*   A **função pipeline** é a função mais básica do Transformers - conectando um modelo com as etapas de pré e pós processamento, ela permite que tenhamos um resultado de processamento de texto em poucas linhas.

*   Todas as pipelines estão ajustadas para entradas de texto **em inglês**.


---


*Esse notebook foi modificado a partir do notebook disponibilizado pelo curso de NLP do Hugging Face, disponibilizado aqui: https://huggingface.co/learn/nlp-course/chapter1/3?fw=pt . Adicionamos comentários e modificamos os textos a serem processados.*


In [None]:
# Essa linha instala as bibliotecas de Transformers, Datasets e Evaluate.
# Ela deve ser executada primeiro. Depois de executá-la, você pode escolher qual dos pipelines deseja executar.

!pip install datasets evaluate transformers[sentencepiece]

Pipeline de Classificação de Sentimentos

In [None]:
#Essa pipeline faz a classificação de sentimentos em uma sentença.
#Dessa maneira, a frase é classificada como positiva ou negativa, de 0 a 1.
#Portanto, se ela é classificada como POSITIVE, 0 é pouco positiva e 1 é muito positiva.
#Da mesma maneira, se é classificada como NEGATIVE, 0 é pouco negativa e 1 é muito negativa.

from transformers import pipeline

classifier = pipeline("sentiment-analysis")
classifier("I love to learn about Transformers!")

In [None]:
#Podemos, também, classificar mais de uma frase ao mesmo tempo.
#Basta colocá-las entre colchetes [], separadas por vírgulas.

classifier(
    ["I wish this pipeline was in portuguese", "But ok, I'll learn anyways."]
)

Pipeline de Zero Shot Classification


In [None]:
#Zeroshot Classification é quando a pipeline avalia o quanto aqueles rótulos podem classificar o texto.
#Ela faz essa classificação do zero, sem que seja necessário fazer o fine-tuning de um modelo com dados para utilizá-lo.
#Assim como nos casos anteriores, ela traz um número que classifica o quanto aqueles rótulos classificam o texto,
#E essa pontuação vai de 0 (a menor) a 1 (a maior).

from transformers import pipeline

classifier = pipeline("zero-shot-classification")
classifier(
    "Sometimes I think about Maria do Bairro and how this telenovela impacted brazilian girls in the 90's",
    candidate_labels=["telenovela", "economics", "Brazil"],
)

Pipeline de Geração de Texto

In [None]:
#Agora uma das funções mais em alta atualmente: a geração de texto.
#Aqui o texto é gerado a partir do prompt, de maneira aleatória.

from transformers import pipeline

generator = pipeline("text-generation")
generator("I think philosophy is...")

In [None]:
#Nessa linha, começamos a importar um modelo do Hugging Face - no caso, o "distilgpt2".
#É possível também delimitar o tamanho máximo da resposta (max_lenght);
#e o número máximo de sequências de frases (num_return_sequences).

from transformers import pipeline

generator = pipeline("text-generation", model="distilgpt2")
generator(
    "I think philosophy is...",
    max_length=25,
    num_return_sequences=2,
)

Pipeline de Preenchimento

In [None]:
#Esse pipeline chamado "Fill-mask" preenche os espaços em branco na frase indicada.
#Em "top_k" você consegue definir quantas possibilidades quer que sejam mostradas.
#Atenção: aqui a palavra para a máscara é <mask>, mas diferentes modelos podem ter máscaras distintas.

from transformers import pipeline

unmasker = pipeline("fill-mask")
unmasker("My favorite philosopher is <mask>, because he is very smart.", top_k=2)

Pipeline de Reconhecimento de Entidades Nomeadas

In [None]:
#Temos nessa pipeline a NER, Named Entity Recognition.
#Ela reconhece quais partes do texto correspondem a entidades como nomes (PER), organizações (ORG) ou lugares (LOC).

from transformers import pipeline

ner = pipeline("ner", grouped_entities=True)
ner("My name is Maria, and I live in the Bairro, working for Televisa.")

Pipeline de Resposta

In [None]:
#Pipeline de Question Answering, isto é, que responde às perguntas.
#Ela não gera conteúdo novo - a "question" é respondida com base no "contexto".

from transformers import pipeline

question_answerer = pipeline("question-answering")
question_answerer(
    question="Where do I study?",
    context="My name is Maria and I am now studying the Transformers pipelines in the Hugging Face website. I sure recommend it.",
)

Pipeline de Sumarização

In [None]:
#Essa pipeline faz a sumarização do texto indicado.
#Isto é, ela reduz um texto maior a um texto menor, mantendo as informações principais.
#Sim, o texto é a introdução da Crítica da Razão Pura, de Kant :)

from transformers import pipeline

summarizer = pipeline("summarization")
summarizer(
    """

Whether the treatment of that portion of our knowledge which lies within the province of pure reason advances with that undeviating certainty which characterizes the progress of science,
we shall be at no loss to determine. If we find those who are engaged in metaphysical pursuits, unable to come to an understanding as to the method which they ought to follow; if we find them,
after the most elaborate preparations, invariably brought to a stand before the goal is reached, and compelled to retrace their steps and strike into fresh paths, we may then feel quite sure that
they are far from having attained to the certainty of scientific progress and may rather be said to be merely groping about in the dark. In these circumstances we shall render an important service
to reason if we succeed in simply indicating the path along which it must travel, in order to arrive at any results- even if it should be found necessary to abandon many of those aims which, without
reflection, have been proposed for its attainment.
That logic has advanced in this sure course, even from the earliest times, is apparent from the fact that, since Aristotle, it has been unable to advance a step and, thus, to all appearance has reached
its completion. For, if some of the moderns have thought to enlarge its domain by introducing psychological discussions on the mental faculties, such as imagination and wit, metaphysical, discussions.
on the origin of knowledge and the different kinds of certitude, according to the difference of the objects (idealism, scepticism, and so on), or anthropological discussions on prejudices, their causes
and remedies: this attempt, on the part of these authors, only shows their ignorance of the peculiar nature of logical science. We do not enlarge but disfigure the sciences when we lose sight of their
respective limits and allow them to run into one another. Now logic is enclosed within limits which admit of perfectly clear definition; it is a science which has for its object nothing but the exposition
and proof of the formal laws of all thought, whether it be a priori or empirical, whatever be its origin or its object, and whatever the difficulties- natural or accidental- which it encounters in the human mind.

"""
)

Pipeline de Tradução

In [None]:
#O último pipeline é de tradução.
#Para escolher o modelo de base para tradução, o melhor modo é procurar por "translation_en_to_fr" como task name em modelos no Hugging Face.
#Link: https://huggingface.co/models


from transformers import pipeline

translator = pipeline("translation", model="Helsinki-NLP/opus-mt-fr-en")
translator("Oh, je veux dire, tu voulais du portugais ! Pourquoi est-ce que je lis en français ??")