# Capitulo 1 - Modelos de Transformers

## Transformers, o que eles podem fazer?

### Trabalhando com pipelines

O objeto mais básico da library Transformers é a função `pipeline()`. Ela instancia o modelo desejado (no exemplo abaixo, usamos o modelo de de análise de sentimento) e aplica os pré-processamentos e pós-processamentos cabíveis a ele

In [4]:
from transformers import pipeline

classifier = pipeline("sentiment-analysis")
classifier("I've been waiting for a HuggingFace course my whole life.")

No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision 714eb0f (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.
Device set to use cpu


[{'label': 'POSITIVE', 'score': 0.9598049521446228}]

Podemos até mesmo processar múltiplias sentenças!

In [5]:
classifier(
    [
        "I've been waiting for a HuggingFace course my whole life.", 
        "I hate this so much!"
    ]
)

[{'label': 'POSITIVE', 'score': 0.9598049521446228},
 {'label': 'NEGATIVE', 'score': 0.9994558691978455}]

Por padrão, esse pipeline seleciona um modelo pré-treinado que foi ajustado (*fine-tuned*) para análise de sentimentos em Inglês. Ao instanciar o objeto `classifier`, esse modelo é baixado e mantido localmente (*cached model*), evitando que nas próximas chamadas esse *download* seja feito novamente.

Quando enviamos sentenças para a pipeline, estão envolvidos três passos principais

1. O texto é pré-processado em um formato que o modelo possa entender
2. As entradas pré-processadas são enviados ao modelo
3. As predições do modelo são pós-processadas, para que você possa interpretá-las

## Pipelines disponíveis para diferentes modalidades

A função `pipeline()` dar suporte a outras modalidades além de texto, bem como imagem, áudio e combinações delas (*multimodal*).

> A lista completa de quais delas podem ser exploradas se encontra em [🤗 Transformers documentation](https://huggingface.co/docs/hub/en/models-tasks)

De forma geral, abaixo estão os modelos agrupados por modalidade, que podem ser passados como parâmetro para pipeline

Pipelines de texto
- `text-generation`: gerar texto de um prompt
- `text-classification`: classificar o text em categorias pré-definidas
- `summarization`: criar uma versão resumida de um texto, preservando informações importantes
- `translation`: traduzir texto de um idioma para o outro
- `zero-shot-classification`: classificar o texto sem treinamento prévio em rótulos específicos
- `featurue-extration`: extrair representação vetorial de texto