ü§ó Transformadores
Aprendizado de m√°quina de √∫ltima gera√ß√£o para PyTorch, TensorFlow e JAX.

ü§ó Transformers fornece APIs e ferramentas para baixar e treinar facilmente modelos pr√©-treinados de √∫ltima gera√ß√£o. O uso de modelos pr√©-treinados pode reduzir os custos de computa√ß√£o, a pegada de carbono e economizar tempo e recursos necess√°rios para treinar um modelo do zero. Esses modelos suportam tarefas comuns em diferentes modalidades, como:

üìù Processamento de linguagem natural: classifica√ß√£o de texto, reconhecimento de entidade nomeada, resposta a perguntas, modelagem de linguagem, resumo, tradu√ß√£o, m√∫ltipla escolha e gera√ß√£o de texto.
üñºÔ∏è Vis√£o Computacional: classifica√ß√£o de imagens, detec√ß√£o de objetos e segmenta√ß√£o.
üó£Ô∏è √Åudio: reconhecimento autom√°tico de fala e classifica√ß√£o de √°udio.
üêô Multimodal: resposta a perguntas em tabelas, reconhecimento √≥ptico de caracteres, extra√ß√£o de informa√ß√µes de documentos digitalizados, classifica√ß√£o de v√≠deos e resposta visual a perguntas.

ü§ó Os transformadores suportam interoperabilidade de estrutura entre PyTorch, TensorFlow e JAX. Isto proporciona flexibilidade para utilizar uma estrutura diferente em cada fase da vida de um modelo; treinar um modelo em tr√™s linhas de c√≥digo em uma estrutura e carreg√°-lo para infer√™ncia em outra. Os modelos tamb√©m podem ser exportados para um formato como ONNX e TorchScript para implanta√ß√£o em ambientes de produ√ß√£o.

In [None]:

! pip install transformers datasets


# Rapido tour

Comece a trabalhar com ü§ó Transformers! Seja voc√™ um desenvolvedor ou um usu√°rio comum, este tour r√°pido ajudar√° voc√™ a come√ßar e mostrar√° como usar o [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/ pipelines#transformers.pipeline) para infer√™ncia, carregue um modelo pr√©-treinado e um pr√©-processador com uma [AutoClass](https://huggingface.co/docs/transformers/main/en/./model_doc/auto) e treine rapidamente um modelo com PyTorch ou TensorFlow.


Antes de come√ßar, certifique-se de ter todas as bibliotecas necess√°rias instaladas:

```bash
!pip instala conjuntos de dados de transformadores
```

Voc√™ tamb√©m precisar√° instalar sua estrutura de aprendizado de m√°quina preferida:

```bash
pip instalar tensorflow
```

## Pipeline

O [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) √© a maneira mais f√°cil e r√°pida de usar um modelo pr√©-treinado para infer√™ncia. Voc√™ pode usar o [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) pronto para uso para muitas tarefas em diferentes modalidades, algumas das quais que s√£o mostrados na tabela abaixo:

<Dica>

Para obter uma lista completa de tarefas dispon√≠veis, confira a [refer√™ncia da API do pipeline](https://huggingface.co/docs/transformers/main/en/./main_classes/pipelines).

</Tip>

| **Task**                     | **Description**                                                                                              | **Modality**    | **Pipeline identifier**                       |
|------------------------------|--------------------------------------------------------------------------------------------------------------|-----------------|-----------------------------------------------|
| Text classification          | assign a label to a given sequence of text                                                                   | NLP             | pipeline(task=‚Äúsentiment-analysis‚Äù)           |
| Text generation              | generate text given a prompt                                                                                 | NLP             | pipeline(task=‚Äútext-generation‚Äù)              |
| Summarization                | generate a summary of a sequence of text or document                                                         | NLP             | pipeline(task=‚Äúsummarization‚Äù)                |
| Image classification         | assign a label to an image                                                                                   | Computer vision | pipeline(task=‚Äúimage-classification‚Äù)         |
| Image segmentation           | assign a label to each individual pixel of an image (supports semantic, panoptic, and instance segmentation) | Computer vision | pipeline(task=‚Äúimage-segmentation‚Äù)           |
| Object detection             | predict the bounding boxes and classes of objects in an image                                                | Computer vision | pipeline(task=‚Äúobject-detection‚Äù)             |
| Audio classification         | assign a label to some audio data                                                                            | Audio           | pipeline(task=‚Äúaudio-classification‚Äù)         |
| Automatic speech recognition | transcribe speech into text                                                                                  | Audio           | pipeline(task=‚Äúautomatic-speech-recognition‚Äù) |
| Visual question answering    | answer a question about the image, given an image and a question                                             | Multimodal      | pipeline(task=‚Äúvqa‚Äù)                          |
| Document question answering  | answer a question about a document, given an image and a question                                            | Multimodal      | pipeline(task="document-question-answering")  |
| Image captioning             | generate a caption for a given image                                                                         | Multimodal      | pipeline(task="image-to-text")                |

Comece criando uma inst√¢ncia de [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) e especificando uma tarefa para a qual deseja us√°-lo. Neste guia, voc√™ usar√° o [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) para an√°lise de sentimento como exemplo:

In [None]:
from transformers import pipeline

classifier = pipeline("sentiment-analysis")

O [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) baixa e armazena em cache um [modelo pr√©-treinado](https://huggingface.co/distilbert) padr√£o -base-uncased-finetuned-sst-2-english) e tokenizer para an√°lise de sentimento. Agora voc√™ pode usar o `classificador` no seu texto de destino:

In [None]:
classifier("We are very happy to show you the ü§ó Transformers library.")

[{'label': 'POSITIVE', 'score': 0.9998}]

Se voc√™ tiver mais de uma entrada, passe suas entradas como uma lista para [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) para retornar uma lista de dicion√°rios:

In [None]:
results = classifier(["We are very happy to show you the ü§ó Transformers library.", "We hope you don't hate it."])
for result in results:
    print(f"label: {result['label']}, with score: {round(result['score'], 4)}")

label: POSITIVE, with score: 0.9998
label: NEGATIVE, with score: 0.5309

O [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) tamb√©m pode iterar em um conjunto de dados inteiro para qualquer tarefa que voc√™ desejar. Para este exemplo, vamos escolher o reconhecimento autom√°tico de fala como nossa tarefa:

In [None]:
import torch
from transformers import pipeline

speech_recognizer = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-base-960h")

Carregue um conjunto de dados de √°udio (consulte ü§ó Conjuntos de dados [In√≠cio r√°pido](https://huggingface.co/docs/datasets/quickstart#audio) para obter mais detalhes) que voc√™ gostaria de iterar. Por exemplo, carregue o conjunto de dados [MInDS-14](https://huggingface.co/datasets/PolyAI/minds14):

In [None]:
from datasets import load_dataset, Audio

dataset = load_dataset("PolyAI/minds14", name="en-US", split="train")

Voc√™ precisa ter certeza de que a taxa de amostragem do conjunto de dados corresponde √† amostragem
rate [`facebook/wav2vec2-base-960h`](https://huggingface.co/facebook/wav2vec2-base-960h) foi treinado em:

In [None]:
dataset = dataset.cast_column("audio", Audio(sampling_rate=speech_recognizer.feature_extractor.sampling_rate))

Voc√™ precisa ter certeza de que a taxa de amostragem do conjunto de dados corresponde √† amostragem
rate [`facebook/wav2vec2-base-960h`](https://huggingface.co/facebook/wav2vec2-base-960h) foi treinado em:

In [None]:
result = speech_recognizer(dataset[:4]["audio"])
print([d["text"] for d in result])

['I WOULD LIKE TO SET UP A JOINT ACCOUNT WITH MY PARTNER HOW DO I PROCEED WITH DOING THAT', "FONDERING HOW I'D SET UP A JOIN TO HELL T WITH MY WIFE AND WHERE THE AP MIGHT BE", "I I'D LIKE TOY SET UP A JOINT ACCOUNT WITH MY PARTNER I'M NOT SEEING THE OPTION TO DO IT ON THE APSO I CALLED IN TO GET SOME HELP CAN I JUST DO IT OVER THE PHONE WITH YOU AND GIVE YOU THE INFORMATION OR SHOULD I DO IT IN THE AP AN I'M MISSING SOMETHING UQUETTE HAD PREFERRED TO JUST DO IT OVER THE PHONE OF POSSIBLE THINGS", 'HOW DO I FURN A JOINA COUT']