In [None]:
# Laboratório 01 - Detecção de Objetos

- A depender do ambiente de execução, pode ser necessário instalar as dependências a seguir:

```
    %pip install transformers
    %pip install matplotlib
    %pip install inflect
    %pip install torch torchvision torchaudio
    %pip install timm
```

In [None]:
# Se necessário, execute os comandos de instalaçao neste bloco de código
# Talvez seja necessário reiniciar o kernel para encontrar as dependências

O modelo utilizado neste laboratório foi publicado com o artigo [End-to-End Object Detection with Transformers](https://arxiv.org/abs/2005.12872) de Carion et al. (2020)

In [None]:
from transformers import pipeline

Código auxiliar para ignorar alertas

In [None]:
from transformers.utils import logging
logging.set_verbosity_error()

Criando fluxo de deteção de objetos

In [None]:
od_pipe = pipeline("object-detection", model="facebook/detr-resnet-50")

Mais sobre o modelo: [facebook/detr-resnet-50](https://huggingface.co/facebook/detr-resnet-50)

Explore mais no [Hugging Face Hub para outros modelos](https://huggingface.co/models?pipeline_tag=object-detection&sort=trending)

### Use o detector

In [None]:
from PIL import Image

Abrindo a imagem

In [None]:
raw_image = Image.open('street.jpeg')

In [None]:
pipeline_output = od_pipe(raw_image)

Retorna o resultado do pipeline usando a função auxiliar `render_results_in_image`.

In [None]:
import io
import matplotlib.pyplot as plt

def render_results_in_image(in_pil_img, in_results):
    plt.figure(figsize=(16, 10))
    plt.imshow(in_pil_img)

    ax = plt.gca()

    for prediction in in_results:

        x, y = prediction['box']['xmin'], prediction['box']['ymin']
        w = prediction['box']['xmax'] - prediction['box']['xmin']
        h = prediction['box']['ymax'] - prediction['box']['ymin']

        ax.add_patch(plt.Rectangle((x, y),
                                   w,
                                   h,
                                   fill=False,
                                   color="green",
                                   linewidth=2))
        ax.text(
           x,
           y,
           f"{prediction['label']}: {round(prediction['score']*100, 1)}%",
           color='red'
        )

    plt.axis("off")

    # Save the modified image to a BytesIO object
    img_buf = io.BytesIO()
    plt.savefig(img_buf, format='png',
                bbox_inches='tight',
                pad_inches=0)
    img_buf.seek(0)
    modified_image = Image.open(img_buf)

    # Close the plot to prevent it from being displayed
    plt.close()

    return modified_image

In [None]:
processed_image = render_results_in_image(
    raw_image,
    pipeline_output)
processed_image

# Atividade de Laboratório

Explore mais sobre o a saída do pipeline e o modelo de deteção
- Que informação é retornada?
- Como se comporta com outras imagens?
- Quais aplicações possíveis? (mínimo de duas)

