# Detecção de Objetos

*Detecção de objetos* é uma forma de pesquisa visual computacional em que um modelo de machine learning é treinado para classificar instâncias individuais de objetos em uma imagem e indicar uma *caixa delimitadora* que marca a localização delas. Pense nisso como um avanço da *classificação de imagem* (em que o modelo responde à pergunta "o que tem nessa imagem?") para criar soluções em que podemos questionar ao modelo "quais objetos estão nessa imagem e onde eles se encontram?".

![Um robô identificando uma fruta](./images/object-detection.jpg)

Por exemplo, uma mercearia pode usar um modelo de detecção de objetos para implementar um sistema automatizado de finalização de compra que examina uma esteira rolante usando uma câmera e identifica itens específicos, sem a necessidade de colocar cada um deles sobre a esteira e escaneá-los individualmente.

O serviço cognitivo de **Visão Personalizada** do Microsoft Azure oferece uma solução baseada em nuvem para criar e publicar modelos personalizados de detecção de objetos.

## Criar um recurso de Visão Personalizada

Para usar o serviço de Visão Personalizada, é preciso ter um recurso do Azure que você possa usar para treinar um modelo, e um recurso com o qual possa publicá-lo para os aplicativos utilizarem. Você pode usar o mesmo recurso para as duas tarefas, ou recorrer a recursos diferentes para alocar os custos separadamente, desde que ambos sejam criados na mesma região. Esses recursos podem ser gerais dos **Serviços Cognitivos** ou específicos de **Visão Personalizada**. Use as instruções a seguir para criar um novo recurso de **Visão personalizada** (ou use um recurso existente, caso já tenha um).

1. Em uma nova guia do navegador, abra o portal do Azure em [https://portal.azure.com](https://portal.azure.com) e conecte-se usando a conta Microsoft associada à sua assinatura do Azure.
2. Selecione o botão **&#65291;Criar um recurso**, procure a opção *Visão personalizada* e crie um recurso de **Visão personalizada** com as seguintes configurações:
    - **Opções de criação**: Ambos
    - **Assinatura**: *sua assinatura do Azure*
    - **Grupo de recursos**: *Selecione ou crie um grupo de recursos com um nome exclusivo*
    - **Nome**: *Insira um nome exclusivo*
    - **Local de treinamento**: *Escolha qualquer região disponível*
    - **Tipo de preço de treinamento**: F0
    - **Local de previsão**: *o mesmo que o local de treinamento*
    - **Tipo de preço de previsão **: F0

    >**Observação**: se você já tiver um serviço de visão personalizada F0 na sua assinatura, selecione **S0** nesse.

3. Aguarde até o recurso ser criado.

## Criar um projeto de Visão Personalizada

Para treinar um modelo de detecção de objetos, é necessário criar um projeto de Visão Personalizada com base no seu recurso de treinamento. Para isso, você usará o portal Visão Personalizada.

1. Em uma nova guia do navegador, abra o portal de Visão Personalizada em [https://customvision.ai](https://customvision.ai) e conecte-se usando a conta Microsoft associada à sua assinatura do Azure.
2. Crie um novo projeto com as seguintes configurações:
    - **Nome**: detecção de mercadorias
    - **Descrição**: detecção de objetos para mercearias.
    - **Recurso**: *o recurso de Visão Personalizada que você criou anteriormente*
    - **Tipos de projeto**: Detecção de Objetos
    - **Domínios**: Geral
3. Aguarde até o projeto ser criado e aberto no navegador.

## Adicionar e marcar imagens

Para treinar um modelo de detecção de objetos, é preciso fazer upload de imagens que contenham as classes que você quer que o modelo identifique e marcá-las para indicar as caixas delimitadoras de cada instância do objeto.

1. Faça download e extraia as imagens de treinamento em https://aka.ms/fruit-objects. A pasta extraída contém uma coleção de imagens de frutas. **Observação:** como uma solução alternativa temporária, caso você não consiga acessar as imagens de treinamento, acesse https://www.github.com e depois https://aka.ms/fruit-objects. 
2. No portal Visão personalizada [https://customvision.ai](https://customvision.ai), garanta que esteja trabalhando em sua detecção de objeto project _Grocery Detection_. Em seguida, selecione **Adicionar imagens** e faça upload de todas as imagens da pasta extraída.

![Faça o upload das imagens baixadas clicando em Adicionar imagens.](./images/fruit-upload.jpg)

3. Depois que as imagens tiverem sido carregadas, selecione a primeira delas para abrir.
4. Mantenha o mouse sobre qualquer objeto da imagem até que uma região detectada automaticamente seja exibida, como na imagem abaixo. Em seguida, selecione o objeto e, se necessário, redimensione a região para envolvê-lo.

![A região padrão de um objeto](./images/object-region.jpg)

Outra opção é simplesmente arrastar o cursor ao redor de um objeto para criar uma região.

5. Quando a região envolver o objeto, adicione uma nova marca com o tipo de objeto apropriado (*maçã*, *banana* ou *laranja*), como mostrado aqui:

![Um objeto marcado em uma imagem](./images/object-tag.jpg)

6. Selecione e marque os outros objetos da imagem, redimensionando as regiões e adicionando novas marcas conforme o necessário.

![Dois objetos marcados em uma imagem](./images/object-tags.jpg)

7. Use o link **>** à direita para ir para a próxima imagem e marcar os objetos encontrados nela. Continue trabalhando em toda a coleção de imagens, marcando todas as maçãs, bananas e laranjas.

8. Quando terminar de marcar a última imagem, feche o editor de **Detalhes da imagem** e, na página **Imagens de treinamento**, na seção **Marcas**, selecione **Marcadas** para ver todas as suas imagens com marcações:

![Imagens marcadas em um projeto](./images/tagged-images.jpg)

## Treinar e testar um modelo

Agora que já marcou as imagens do projeto, você está pronto para treinar um modelo.

1. No projeto de Visão Personalizada, clique em **Treinar** para treinar um modelo de detecção de objetos usando as imagens com marcas. Selecione a opção **Treinamento rápido**.
2. Aguarde a conclusão do treinamento (o processo pode levar dez minutos ou mais) e, em seguida, analise as métricas de desempenho *Precisão*, *Recall* e *mAP* – elas medem a precisão da previsão do modelo de classificação e devem ser altas.
3. No canto superior direito da página, clique em **Teste rápido**. Em seguida, na caixa **URL da imagem**, insira `https://aka.ms/apple-orange` e veja a precisão que será gerada. Depois, feche a janela de **Teste rápido**.

## Publicar e consumir o modelo de detecção de objetos

Agora você está pronto para publicar seu modelo treinado e usá-lo em um aplicativo cliente.

1. No canto superior esquerdo da página **Desempenho**, clique em **&#128504; Publicar** para publicar o modelo treinado com as seguintes configurações:
    - **Nome do modelo**: detecção de frutas
    - **Recurso de previsão**: *seu recurso de **previsão de** Visão Personalizada*.

### (!) Verificação 
Você usou o mesmo nome do modelo: **detecção de frutas**? 

2. Depois de publicar, clique no ícone de *configurações* (&#9881;) no canto superior direito da página de **Desempenho** para visualizar as configurações do projeto. Na seção **Geral** (à esquerda), copie a **ID do projeto**. Role para baixo e cole-o na célula de código debaixo da etapa 5, substituindo **YOUR_PROJECT_ID**. 

> (*Se você tiver usado um recurso dos **Serviços Cognitivos** em vez de criar um recurso de **Visão Personalizada** no início deste exercício, poderá copiar a chave e o ponto de extremidade correspondentes no lado direito das configurações do projeto, colar esses dados na célula de código abaixo e executá-la para ver os resultados. Caso contrário, continue concluindo as etapas abaixo para obter a chave e o ponto de extremidade do seu recurso de previsão de Visão Personalizada*).

3. No canto superior esquerdo da página **Configurações do projeto**, clique no ícone das *Galeria de projetos* (&#128065;) para voltar à página inicial do portal de Visão Personalizada, onde seu projeto estará listado agora.

4. Na página inicial do portal de Visão Personalizada, no canto superior direito, clique no ícone de *configurações* (&#9881;) para visualizar as configurações do seu serviço de Visão Personalizada. Depois, na seção **Recursos**, expanda o recurso de *previsão* (<u>não</u> o de treinamento) e copie os valores correspondentes de **Chave** e **Ponto de extremidade** na célula de código abaixo da etapa 5, substituindo **YOUR_KEY** e **YOUR_ENDPOINT**.

### (!) Verificação 
Caso esteja usando um recurso de **Visão Personalizada**, você usou o recurso de **previsão** (<u>não</u> o de treinamento)?

5. Execute a célula de código abaixo clicando no botão Executar célula <span>&#9655;</span> (no canto superior esquerdo) para definir as variáveis como os valores de ID do projeto, chave e ponto de extremidade.

In [None]:
project_id = 'YOUR_PROJECT_ID' # Replace with your project ID
cv_key = 'YOUR_KEY' # Replace with your prediction resource primary key
cv_endpoint = 'YOUR_ENDPOINT' # Replace with your prediction resource endpoint

model_name = 'detect-produce' # this must match the model name you set when publishing your model iteration exactly (including case)!
print('Ready to predict using model {} in project {}'.format(model_name, project_id))

Agora você pode usar sua chave e ponto de extremidade com um cliente de Visão Personalizada para se conectar ao modelo de detecção de objetos de visão personalizada.

Execute a célula de código abaixo, que usa o seu modelo para detectar itens de hortifruti individuais em uma imagem.

> **Observação**: Não se preocupe muito com os detalhes do código. Ele usa o SDK do Python para o serviço de Visão Personalizada para enviar uma imagem para o seu modelo e recuperar previsões de objetos detectados. Cada previsão consiste em um nome de classe (*maçã*, *banana* ou *laranja*) e coordenadas de uma *caixa delimitadora* que indicam onde o objeto previsto foi detectado na imagem. O código usa essas informações para traçar uma caixa rotulada ao redor de cada objeto da imagem.

In [None]:
from azure.cognitiveservices.vision.customvision.prediction import CustomVisionPredictionClient
from msrest.authentication import ApiKeyCredentials
from matplotlib import pyplot as plt
from PIL import Image, ImageDraw, ImageFont
import numpy as np
import os
%matplotlib inline

# Load a test image and get its dimensions
test_img_file = os.path.join('data', 'object-detection', 'produce.jpg')
test_img = Image.open(test_img_file)
test_img_h, test_img_w, test_img_ch = np.array(test_img).shape

# Get a prediction client for the object detection model
credentials = ApiKeyCredentials(in_headers={"Prediction-key": cv_key})
predictor = CustomVisionPredictionClient(endpoint=cv_endpoint, credentials=credentials)

print('Detecting objects in {} using model {} in project {}...'.format(test_img_file, model_name, project_id))

# Detect objects in the test image
with open(test_img_file, mode="rb") as test_data:
    results = predictor.detect_image(project_id, model_name, test_data)

# Create a figure to display the results
fig = plt.figure(figsize=(8, 8))
plt.axis('off')

# Display the image with boxes around each detected object
draw = ImageDraw.Draw(test_img)
lineWidth = int(np.array(test_img).shape[1]/100)
object_colors = {
    "apple": "lightgreen",
    "banana": "yellow",
    "orange": "orange"
}
for prediction in results.predictions:
    color = 'white' # default for 'other' object tags
    if (prediction.probability*100) > 50:
        if prediction.tag_name in object_colors:
            color = object_colors[prediction.tag_name]
        left = prediction.bounding_box.left * test_img_w 
        top = prediction.bounding_box.top * test_img_h 
        height = prediction.bounding_box.height * test_img_h
        width =  prediction.bounding_box.width * test_img_w
        points = ((left,top), (left+width,top), (left+width,top+height), (left,top+height),(left,top))
        draw.line(points, fill=color, width=lineWidth)
        plt.annotate(prediction.tag_name + ": {0:.2f}%".format(prediction.probability * 100),(left,top), backgroundcolor=color)
plt.imshow(test_img)


Veja as previsões resultantes, que mostram os objetos detectados e a probabilidade de cada previsão.