# Rilevamento degli oggetti

Il *rilevamento degli oggetti* è una forma di visione artificiale in cui viene eseguito il training di un modello di apprendimento automatico per classificare le singole istanze di oggetti in un'immagine e indicare un *riquadro delimitatore del testo* che contrassegna la sua posizione. Puoi considerarlo come una progressione dalla *classificazione delle immagini* (in cui il modello risponde alla domanda "cosa riguarda questa immagine?") allo sviluppo di soluzioni in cui possiamo chiedere al modello "che oggetti ci sono in questa immagine, e dove sono?".

![Un robot che identifica la frutta](./images/object-detection.jpg)

Ad esempio, un negozio di alimentari potrebbe utilizzare un modello di rilevamento degli oggetti per implementare un sistema di cassa automatizzato che scansiona un nastro trasportatore utilizzando una telecamera ed è in grado di identificare articoli specifici senza la necessità di posizionare ogni articolo sul nastro e scansionarlo individualmente.

Il servizio cognitivo **Visione personalizzata** in Microsoft Azure fornisce una soluzione basata su cloud per la creazione e la pubblicazione di modelli di rilevamento di oggetti personalizzati.

## Crea una risorsa Visione personalizzata

Per utilizzare il servizio Visione personalizzata, hai bisogno di una risorsa di Azure che puoi utilizzare per eseguire il training di un modello e una risorsa con la quale puoi pubblicarlo per usare le applicazioni. Puoi usare la stessa risorsa per ognuna di queste attività, o puoi usare risorse diverse per ognuna per allocare i costi separatamente, a condizione che entrambe le risorse siano create nella stessa area geografica. La risorsa per una (o entrambe) le attività può essere una risorsa generale di **Servizi cognitivi**, o una risorsa specifica di **Visione personalizzata**. Usa le istruzioni seguenti per creare una nuova risorsa **Visione personalizzata** (o puoi usare una risorsa esistente se ne hai una).

1. In una nuova scheda del browser, apri il portale Azure all'indirizzo [https://portal.azure.com](https://portal.azure.com) e accedi utilizzando l'account Microsoft associato alla tua sottoscrizione di Azure.
2. Seleziona il pulsante **&#65291;Crea una risorsa**, cerca *visione personalizzata* e crea una risorsa di **Visione personalizzata** con le impostazioni seguenti:
    - **Crea opzioni**: Entrambe
    - **Sottoscrizione**: *la tua sottoscrizione di Azure*
    - **Gruppo di risorse**: *Seleziona o crea un gruppo di risorse con un nome univoco*
    - **Nome**: *Immetti un nome univoco*
    - **Località training**: *Scegli una qualsiasi area disponibile*
    - **Piano tariffario training**: F0
    - **Località previsione**: *Lo stesso del percorso di training*
    - **Piano tariffario previsione**: F0

    > **Nota**: Se disponi già di un servizio di visione personalizzata F0 nella tua sottoscrizione, seleziona **S0**.

3. Attendi che la risorsa venga creata.

## Crea un progetto Visione personalizzata

Per eseguire il training di un modello di rilevamento degli oggetti, è necessario creare un progetto Visione personalizzata basato sulla risorsa di training. Per farlo, userai il portale Visione personalizzata.

1. In una nuova scheda del browser, apri il portale Visione personalizzata all'indirizzo [ https://customvision.ai](https://customvision.ai) e accedi utilizzando l'account Microsoft associato alla tua sottoscrizione di Azure.
2. Crea un nuovo progetto con le impostazioni seguenti:
    - **Nome**: Rilevamento alimentari
    - **Descrizione**: Rilevamento di oggetti per negozi di alimentari.
    - **Risorsa**: *La risorsa Visione personalizzata creata in precedenza*
    - **Tipi progetto**: Rilevamento degli oggetti
    - **Domini**: Generale
3. Attendi che il progetto venga creato e aperto nel browser.

## Aggiungi e aggiungi tag alle immagini

Per eseguire il training di un modello di rilevamento degli oggetti, è necessario caricare le immagini che contengono le classi che vuoi fare identificare dal modello e aggiungervi tag per indicare i riquadri delimitatori del testo per ogni istanza dell'oggetto.

1. Scaricare ed estrarre le immagini di training da https://aka.ms/fruit-objects. La cartella estratta contiene una raccolta di immagini di frutta. **Nota:** come soluzione temporanea, nel caso non sia possibile accedere alle immagini di training, passare a https://www.github.com e quindi a https://aka.ms/fruit-objects. 
2. Nel portale Visione personalizzata [https://customvision.ai](https://customvision.ai), verifica di trovarti nel tuo progetto di rilevamento oggetti _Grocery Detection_. Quindi seleziona **Aggiungi immagini** e carica tutte le immagini nella cartella estratta.

![Carica le immagini scaricate facendo clic su aggiungi immagini.](./images/fruit-upload.jpg)

3. Una volta che le immagini sono state caricate, seleziona la prima per aprirla.
4. Tieni il mouse sopra qualsiasi oggetto nell'immagine fino a quando viene visualizzata un'area geografica rilevata automaticamente come l'immagine seguente. Seleziona quindi l'oggetto e, se necessario, ridimensiona l'area geografica per circondarlo.

![L'area geografica predefinita di un oggetto](./images/object-region.jpg)

In alternativa, puoi semplicemente trascinare il mouse intorno all'oggetto per creare un'area geografica.

5. Quando l'area geografica circonda l'oggetto, aggiungi un nuovo tag con il tipo di oggetto appropriato (*mela*, *banana* o *arancia*) come mostrato qui:

![Un oggetto con tag in un'immagine](./images/object-tag.jpg)

6. Seleziona e aggiungi tag a ogni altro oggetto nell'immagine, ridimensionando le aree geografiche e aggiungendo nuovi tag come necessario.

![Due oggetti con tag in un'immagine](./images/object-tags.jpg)

7. Usa il link **>** sulla destra per passare all'immagine successiva e aggiungere un tag ai suoi oggetti. Poi continua a lavorare su tutta la raccolta di immagini, aggiungendo un tag a ogni mela, banana e arancia.

8. Quando hai finito di aggiungere tag all'ultima immagine, chiudi l'editor **Dettaglio immagine** e nella pagina **Immagini training**, in **Tag**, seleziona **Con tag** per vedere tutte le tue immagini con tag:

![Immagini con tag in un progetto](./images/tagged-images.jpg)

## Esegui il training e il test di un modello

Ora che hai aggiunto un tag alle immagini nel tuo progetto, è tutto pronto per eseguire il training di un modello.

1. Nel progetto Visione personalizzata, fai clic su **Esegui il training** per eseguire il training di un modello di rilevamento degli oggetti utilizzando le immagini con tag. Seleziona l'opzione **Training rapido**.
2. Attendi il completamento del training (potrebbe richiedere circa dieci minuti), quindi esamina le metriche di prestazione *Precisione*, *Richiamo*, e *AP*, che misurano l'accuratezza della previsione del modello di classificazione e dovrebbero essere tutte elevate.
3. In alto a destra della pagina, fai clic su **Test rapido** e poi nella casella **URL immagine**, inserisci `https://aka.ms/apple-orange` e visualizza la previsione che viene generata. Chiudi quindi la finestra **Test rapido**.

## Pubblica e consuma il modello di rilevamento degli oggetti

Ora è tutto pronto per pubblicare il tuo modello sottoposto a training e usarlo da un'applicazione client.

1. Nella parte in alto a sinistra della pagina **Prestazioni**, fai clic su **&#128504; Pubblica** per pubblicare il modello sottoposto a training con le seguenti impostazioni:
    - **Nome modello**: detect-produce
    - **Risorsa di previsione**: *La tua risorsa di **previsione** personalizzata*.

### (!) Verifica 
Hai usato lo stesso nome del modello: **detect-produce**? 

2. Dopo la pubblicazione, fai clic sull'icona delle *impostazioni * (&#9881;) in alto a destra della pagina **Prestazioni** per visualizzare le impostazioni del progetto. Quindi, in **Generali** (a sinistra), copia l'**ID progetto**. Scorri verso il basso e incollalo nella cella del codice sotto il passaggio 5 sostituendo **YOUR_PROJECT_ID**. 

> (*se hai usato una risorsa di **Servizi cognitivi** anziché creare una risorsa di **Visione personalizzata** all'inizio di questo esercizio, puoi copiare la sua chiave e l'endpoint dal lato destro delle impostazioni del progetto, incollarlo nella cella di codice di seguito, ed eseguirlo per vedere i risultati. Altrimenti, continua a completare i passaggi seguenti per ottenere la chiave e l'endpoint per la tua risorsa di previsione Visione personalizzata*).

3. In alto a sinistra della pagina **Impostazioni progetto**, fai clic sull'icona *Galleria progetti* (&#128065;) per tornare alla pagina iniziale del portale Visione personalizzata, dove adesso è elencato il tuo progetto.

4. Nella pagina iniziale del portale Visione personalizzata, in alto a destra, fai clic sull'icona delle *impostazioni* (&#9881;) per visualizzare le impostazioni del tuo servizio Visione personalizzata. Quindi, in **Risorse**, espandi la tua risorsa di *previsione* (<u>non</u> la risorsa di training) e copia i suoi valori **Chiave** ed **Endpoint** nella cella di codice sotto il passaggio 5, sostituendo **YOUR_KEY** e **YOUR_ENDPOINT**.

### (!) Verifica 
Se stai usando una risorsa **Visione personalizzata**, hai usato la risorsa di **previsione** (<u>non</u> la risorsa di training)?

5. Esegui la cella di codice di seguito facendo clic sul pulsante Esegui cella <span>&#9655;</span> (in alto a sinistra della cella) per impostare le variabili sui valori dell'ID del progetto, della chiave e dell'endpoint.

In [None]:
project_id = 'YOUR_PROJECT_ID' # Replace with your project ID
cv_key = 'YOUR_KEY' # Replace with your prediction resource primary key
cv_endpoint = 'YOUR_ENDPOINT' # Replace with your prediction resource endpoint

model_name = 'detect-produce' # this must match the model name you set when publishing your model iteration exactly (including case)!
print('Ready to predict using model {} in project {}'.format(model_name, project_id))

Ora puoi utilizzare la chiave e l'endpoint con un client di Visione personalizzata per connetterti al tuo modello di rilevamento degli oggetti.

Esegui la seguente cella di codice, che usa il tuo modello per rilevare i singoli articoli di produzione in un'immagine.

> **Nota**: Non preoccuparti troppo dei dettagli del codice. Utilizza l'SDK Python per il servizio Visione personalizzata per inviare un'immagine al tuo modello e recuperare le previsioni per gli oggetti rilevati. Ogni previsione consiste in un nome di classe (*mela*, *banana* o *arancia*) e in coordinate del *riquadro delimitatore del testo* che indicano il punto dell'immagine in cui l'oggetto previsto è stato rilevato. Il codice usa quindi queste informazioni per disegnare un riquadro etichettato intorno a ciascun oggetto sull'immagine.

In [None]:
from azure.cognitiveservices.vision.customvision.prediction import CustomVisionPredictionClient
from msrest.authentication import ApiKeyCredentials
from matplotlib import pyplot as plt
from PIL import Image, ImageDraw, ImageFont
import numpy as np
import os
%matplotlib inline

# Load a test image and get its dimensions
test_img_file = os.path.join('data', 'object-detection', 'produce.jpg')
test_img = Image.open(test_img_file)
test_img_h, test_img_w, test_img_ch = np.array(test_img).shape

# Get a prediction client for the object detection model
credentials = ApiKeyCredentials(in_headers={"Prediction-key": cv_key})
predictor = CustomVisionPredictionClient(endpoint=cv_endpoint, credentials=credentials)

print('Detecting objects in {} using model {} in project {}...'.format(test_img_file, model_name, project_id))

# Detect objects in the test image
with open(test_img_file, mode="rb") as test_data:
    results = predictor.detect_image(project_id, model_name, test_data)

# Create a figure to display the results
fig = plt.figure(figsize=(8, 8))
plt.axis('off')

# Display the image with boxes around each detected object
draw = ImageDraw.Draw(test_img)
lineWidth = int(np.array(test_img).shape[1]/100)
object_colors = {
    "apple": "lightgreen",
    "banana": "yellow",
    "orange": "orange"
}
for prediction in results.predictions:
    color = 'white' # default for 'other' object tags
    if (prediction.probability*100) > 50:
        if prediction.tag_name in object_colors:
            color = object_colors[prediction.tag_name]
        left = prediction.bounding_box.left * test_img_w 
        top = prediction.bounding_box.top * test_img_h 
        height = prediction.bounding_box.height * test_img_h
        width =  prediction.bounding_box.width * test_img_w
        points = ((left,top), (left+width,top), (left+width,top+height), (left,top+height),(left,top))
        draw.line(points, fill=color, width=lineWidth)
        plt.annotate(prediction.tag_name + ": {0:.2f}%".format(prediction.probability * 100),(left,top), backgroundcolor=color)
plt.imshow(test_img)


Visualizza le previsioni risultanti, che mostrano gli oggetti rilevati e la probabilità per ogni previsione.