# Détection d’objets

*Détection d’objets* est une forme de vision informatique dans laquelle un modèle d’apprentissage automatique est entraîné à classer les instances individuelles d’objets dans une image et à indiquer une *case de délimitation* qui marque son emplacement. Vous pouvez considérer qu’il s’agit d’une progression de la *classification d’images* (dans laquelle le modèle répond à la question « de quoi s’agit-il ? ») vers la construction de solutions où l’on peut demander au modèle « quels sont les objets présents dans cette image, et où sont-ils ? ».

![Un robot identifiant un fruit](./images/object-detection.jpg)

Par exemple, une épicerie pourrait utiliser un modèle de détection d’objets pour mettre en œuvre un système de caisse automatisé qui scanne un tapis roulant à l’aide d’une caméra et peut identifier des articles spécifiques sans avoir besoin de placer chaque article sur le tapis et de les scanner individuellement.

Le service cognitif **Vision personnalisée** de Microsoft Azure offre une solution basée sur le cloud pour créer et publier des modèles de détection d’objets personnalisés.

## Créer une ressource Vision personnalisée

Pour utiliser le service Vision personnalisée, vous avez besoin d’une ressource Azure que vous pouvez utiliser pour entraîner un modèle, et d’une ressource avec laquelle vous pouvez le publier pour que les applications puissent l’utiliser. Vous pouvez utiliser la même ressource pour chacune de ces tâches, ou vous pouvez utiliser des ressources différentes pour chacune d’elles afin d’allouer les coûts séparément, à condition que les deux ressources soient créées dans la même région. La ressource pour l’une ou l’autre (ou les deux) tâches peut être une ressource **Cognitive Services** générale ou une ressource **Vision personnalisée** spécifique. Suivez les instructions suivantes pour créer une nouvelle ressource **Vision personnalisée** (ou vous pouvez utiliser une ressource existante si vous en avez une).

1. Dans un nouvel onglet de navigateur, ouvrez le portail Azure à l’adresse [https://portal.azure.com](https://portal.azure.com), et connectez-vous en utilisant le compte Microsoft associé à votre abonnement Azure.
2. Sélectionnez le bouton **&#65291; Créer une ressource**, recherchez *Vision personnalisée*, et créez une ressource **Vision personnalisée** avec les paramètres suivants :
    - **Créer des options** : Les deux
    - **Abonnement** : *Votre abonnement Azure*
    - **Groupe de ressources** : *Sélectionnez ou créez un groupe de ressources portant un nom unique*
    - **Nom** : *Saisissez un nom unique*
    - **Emplacement de formation** : *Choisissez une région disponible*
    - **Niveau tarifaire de formation** : F0
    - **Emplacement de prédiction** : *Le même que l’emplacement de formation*
    - **Niveau tarifaire de prédiction** : F0

    > **Remarque** : Si vous avez déjà un service de vision personnalisée F0 dans votre abonnement, sélectionnez **S0** pour celui-ci.

3. Attendez que la ressource soit créée.

## Créer un projet Vision personnalisée

Pour entraîner un modèle de détection d’objets, vous devez créer un projet Vision personnalisée basé sur votre ressource de formation. Pour ce faire, vous utiliserez le portail Vision personnalisée.

1. Dans un nouvel onglet de navigateur, ouvrez le portail Vision personnalisée à l’adresse [https://customvision.ai](https://customvision.ai), et connectez-vous en utilisant le compte Microsoft associé à votre abonnement Azure.
2. Créez un nouveau projet avec les paramètres suivants :
    - **Nom** : Détection d’épicerie
    - **Description** : Détection d’objets pour les épiceries.
    - **Ressource** : *La ressource Vision personnalisée que vous avez créée précédemment*
    - **Types de projets** : Détection d’objets
    - **Domaines** : Général
3. Attendez que le projet soit créée et ouvert dans le navigateur.

## Ajoutez et étiquetez des images

Pour entraîner un modèle de détection d’objets, vous devez télécharger des images contenant les classes que vous souhaitez que le modèle identifie, et les étiqueter pour indiquer les cases de délimitation de chaque instance d’objet.

1. Téléchargez et extrayez les images d’entraînement à partir de https://aka.ms/fruit-objects. Le dossier extrait contient une collection d’images de fruits. **Remarque :** si vous ne pouvez pas accéder aux images de formation, une solution de contournement temporaire consiste à visiter la page https://www.github.com, puis la page https://aka.ms/fruit-objects. 
2. Dans le portail Vision personnalisée [https://customvision.ai](https://customvision.ai), assurez-vous d’utiliser le modèle de détection d’objet project _Grocery Detection_. Sélectionnez ensuite **Add images** (Ajouter des images) et téléchargez toutes les images dans le dossier extrait.

![Téléchargez toutes les images extraites en cliquant sur Add images (Ajouter des images).](./images/fruit-upload.jpg)

3. Une fois les images téléchargées, sélectionnez la première pour l’ouvrir.
4. Maintenez la souris sur n’importe quel objet de l’image jusqu’à ce qu’une région détectée automatiquement s’affiche comme dans l’image ci-dessous. Sélectionnez ensuite l’objet et, si nécessaire, redimensionnez la région pour l’entourer.

![La région par défaut pour un objet](./images/object-region.jpg)

Vous pouvez aussi simplement faire glisser l’objet pour créer une région.

5. Lorsque la région entoure l’objet, ajoutez une nouvelle étiquette avec le type d’objet approprié (*pomme*, *banane*, ou *orange*) comme illustré ici :

![Un objet étiqueté dans une image](./images/object-tag.jpg)

6. Sélectionnez et étiquetez chaque autre objet de l’image, en redimensionnant les régions et en ajoutant de nouvelles étiquettes si nécessaire.

![Deux objets étiquetés dans une image](./images/object-tags.jpg)

7. Utilisez le lien **>** sur la droite pour passer à l’image suivante et étiqueter ses objets. Puis continuez à parcourir toute la collection d’images, en étiquetant chaque pomme, banane et orange.

8. Lorsque vous avez terminé d’étiqueter la dernière image, fermez l’éditeur **Détails de l’image** et sur la page **Images de formation**, sous **Étiquettes**, sélectionnez **Étiqueté** pour voir toutes vos images étiquetées :

![Images marquées dans un projet](./images/tagged-images.jpg)

## Entraîner et tester un modèle

Maintenant que vous avez étiqueté les images de votre projet, vous êtes prêt à entraîner un modèle.

1. Dans le projet Vision personnalisée, cliquez sur **Entraîner** pour entraîner un modèle de détection d’objets à l’aide des images étiquetées. Sélectionnez l’option **Formation rapide**.
2. Attendez la fin de la formation (cela peut prendre une dizaine de minutes), puis vérifiez les mesures de performance *Précision*, *Rappel*, et *mAP* ; elles mesurent la précision de prédiction du modèle de classification et doivent toutes être élevées.
3. En haut à droite de la page, cliquez sur **Test rapide**, puis dans la case **URL image**, saisissez `https://aka.ms/apple-orange` et regardez la prédiction qui est générée. Fermez ensuite la fenêtre **Test rapide**.

## Publier et consommer le modèle de détection d’objets

Vous êtes maintenant prêt à publier votre modèle entraîné et à l’utiliser à partir d’une application cliente.

1. En haut à gauche de la page **Performances**, cliquez sur **&#128504; Publier** pour publier le modèle entraîné avec les paramètres suivants :
    - **Nom du modèle** : détecter-produire
    - **Ressource de prédiction** : *Votre **ressource** prédiction* de vision personnalisée.

### (!) Vérification 
Avez-vous utilisé le même nom de modèle : **détecter-produire** ? 

2. Après la publication, cliquez sur l’icône *Paramètres* (&#9881;) en haut à droite de la page **Performances** pour afficher les paramètres du projet. Ensuite, sous **Généralités** (à gauche), copiez **ID du projet**. Faites défiler la page vers le bas et collez-la dans la cellule de code située sous l’étape 5 en remplaçant **YOUR_PROJECT_ID**. 

> (*(si vous avez utilisé une ressource **Cognitive Services** au lieu de créer une ressource **Vision personnalisée** au début de cet exercice, vous pouvez copier sa clé et son point de terminaison à partir de la partie droite des paramètres du projet, les coller dans la cellule de code ci-dessous et l’exécuter pour voir les résultats. Sinon, continuez à suivre les étapes ci-dessous pour obtenir la clé et le point de terminaison de votre ressource de prédiction Vision personnalisée*).

3. En haut à gauche de la page **Paramètres du projet**, cliquez sur l’icône Galerie de projets (&128065;) pour revenir à la page d’*Galerie de projets* (&#128065;) pour revenir à la page d’accueil du portail Vision personnalisée, où votre projet est maintenant répertorié.

4. Sur la page d’accueil du portail Vision personnalisée, en haut à droite, cliquez sur l’icône *Paramètres* (&#9881;) pour afficher les paramètres de votre service Vision personnalisée. Ensuite, sous **Ressources**, développez votre ressource *Prédiction* (<u>pas</u> la ressource Formation) et copiez ses valeurs **Clé** et **Point de terminaison** dans la cellule de code sous l’étape 5, en remplaçant **YOUR_KEY** et **YOUR_ENDPOINT**.

### (!) Vérification 
Si vous utilisez une ressource **Vision personnalisée**, avez-vous utilisé la ressource **Prédiction** (<u>pas</u> la ressource Formation) ?

5. Exécutez la cellule de code ci-dessous en cliquant sur le bouton Exécuter la cellule <span>&#9655;</span> (en haut à gauche de la cellule) pour définir les variables sur vos valeurs d’ID de projet, de clé et de point de terminaison.

In [None]:
project_id = 'YOUR_PROJECT_ID' # Replace with your project ID
cv_key = 'YOUR_KEY' # Replace with your prediction resource primary key
cv_endpoint = 'YOUR_ENDPOINT' # Replace with your prediction resource endpoint

model_name = 'detect-produce' # this must match the model name you set when publishing your model iteration exactly (including case)!
print('Ready to predict using model {} in project {}'.format(model_name, project_id))

Vous pouvez maintenant utiliser votre clé et votre point de terminaison avec un client Vision personnalisée pour vous connecter à votre modèle de détection d’objets de vision personnalisée.

Exécutez la cellule de code suivante, qui utilise votre modèle pour détecter des produits individuels dans une image.

> **Remarque** : Ne vous souciez pas des détails du code. Il utilise le SDK Python pour le service Vision personnalisée pour soumettre une image à votre modèle et récupérer les prédictions pour les objets détectés. Chaque prédiction se compose d’un nom de classe (*pomme*, *banane*, ou *orange*) et les coordonnées *case de délimitation* qui indiquent où, dans l’image, l’objet prédit a été détecté. Le code utilise ensuite ces informations pour dessiner une boîte étiquetée autour de chaque objet sur l’image.

In [None]:
from azure.cognitiveservices.vision.customvision.prediction import CustomVisionPredictionClient
from msrest.authentication import ApiKeyCredentials
from matplotlib import pyplot as plt
from PIL import Image, ImageDraw, ImageFont
import numpy as np
import os
%matplotlib inline

# Load a test image and get its dimensions
test_img_file = os.path.join('data', 'object-detection', 'produce.jpg')
test_img = Image.open(test_img_file)
test_img_h, test_img_w, test_img_ch = np.array(test_img).shape

# Get a prediction client for the object detection model
credentials = ApiKeyCredentials(in_headers={"Prediction-key": cv_key})
predictor = CustomVisionPredictionClient(endpoint=cv_endpoint, credentials=credentials)

print('Detecting objects in {} using model {} in project {}...'.format(test_img_file, model_name, project_id))

# Detect objects in the test image
with open(test_img_file, mode="rb") as test_data:
    results = predictor.detect_image(project_id, model_name, test_data)

# Create a figure to display the results
fig = plt.figure(figsize=(8, 8))
plt.axis('off')

# Display the image with boxes around each detected object
draw = ImageDraw.Draw(test_img)
lineWidth = int(np.array(test_img).shape[1]/100)
object_colors = {
    "apple": "lightgreen",
    "banana": "yellow",
    "orange": "orange"
}
for prediction in results.predictions:
    color = 'white' # default for 'other' object tags
    if (prediction.probability*100) > 50:
        if prediction.tag_name in object_colors:
            color = object_colors[prediction.tag_name]
        left = prediction.bounding_box.left * test_img_w 
        top = prediction.bounding_box.top * test_img_h 
        height = prediction.bounding_box.height * test_img_h
        width =  prediction.bounding_box.width * test_img_w
        points = ((left,top), (left+width,top), (left+width,top+height), (left,top+height),(left,top))
        draw.line(points, fill=color, width=lineWidth)
        plt.annotate(prediction.tag_name + ": {0:.2f}%".format(prediction.probability * 100),(left,top), backgroundcolor=color)
plt.imshow(test_img)


Afficher les prédictions résultantes, qui montrent les objets détectés et la probabilité de chaque prédiction.