# Reconnaissance d'images avec la Teachable Machine

**Objectif:** Découvrir l'apprentissage automatique en entraînant un système de reconnaissance d'images avec l'outil en ligne 'Teachable Machine' de Google. 


|||
:--- | :--- |
|Âge |10 à 18 ans|
|Notions abordées|Intelligence artificielle, apprentissage automatique, classification d'images, modèle de prédictions.|
|Objectifs pédagogiques ([selon MIT IA Ethics, page 7](https://docs.google.com/document/d/1pQ8D4iDnwKoiveJOZZgy6SLvgDD1nYQOPFUwyuBpEic/edit#heading=h.1et5vs39qkyh))|1. Savoir que l'intelligence artificielle est un type d'algorithme spécifique et comporte trois parties spécifiques : ensemble de données, algorithme d'apprentissage et prédiction (1.a.). <br>2. Comprendre le problème de la classification dans le contexte de l'apprentissage automatique supervisé. Comprendre comment la quantité de données d'entraînement affecte la précision et la robustesse d'un modèle d'apprentissage automatique supervisé. (1c)<br> 3. Comprendre l'effet des données d'entraînement sur la précision d'un système d'apprentissage automatique (2.c). <br> 4. Comprendre comment la composition des données d'entraînement affecte “le résultat”  d'un système d'apprentissage automatique supervisé.<br> 5. Identifier les ensembles de données nécessaires pour former un système d'IA pour atteindre cet objectif (4.b).|
| Durée| 2 heures|
| Dispositif pédagogiques| Par groupe de 2|
| Matériel| Un laptop/tablette par groupe de 2, avec connexion à Internet|
| Prérequis| Aucun|




## Introduction

La reconnaissance d'images par un ordinateur est une forme d'intelligence artificelle basée sur l'apprentissage automatique: Des exemples d'images de différentes catégories sont montrés à l'ordinateur, et un algorithme d'apprentissage est utilisé pour permettre à l'ordinateur de reconnaître les différentes catégories. 

Vocabulaire utile:

* Les catégories d'images à reconnaître (sourire, grimace, objet, etc ...) sont appelées *classes*
* L'ensemble des exemples des différentes classes que l'on utilise pour l'apprentissage s'appelle le *jeu de données d'apprentissage*
* L'apprentissage automatique est le terme employé lorsque l'on montre des exemples de ce que l'ordinateur doit apprendre à reconnaître
* Le système de reconnaissance est plus couramment appelé *modèle de prédiction*.

Dans le cas de la classification d'images, un modèle de prédiction est donc entrainé à reconnaître différentes classes d'images à partir d'un jeu de données d'apprentissage. 

L'outil que nous utilisons ici pour entraîner le modèle d'apprentissage automatique est la Teachable Machine, qui permet d'entraîner facilement un modèle de reconnaissance d'images en prenant des photos depuis la webcam. Vous associez les images à des classes que le modèle devra reconnaître. La création du modèle (l'entraînement) est fait sur le cloud par un service de Google. 

Nous donnons comme exemples la reconnaissance d'émotions sur un visage (sourire, grimace, ou neutre) et la détection d'objet sur un sol martien. Le tutoriel peut être adapté librement à d'autres applications de reconnaissance d'images (objet, visage, etc, ...). 

Nous montrons enfin comment ensuite tester son système (aussi appelé 'modèle') sur de nouvelles images, et exporter le modèle pour pouvoir l'utiliser dans un programme Scratch ou Python.



## Teachable machine

Allez sur le site de la Teachable Machine à [https://teachablemachine.withgoogle.com](https://teachablemachine.withgoogle.com). La langue française peut être choisie dans la liste déroulante qui se trouve tout en bas de la page, à droite.



Cliquez sur "Commencez".

<img src="images/TM_1_commencer.jpg" width="900"/> 

Dans la page "Nouveau projet", cliquez sur "Projet image".


<img src="images/TM_2_projet_image.jpg" width="900"/> 

Puis cliquez sur "Modèle d'image standard".

<img src="images/TM_Image.jpg" width="900"/> 




## Interface pour entraîner le modèle

Après avoir cliqué que "Modèle d'image standard", l'interface permettant de faire un entraînement s'affiche:


<img src="images/TM_3_entrainement_start.jpg" width="900"/> 


Elle est composée de trois parties:

* A gauche, vous pouvez ajouter des images pour différentes classes. Par défaut, l'interface vous propose d'ajouter des images pour deux classes différentes, qui s'appellent 'Class 1' et 'Class 2'. Vous pouvez ajouter des classes en cliquant sur 'Ajouter une classe' en bas. 
* Au milieu, le bouton 'Entraînement' vous permet d'entraîner le modèle.
* A droite, dans 'Aperçu', vous pourrez tester et exporter le modèle une fois que celui-ci aura été entraîné. 



## Choix des classes

Le choix des classes dépend du problème de classification que vous voulez faire. Nous allons ici montrer deux exemples: Un classifieur qui reconnaît vos émotions sur votre visage (souriant, faché, ou neutre), et un classifieur capable de retrouver des tubes sur un sol martien (ce classifieur pourra servir plus tard pour les activités liées à Mars et à la construction d'un rover). 

Vous pouvez bien sûr entraîner vos classifieur à faire autre chose, comme reconnaître des objets, des fruits, ou votre visage et ceux de vos amis! 

Pour l'entraînement, il est recommandé de prendre au moins quelques dizaines d'images. Renommez les classes comme vous le souhaitez en cliquant sur l'icône de crayon associé à chaque classe, puis appuyez sur l'icône de caméra pour prendre différentes images de la classe correspondante. 

Lorsque vous cliquerez sur la caméra, il est possible que le navigateur Web vous demande l'autorisation d'utiliser la caméra. Dans ce cas, autorisez-le.


## Exemple pour un classificateur d'émotions

Dans le cas d'un classifieur d'émotions, nous avons pris ici une cinquantaine d'images de trois catégories différentes: Sourire, faché et neutre. Trois exemples de photos de chacune des trois classes sont données ci-dessous.


<table>
    <tr>
        <td> 
            <img src="images/sourire.png"  width="300"/> 
        </td>
        <td> 
            <img src="images/faché.png" alt="drawing" width="300"/> 
        </td>
        <td> 
            <img src="images/neutre.png" width="300"/>
        </td>
    </tr>
    <tr>
        <td> 
            <div  align="center">Exemple de classe: Sourire</div>
        </td>
        <td> 
             <div  align="center">Exemple de classe: Faché</div>
        </td>
        <td> 
             <div  align="center">Exemple de classe: Neutre</div>
        </td>
    </tr>
</table>

Une fois que les trois classes sont renommées et que les images ont été prises pour chacune des trois classes, l'interface ressemble à ceci:


<img src="images/TM_4_Emotion.jpg" width="900"/> 



### Entraînement et test du modèle

Cliquez ensuite sur "Entraînement". Cela prend en général moins d'une minute pour que l'entraînement se termine. Une fois celui-ci terminé, la partie de droite 'Aperçu' affichera l'image provenant de la webcam, et vous permettra de tester votre modèle.

<img src="images/TM_5_emotions.jpg" width="900"/> 


Vous pourrez remarquer que le modèle de prédiction fonctionnera moins bien si vous vous approchez ou vous éloignez de la webcam, ou si les conditions d'éclaraige ou l'arrière-plan changent. Afin de rendre votre modèle le plus fiable possible, assurez-vous de prendre des exemples assez variés (en vous approchant ou vous éloignant de la caméra, et en utilisant des arrière-plans différents).


### Exportation du modèle

Exportez votre modèle pour pouvoir l'utiliser ensuite avec Adacraft (Scratch) ou Python. Pour cela, cliquez sur 'Exportez'. La fenêtre suivante apparaît:

<img src="images/TM_6_exporter.jpg" width="600"/> 

#### Export du modèle pour une utilisation avec Adacraft (Scratch)

Dans l'onglet 'Tensorflow.js', cliquez sur 'Importer le modèle'. Cela prend environ deux minutes. Un lien vers le modèle apparaitra comme ci-dessous:

<img src="images/TM_7_importer.jpg" width="600"/> 


Copier-le pour pouvoir le réutiliser plus tard dans le bloc Modèle d'Adacraft (vous pouvez cliquez sur 'Copier' en bas à droite de la fenêtre pour copier le lien, que vous pourrez ensuite coller dans Adacraft).

#### Export du modèle pour une utilisation avec Python

Pour l'utilisation du modèle avec Python, il faut utiliser la version Tensorflow Lite du modèle. Pour cela, allez dans l'onglet 'Tensorflow Lite', sélectionner 'Virgule flottante'.


<img src="images/TM_6_Exporter_Python.jpg" width="600"/> 

Cliquez ensuite sur 'Télécharger mon modèle'. Vous devrez attendre environ 30 secondes pour que le modèle soit converti. Une fenêtre apparaîtra ensuite pour vous permettre de télécharger un fichier s'appelant 'converted_tflite.zip', qui fait environ 2 mégaoctets. Téléchargez le ficher en ouvrez l'archive 'zip'. L'archive contient deux fichiers:

* Un ficher texte 'labels.txt'
* Un ficher 'model_unquant.tflite' qui pourra être ouvert par Python pour utiliser le modèle.

Note: Si vous avez un Coral, dans l'onglet 'Tensorflow Lite', sélectionner 'EdgeTPU', puis 'Télécharger mon modèle'.


## Reconnaissance de tubes sur un sol martien

Le second exemple que nous donnons a pour but de faire un classifieur capable de dire si un tube est présent sur un sol martien. On distingue donc deux classes: Soit l'image perçue par la caméra contient un échantillon (un tube contenant des poussières de sol martien), soit elle n'en contient pas. Nous appellerons la première classe "Sol", et la seconde classe "Tube".

Pour faire l'entraînement, l'image ci-dessous pourra être au préalable imprimée. On y voit un tube posé sur un sol martien (le tube est à peu près au centre). 

<img src="images/sol-martien-avec-tube.jpg" width="900"/> 

Les étapes sont ensuite les même que précédemment, pour entraîner, tester et exporter le modèle. 

Pour l'entraînement, définissez deux classes: 'Sol' et 'Tube'. Ajoutez ensuite des photos avec la webcam de parties
de l'image où seul le sol est présent pour la classe sol. Faites de même pour la classe tube, en prenant des photos sur lesquelles le tube est visible. Une fois les photos prises, vous devriez obtenir un jeu de données tel que celui illustré ci-dessous:

<img src="images/TM_4_tube_sol.jpg" width="900"/> 

Lancez ensuite l'entraînement en cliquant sur le bouton 'Entraînement'. Une fois celui-ci terminé (environ une minute), vous pouvez testez votre modèle en déplaçant la feuille devant la webcam. Vérifiez que le modèle reconnaît correctement la présence du tube:

<img src="images/TM_5_tube_sol.jpg" width="900"/> 

Vous pouvez exportez votre modèle pour une utilisation vers Adacrcat (Scratch) ou Python de la même manière que celle décrite ci-dessus pour la reconnaissance d'émotions.


## Résumé

## Allez plus loin

* Reconnaissance de pose, de sons

## Références et lien utiles

* https://projects.raspberrypi.org/en/projects/image-id-coral/2