Si vous voulez vous former aux bases du Machine Learning, je vous conseille le tutoriel d’Andrew Ng (inscription gratuite) : https://www.coursera.org/learn/machine-learning/ Mais nous insistons sur le fait que ce n’est pas l’objectif de cet atelier.
Plus précisément, voici les prérequis qu'il faudrait sans doute avoir pour participer à cet atelier :
- Compréhension théorique des réseaux de neurones (la semaine 4 et 5 du tutoriel devraient amplement suffire : https://www.coursera.org/learn/machine-learning/home/week/4)
- Savoir coder un minimum en Python
- Amener un ordinateur (ou vous mettre en binôme) avec un interpréteur Python et un IDE
- Avoir installé la librairie Python Keras (https://keras.io/), qui semble être la plus adaptée à nos besoins (haut-niveau, bonne porte d’entrée aux librairies TensorFlow, Theano et CNTK, orientée prototypage rapide, …)
Programme (temporaire) pour l'atelier :
- Séance de "jeu" avec l’interface interactive suivante : http://playground.tensorflow.org. Cela devrait nous permettre d'appréhender pas mal de phénomènes classiques des réseaux de neurones (remarque : la classification est très bien, mais la régression nous paraît assez étrange...).
- Présentation rapide des modèles d'algorithmes de Deep Learning actuels : CNN, RNN, LSTM, etc.
- Mise en pratique : résolution d'une tâche en mode TP collaboratif ! On partirait sur une tâche de reconnaissance d'entités nommées. Des embeddings pour chaque terme à annoter devraient être à disposition.
L'objectif de l'atelier serait donc que chacun reparte avec une compréhension améliorée du Deep Learning et un programme fonctionnel qu’il pourra certainement retoucher pour l’adapter à ses propres expériences.
Il y a peut-être des choses intéressantes à récupérer ici : https://github.com/UKPLab/deeplearning4nlp-tutorial. N'hésitez pas également à proposer des améliorations et des ressources supplémentaires pour organiser au mieux cet atelier.