---
jupyter:
  jupytext:
    text_representation:
      extension: .md
      format_name: markdown
      format_version: '1.3'
      jupytext_version: 1.16.0
  kernelspec:
    display_name: Python 3 (ipykernel)
    language: python
    name: python3
---

<!-- #region id="1f92191f" -->
# Table des matières
1. [Préambule](#préambule)
1. [Plan de la formation](#plan-de-la-formation)
    1. [Précisions](#précisions)
1. [Qu'est-ce que l'intelligence artificielle?](#quest-ce-que-lintelligence-artificielle)
  1. [Les grandes étapes de l'évolution de l'intelligence artificielle](#les-grandes-étapes-de-lévolution-de-lintelligence-artificielle)
  1. [Les trois grands paradigmes de l'apprentissage automatique](#les-trois-grands-paradigmes-de-lapprentissage-automatique)
    1. [Apprentissage supervisé](#apprentissage-supervisé)
    1. [Apprentissage non supervisé](#apprentissage-non-supervisé)
    1. [Apprentissage par renforcement](#apprentissage-par-renforcement)
  1. [Qu'est-ce que l'apprentissage profond?](#quest-ce-que-lapprentissage-profond)
    1. [Pourquoi avoir attendu si longtemps pour l'apprentissage profond?](#pourquoi-avoir-attendu-si-longtemps-pour-lapprentissage-profond)
    1. [Pour en savoir plus sur l'apprentissage profond](#pour-en-savoir-plus-sur-lapprentissage-profond)
  1. [Qu'est-ce que l'apprentissage par renforcement?](#quest-ce-que-lapprentissage-par-renforcement)
1. [Comment l'IA s'est-elle si bien démarquée?](#comment-lia-sest-elle-si-bien-démarquée)
1. [Deux approches en analyse des données: la statistique et l'apprentissage automatique](#deux-approches-en-analyse-des-données-la-statistique-et-lapprentissage-automatique)
1. [Domaines d'applications](#domaines-dapplications)
<!-- #endregion -->

<!-- #region id="dad11b1f" -->
# <a id=préambule>Préambule</a>

<!-- #endregion -->

<!-- #region colab_type="text" id="790fd68a" -->
Bonjour et bienvenue dans cette nouvelle aventure pleine d'explorations, de rebondissements et de découvertes! Vous allez faire vos premiers pas dans le merveilleux monde de l'intelligence artificielle.

Comme vous l'avez surement remarqué, nous vivons à une époque de grands changements. Les livres d'histoire (s'ils existent encore) parleront de celle-ci comme d'une phase d'accélération des technologies et de l'intégration de l'informatique dans presque tous les aspects de nos vies. Cela va de la façon dont nous travaillons ensemble, nous développons de nouvelles technologies, à la façon dont le monde extérieur interagit avec nous (p. ex. domotique).

En prenant beaucoup de libertés (il y a toujours des exceptions), il n'est pas exagéré de séparer comme suit les
grandes périodes en sciences et technologies par leur impact qu'elles ont eu sur la société :

- 1900-1970: La physique moderne,
- 1970-aujourd'hui: La biologie moléculaire,
- 2000-aujourd'hui: L'informatique et l'intelligence artificielle.


La biologie et l'informatique forment un tandem scientifique fructueux; les nouvelles sciences génomiques, protéomiques, etc. ont pu progresser grâce à la construction de grandes bases de données qui ont été exploitées avec les outils de
l'intelligence artificielle. La biologie va continuer sur ses avancées dues en grande partie à la découverte ou à l'invention de nouveaux outils de biologie moléculaire tels que la protéine d'origine bactérienne Cas9
aux vastes perspectives d'utilisation.

Toutefois, l'intelligence artificielle, et plus particulièrement l'apprentissage automatique, va transformer la manière dont les scientifiques et les ingénieurs travaillent. En effet, alors que la physique nous apprend à construire des modèles graduellement plus complexes à partir des principes premiers et de l'expérience, l'IA nous offre une voie différente. On enseigne maintenant à une machine, à partir d'exemples, comment accomplir une tâche qu'on est incapable de décrire
explicitement au moyen d'un programme (p. ex. la vision humaine) ou tout simplement qu'on est incapable
d'accomplir, car les détails mathématiques sont encore insurmontables. Il faut toutefois faire attention à ne pas privilégier uniquement cette nouvelle direction. En effet, un modèle qui prédit bien les observations de la nature est limité si on ne peut pas l'expliquer afin de le comprendre et voir plus loin. Les modèles sont utiles, mais la compréhension qu'on en retire devrait primer à plus long terme. Il faut fusionner les deux approches!
<!-- #endregion -->

<!-- #region id="c364ac03" -->
# <a id=plan-de-la-formation>Plan de la formation</a>
<!-- #endregion -->

<!-- #region id="40a95880" -->
Voici le contenu de la formation sur l'apprentissage automatique; il y a cinq thèmes. Le coeur
de la formation se situe dans le thème II. Les thèmes III et IV discutent des outils utilisés
pour mener à bien l'exploration des données et leur analyse.

**Thème I : Introduction à l'intelligence artificielle (ce module)**

**Thème II : Les besoins en données de l'apprentissage automatique**
Les parties de ce thème sont les suivantes:

- Partie 2: Régression,
- Partie 3: Classification,
- Partie 4: Données,
- Partie 5: Entraînement,
- Partie 6: Apprentissage supervisé et non supervisé.

**Thème III : Introduction aux outils de visualisation**

La partie de ce thème est la partie 7: Visualisation.

**Thème IV : Introduction à la librairie Scikit-learn**

La partie de ce thème est la partie 8: Scikit-learn

**Thème V : Conclusion**

La partie de ce thème est la partie 10: Conclusion.

À noter que la partie 9: Solutions présentes des solutions aux exemples présentés tout au long de la formation.

> Comme il arrive souvent dans la vraie vie, plusieurs concepts, comme la validation croisée et
le prétraitement des données, sont utilisés sans trop d'explications dans les exemples du thème II
avant d'être mieux définis et expliqués dans les thèmes suivants. Il serait difficile et inapproprié de tout
expliquer au même endroit, au même moment. Après tout, on apprend à brancher les fils électriques et
allumer un appareil avant d'apprendre pourquoi ça marche avec les équations de l'électromagnétisme de Maxwell. Une étape à la fois!
<!-- #endregion -->

<!-- #region id="f95c41a6" -->
### <a id=précisions>Précisions</a>
<!-- #endregion -->

<!-- #region id="554fdcf6" -->
Cette formation sur l'apprentissage automatique se veut une introduction au sujet, tant au niveau
des concepts de base enseignés qu'au niveau des exercices et exemples de programmation suggérés.

Chaque thème, sauf l'introduction et la conclusion, est constitué de notebooks Jupyter contenant
des exemples en Python qui sont exécutés sur la plateforme PAX de l'Université Laval. Le langage Python a été
choisi, car c'est l'*espéranto* en apprentissage automatique. Il existe une multitude
de sources d'information complémentaires sur internet si vous ne connaissez pas Python tel que les quatre formations suivantes sur Python disponibles sur la plateforme interactive PaX:

- [Le Python impératif](https://www.brioeducation.ca/cours-activites/python-imperatif-jeujul466/detail/)
- [Le Python orienté objet](https://www.brioeducation.ca/cours-activites/python-oriente-objet-jevdlo808/detail/)
- [Le Python fonctionnel](https://www.brioeducation.ca/cours-activites/python-fonctionnel-jevprd372/detail/)
- [Le Python scientifique](https://www.brioeducation.ca/cours-activites/python-scientifique-jexhdy335/detail/)

L'équipe de conception de la formation a choisi de mettre l'accent sur les méthodes de l'apprentissage supervisé, car elle est la plus couramment utilisée dans les solutions d'entreprises. On s'intéresse plus particulièrement aux applications en régression et en classification, qui sont également les plus courantes. L'apprentissage automatique étant en effervescence, il existe un grand nombre d'algorithmes en régression et en classification. Pour chacune, nous allons présenter deux algorithmes très connus qui sont des approches totalement différentes du problème; l'une est déterministe, l'autre est heuristique.

On discutera ainsi de l'apprentissage automatique dit *classique* qui ne traite pas directement avec des images, ou des textes, mais plutôt avec des données de type tabulaire $(X,y)$ où $X$ est un vecteur multidimensionnel de caractéristiques mesurées et où $y$ est la réponse que l'on veut prédire. On peut néanmoins appliquer nos méthodes à des images, à condition que les caractéristiques $X$ de celles-ci soient fournis au préalable. L'analyse directe des images et des textes est abordée dans d'autres [formations spécialisées](https://www.fsg.ulaval.ca/etudes/formation-continue) offertes par la Formation continue de la Faculté des sciences et de génie.

Il est aussi important de comprendre que nous avons dû faire des choix dans cette formation et que tous les sujets (p. ex. série chronologique) ou domaines d'applications (p. ex. finance, économie, robotique, etc.) ne peuvent pas être présentés. Toutefois, la formation tente de présenter les notions importantes pour vous permettre d'utiliser ces apprentissages sur d'autres problèmes par la suite.

La présente formation sert ainsi de plateforme de lancement vers l'apprentissage profond, l'apprentissage par
renforcement, le traitement automatique du langage naturel, etc. D'autres aventures donc!
<!-- #endregion -->

<!-- #region id="1fd85bb0" -->
# <a id=quest-ce-que-lintelligence-artificielle>Qu'est-ce que l'intelligence artificielle?</a>
<!-- #endregion -->

<!-- #region id="aba943eb" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/cyber-security.jpeg"  width="400" />
    <div>
    <font size="1.5">Image Source: https://technofaq.org/posts/2019/09/cyber-security-trends-to-watch-out-for-organizations-to-stay-ahead//</font>
    </div>
</div>
<p>&nbsp;</p>
<!-- #endregion -->

<!-- #region id="90961adb" -->
Il existe plusieurs définitions de celle-ci. Cela est dû à la grande popularité du sujet, mais aussi au fait
que le domaine évolue rapidement. Ainsi, chaque regard différent ajoute une teinte nouvelle à la vision du moment.

L'une des premières définitions, et l'une des meilleures sinon la meilleure, provient de l'informaticien Arthur
Samuel (figure suivante), en 1959. "L'intelligence artificielle est le champ d'études qui donne à un ordinateur
la capacité à apprendre sans être explicitement programmé." C'est effectivement le but que l'on veut atteindre;
apprendre à une
machine à effectuer une tâche aussi bien que nous sans qu'on ait à lui expliquer comment le faire, avec un programme
très complexe. D'ailleurs, comment écrire un tel programme puisque nous ne savons même pas comment nous effectuons
naturellement ces tâches? La nouvelle approche consiste à montrer des exemples concrets à une machine, et celle-ci
apprend à les traiter comme on le ferait.

<!-- #endregion -->

<!-- #region id="132031d5" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/history-of-games.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://www.andreykurenkov.com/writing/ai/a-brief-history-of-game-ai/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="d0dd3ecd" -->
## <a id=les-grandes-étapes-de-lévolution-de-lintelligence-artificielle>Les grandes étapes de l'évolution de l'intelligence artificielle</a>
<!-- #endregion -->

<!-- #region id="40d76ece" -->
La figure suivante montre les grandes étapes de l'histoire de l'intelligence artificielle. Les premiers réseaux
de neurones datent de la fin des années 50. Après un bref enthousiasme, le sujet est tombé dans l'oubli pendant
plusieurs décennies dû à certains types de problèmes, somme toute assez courants, qu'ils ne pouvaient résoudre.

Le début des années 80 a vu l'émergence de l'apprentissage automatique tel qu'on le connait. C'était l'époque
des systèmes experts (une expression à la mode à l'époque) qui devaient, selon plusieurs, émuler les performances
des spécialistes humains afin de les remplacer dans certaines circonstances. Ceux-ci n'ont
pas porté fruit. C'est une des raisons pour lesquelles plusieurs personnes pensent qu'on
devrait prendre plus de recul par rapport au tsunami de l'intelligence artificielle en ce
moment. Toutefois, comme on le verra, celle-ci a aujourd'hui un impact considérable sur
la vie de tous les jours. L'intelligence artificielle a commencé à remplir beaucoup de ses promesses
initiales; d'autres, plus nombreuses restent à venir.

Les années 80 à 2010 ont vu une explosion de méthodes puissantes d'analyse des données qui constituent ce
que l'on appelle l'apprentissage automatique classique. C'est le sujet de ce cours.
De grands changements se sont produits après 2010. L'un est l'arrivée spectaculaire
de l'apprentissage profond (*deep learning*) qui repose essentiellement sur les
réseaux de neurones de nouvelle génération. L'apprentissage profond aborde les problèmes différemment de
l'apprentissage automatique classique.
<!-- #endregion -->

<!-- #region id="822fc4f1" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/learning-ai.png"  width="500" />
    <div>
    <font size="1.5">Image Source: https://kipkis.com/Learning_Artificial_Intelligence/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="6c9c4f07" -->
Finalement, un nouveau venu, qui n'apparait pas dans la figure, est l'apprentissage par renforcement. Bien que ses principes remontent à la fin des années 80, il est devenu un important sujet de recherches et d'applications autour de 2015.

Nous allons brièvement discuter des divers types dans les prochaines sections.

<!-- #endregion -->


<!-- #region id="638d6686" -->
## <a id=les-trois-grands-paradigmes-de-lapprentissage-automatique>Les trois grands paradigmes de l'apprentissage automatique</a>
<!-- #endregion -->

<!-- #region id="3105f624" -->
### <a id=apprentissage-supervisé>Apprentissage supervisé</a>
<!-- #endregion -->

<!-- #region id="c33b8dcb" -->
- Un modèle est entraîné sur des données créées par des humains, où $X$ représente les entrées (caractéristiques mesurées, images, etc.) et $y$ représente la réponse attendue (prix d'une maison, espèce de chats, etc.)
- Le modèle doit prédire la réponse $y$ pour de nouvelles données $X$ jamais vues auparavant.
<!-- #endregion -->

<!-- #region id="c63ad607" -->
### <a id=apprentissage-non-supervisé>Apprentissage non supervisé</a>
<!-- #endregion -->

<!-- #region id="533fe2dc" -->
- Un modèle doit apprendre des caractéristiques similaires entre les entrées $X$ sans connaitre la bonne réponse $y$, s’il y en a une. Par exemple, Netflix utilise l'apprentissage non supervisé pour rassembler les utilisateurs en groupes similaires afin de pouvoir proposer des films en accord avec les intérêts de chaque groupe. Il n'y a pas, à proprement parler, de bonne réponse d'association à un groupe.
- Les $N$ groupes ayant des propriétés communes deviennent autant de classes $y$.
- Le modèle doit prédire la classe $y$ pour de nouvelles données $X$ jamais vues auparavant.
- Le modèle peut aussi être utilisé pour identifier des observations rares qui soulèvent des suspicions en différant de manière significative de la majorité des autres données $X$.
<!-- #endregion -->

<!-- #region id="95114985" -->
### <a id=apprentissage-par-renforcement>Apprentissage par renforcement</a>
<!-- #endregion -->

<!-- #region id="b6eef3eb" -->
- Le modèle apprend à accomplir, de façon itérative, une tâche en observant son effet sur son environnement. Il
reçoit une récompense en échange s'il va dans la bonne direction sans vraiment savoir exactement pourquoi. Tout est basé sur l'observation de son action sur l’environnement.
- Le but est d'apprendre à accomplir cette tâche de façon optimale.
<!-- #endregion -->

<!-- #region id="cd13f2bc" -->
## <a id=quest-ce-que-lapprentissage-profond>Qu'est-ce que l'apprentissage profond?</a>
<!-- #endregion -->

<!-- #region id="3beb17b6" -->
La figure suivante compare l'apprentissage automatique classique avec l'apprentissage profond. Bien que
le premier n'utilise pas les réseaux de neurones alors que le second les utilise, la principale différence
n'est pas là.

Dans cet exemple, le but est de concevoir un système permettant de détecter si une image contient une voiture
ou non. Dans le panneau du haut, un programmeur doit concevoir deux algorithmes, soient l'extracteur de
caractéristiques (*features)*) $X$ décrivant l'objet à classifier, puis le classificateur permettant de
décider la classe de l'image (voiture ou non). Cela requiert les compétences d'un expert dans le domaine.
Il lui faut trouver des caractéristiques $X$ importantes, déterminer comment les extraire d'une image,
puis utiliser un classificateur qu'il aura entraîné pour classifier correctement les caractéristiques en une réponse $y$.

Le panneau du bas montre l'approche par apprentissage profond. Dans ce cas-ci, on utilise un algorithme
qui extraie de lui-même les caractéristiques $X$ (il peut en trouver de bien meilleures que nous et en
plus grand nombre) et entraîne un classificateur sur celles-ci. L'algorithme doit apprendre *sur le tas*
à extraire des caractéristiques et à entraîner un bon classificateur sur celles-ci. L'algorithme qui permet de
faire cela est un réseau de neurones d'une architecture donné, qui a été sélectionné par le programmeur.
Les deux étapes précédentes ont été remplacées par une seule, la sélection du réseau de neurones, qui est
nettement plus facile à accomplir.
<!-- #endregion -->

<!-- #region id="70d04f0b" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/end-to-end-training.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://ai.stackexchange.com/questions/16575/what-does-end-to-end-training-mean/</font>
    </div>
</div>

<!-- #endregion -->

<!-- #region id="abc9c172" -->
La figure suivante montre un autre aspect de l'apprentissage profond. Alors que l'apprentissage
automatique requiert une entrée $X$ et un programme afin de fournir la sortie désirée $y$ (panneau
du haut), l'apprentissage profond (panneau du milieu) requiert plutôt de spécifier ce que l'on veut
accomplir. C'est-à-dire, d'associer en entrée les données $X$ et $y$. En sortie, il fournit le programme
qui fera le travail! Ce programme est constitué d'une structure de réseau de neurones avec le poids
de chaque neurone entraîné. Ce réseau peut être utilisé pour traiter de nouvelles données $X'$ jamais
rencontrées (panneau du bas).

Dans le second cas, le travail du programmeur consiste à spécifier la structure du réseau de neurones.
Le cadre d'apprentissage (*learning framework*) s'occupe ensuite d'entraînement le réseau afin de
déterminer le poids de chaque neurone.

<!-- #endregion -->

<!-- #region id="cc024de7" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/comment-fonctionne-un-réseau.png"  width="500" />
    <div>
    <font size="1.5">Image Source: https://aiandi.fr/comment-fonctionne-un-reseau-de-neurones/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="d7b317d0" -->
### <a id=pourquoi-avoir-attendu-si-longtemps-pour-lapprentissage-profond>Pourquoi avoir attendu si longtemps pour l'apprentissage profond?</a>
<!-- #endregion -->

<!-- #region id="455805b2" -->
L'idée générale de l'apprentissage profond date du milieu des années 80 et le premier exemple réellement fonctionnel date du début des années 90. Le domaine a explosé à partir de 2012, lors de la première démonstration pratique
de cette approche lors d'une compétition internationale en classification d'images.

L'émergence de l'apprentissage profond est due principalement à la convergence heureuse de trois grandes voies de développement:

- une immense quantité d'images étiquetées sur l'internet permettant de créer des bases de données d'entraînement,
- de nouveaux algorithmes permettant d'optimiser des millions de paramètres à la fois,
- l'arrivée des processeurs graphiques GPU permettant d'accélérer substantiellement les calculs.
<!-- #endregion -->

<!-- #region id="4fa4372e" -->
### <a id=pour-en-savoir-plus-sur-lapprentissage-profond>Pour en savoir plus sur l'apprentissage profond</a>
<!-- #endregion -->

<!-- #region id="a68a24af" -->
Dans le cadre des formations auquel appartient ce cours, une autre formation spécialisée portant sur les [notions de base de l’apprentissage profond et des réseaux de neurones](https://www.fsg.ulaval.ca/etudes/formation-continue/autoformations-en-ligne/) est disponible aussi en ligne.
<!-- #endregion -->

<!-- #region id="06d457a5" -->
## <a id=quest-ce-que-lapprentissage-par-renforcement>Qu'est-ce que l'apprentissage par renforcement?</a>
<!-- #endregion -->

<!-- #region id="2035def5" -->
La figure suivante montre les principes de base de l'apprentissage par renforcement. Dans cet exemple,
on veut apprendre à un robot à naviguer de l'entrée d'un labyrinthe jusqu'à son centre.

L'environnement correspond à la position du robot dans le labyrinthe. Celui-ci n'a que quatre mouvements
possibles, avancer d'un pas vers le haut, le bas, à gauche ou à droite. L'interpréteur est un système de
vision numérique qui détecte l'état du robot dans le labyrinthe, soit sa position
(x,y). Il détermine aussi si le robot s'est approché ou éloigné du centre et lui accorde une récompense si
c'est le cas, ou une pénalité autrement. L'apprentissage par renforcement est l'algorithme qui
permet au robot de faire le pas suivant en fonction de son historique de déplacements, de récompenses
et de pénalités.

Au début, les mouvements du robot sont erratiques, mais éventuellement son comportement devient cohérent
et il apprend à naviguer le long du labyrinthe. C'est un exemple simple, bien sûr, mais c'est ainsi que
la société DeepMind a réussi à entraînement un système à jouer à de multiples jeux vidéo Atari juste en
observant l'image de chaque jeu, au moyen d'une caméra, et en contrôlant les déplacements de la
*souris* avec la manette virtuelle du jeu (*joystick*).

L'apprentissage par renforcement est particulièrement utile pour apprendre aux ordinateurs à jouer
à des jeux de stratégie (échecs, Go, etc.). Il constitue la technologie de rupture qui a été adoptée
pour apprendre à des ordinateurs à conduire de façon automatique une voiture sans conducteur. Elle se
base sur l'analyse de milliers d'heures de vidéo de conducteurs réels réagissant à leurs environnements
routiers immédiats.
<!-- #endregion -->

<!-- #region id="a3292a6b" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/reinforcement-learning.png"  width="400" />
    <div>
    <font size="1.5">Image Source: https://commons.wikimedia.org/wiki/File:Reinforcement_learning_diagram.svg/</font>
    </div>
</div>

<!-- #endregion -->

<!-- #region id="52a918f3" -->
# <a id=comment-lia-sest-elle-si-bien-démarquée>Comment l'IA s'est-elle si bien démarquée?</a>
<!-- #endregion -->

<!-- #region id="afa8662d" -->
Il y a plusieurs raisons pour cela, mais en voici quelques-unes qui ont fortement marqué les esprits
dans le public, qu'il soit technique ou non.

Elle a proposé de nouvelles façons de faire ce qu'on faisait auparavant. Ce ne sont pas des technologies
de continuité (améliorations itératives), mais plutôt des ruptures technologiques qui sont des façons
différentes et originales d'aborder les mêmes problèmes. Les ruptures technologiques sont initialement
plus lentes à diffuser dans la société, mais leur fécondité incite les ingénieurs à les développer plus
rapidement. Éventuellement, elles remplacent les technologies antérieures.

Elle a permis de réaliser des opérations naturelles pour les humains, mais pour lesquelles on était
incapable de décrire comment on procédait. La reconnaissance d'images est aisée, mais écrire un programme
qui le fait aussi bien que nous était impossible auparavant.

Elle a permis à des systèmes d'apprendre par eux-mêmes, un peu comme le font les enfants procédant à
tâtons dans leur exploration du monde. C'est l'apprentissage par renforcement. Les robots apprennent à
marcher en tombant, en glissant, etc., mais sont encouragés pour leurs efforts, comme le sont les enfants.
<!-- #endregion -->

<!-- #region id="ff2acb23" -->
# <a id=deux-approches-en-analyse-des-données-la-statistique-et-lapprentissage-automatique>Deux approches en analyse des données: la statistique et l'apprentissage automatique</a>

<!-- #endregion -->

<!-- #region id="6dfe7415" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/girl-chat-view.jpeg"  width="400" />
    <div>
    <font size="1.5">Image Source: https://www.flickr.com/photos/dani_vazquez/8261614253/</font>
    </div>
</div>
<p>&nbsp;</p>

<!-- #endregion -->

<!-- #region id="6ce1b9aa" -->
L'éternel dilemne. Il existe deux approches différentes pour analyser les données. La première, la statistique, repose
sur l'usage de tests d'hypothèses pour comprendre les relations entre les différentes variables dans
un modèle. Cette approche date des années 1900-1930. La seconde approche, l'apprentissage automatique,
est basée sur les données elles-mêmes et non sur des hypothèses *a priori* sur leurs distributions.
Elle date principalement des années 1990 et 2000.

Le tableau suivant montre les principales différences entre les deux approches. L'une a émergé des
mathématiques et vise à expliquer un modèle, l'autre a émergé de l'informatique et vise à effectuer de
bonnes prédictions. Ces deux approches sont basées sur des philosophies différentes.
Chacune a ses adeptes et sa culture des données.
<!-- #endregion -->

<!-- #region id="0130a726" -->
|  | <p style="text-align: center;">Statistique</p> | <p style="text-align: center;">Apprentissage automatique</p> |
|:---|:---|:---|
| Origine | Mathématiques | Informatique |
| But | Cherche des relations entre les variables | Cherche à construire des modèles prédictifs |
| Précision | Cherche à quantifier l’incertitude des paramètres du modèle | Cherche à faire des prédictions très précises |
| Prédit l’intervalle de confiance des paramètres et du modèle? | Oui | Non |
| Un ou plusieurs modèles? | Recale les données à un modèle précis | Sélectionne le meilleur modèle parmi plusieurs |
| Hypothèses *a priori* sur les distributions des données | Multiples hypothèses | Aucune hypothèse: approche basée sur les données |
| Valeurs des paramètres d’un modèle | Doivent être estimées pour comprendre celui-ci | Doivent être optimisées pour maximiser la précision des prédictions |
| Langages de programmation | R et SAS | Python |

<!-- #endregion -->

<!-- #region id="fc21e1d3" -->
# <a id=domaines-dapplications>Domaines d'applications</a>
<!-- #endregion -->

<!-- #region id="ee127616" -->
Voici quelques belles réussites de l'IA dans divers domaines autant techniques, sociaux qu'artistiques. Elles utilisent
les méthodes de l'apprentissage automatique classique, de l'apprentissage profond ainsi que l'apprentissage
par renforcement. Sans qu'on ne le sache, plusieurs d'entre elles ouvrent en ce moment de nouveaux champs
d'applications insoupçonnées; pourriez-vous faire des prédictions?
<!-- #endregion -->

<!-- #region id="7fad4096" -->
## Finance et banques
<!-- #endregion -->

<!-- #region id="5be4d667" -->
Voilà des domaines où la maximisation des gains et la minimisation des pertes se font tous les jours.

- La décision d'accorder un prêt ou une hypothèque est basée sur les conséquences de milliers de décisions
antérieures.
- La gestion des portefeuilles est insensible aux émotions des investisseurs, petits et grands, et toujours
dans leur intérêt et celui des banques.
- La négociation électronique à la bourse est plus rapide et réactive que les experts humains.
<!-- #endregion -->

<!-- #region id="382e0b74" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/zendesk-trading.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://www.flickr.com/photos/laughingsquid/14496287471/</font>
    </div>
</div>

<!-- #endregion -->

<!-- #region id="38e7b1b6" -->
## Militaire
<!-- #endregion -->

<!-- #region id="644c4c62" -->
- Planification stratégique tenant compte de l'évolution d'une situation opérationnelle sur le terrain
ou dans un contexte diplomatique.
- Cryptage et décryptage des communications hostiles ... ou non.
- Surveillance satellite.
- Drone de ravitaillement intelligent, autopiloté.
<!-- #endregion -->

<!-- #region id="b47695dc" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/raptor-refueling.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://picryl.com/media/lockheed-martin-mq-25-refuels-a-lockheed-martin-f-22-raptor-373a24</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="c8d0a81d" -->
## Médecine, épidémiologie et biochimie
<!-- #endregion -->

<!-- #region id="ad4f2c67" -->
- Détection plus efficace du cancer, du diabète, etc.
- Modélisation épidémiologique de la propagation de la grippe dans le monde.
- Identification de nouvelles maladies ou de variants d'une même maladie.
- Analyses génomiques, protéomique, etc. plus rapides et précises.
- Détection de la Covid-19 dans les poumons.
- Prédiction de la forme 3-D des protéines à partir de leurs séquences d'ADN ou d'ARN. C'est un pas
en avant dans la fabrication de nouveaux médicaments.
<!-- #endregion -->

<!-- #region id="435d0562" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/medical-images1.jpeg"  width="600" />
    <div>
    <font size="1.5">Image Source: https://peerj.com/articles/cs-349/</font>
    </div>
</div>
<p>&nbsp;</p>
<!-- #endregion -->

<!-- #region id="672cec7e" -->
<div align="center">
    <img src= "../images/protein-structure-prediction.jpeg"  width="400" />
    <div>
    <font size="1.5">Image Source: https://researchoutreach.org/articles/protein-structure-prediction-machine-learning/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="154524d0" -->
## Sécurité
<!-- #endregion -->

<!-- #region id="31cf670e" -->
- Analyse des images des caméras de surveillance.
- Reconnaissance faciale et de la voix.
- Surveillance des communications.
- Tracking des réseaux terroristes.
- Création de cartes du risque de criminalité dans les grandes villes (ici Chicago).
<!-- #endregion -->

<!-- #region id="5603bae6" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/security-map.jpeg"  width="400" />
    <div>
    <font size="1.5">Image Source: https://marcosoliveira.info/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="574914c5" -->
## Droit
<!-- #endregion -->

<!-- #region id="25c36bad" -->
- Prédire les décisions de justice. Est-ce que ça vaut la peine d'aller en appel?
- Trancher les cas simples (remplacement du système judiciaire des petites créances?).
- Aide à la décision lorsque trop de facteurs sont impliqués.
- Recommandation de stratégies de défense ou d'attaque en cour.
- Analyse de milliers de jugements antérieurs pour découvrir des précédents.
<!-- #endregion -->

<!-- #region id="1bb6fb60" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/twelve-men.png"  width="500" />
    <div>
    <font size="1.5">Image Source: https://manufacture.paliens.org/2021/03/24/cote-cine-14-douze-hommes-en-colere//</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="ffea02ca" -->
## Logistique et transports
<!-- #endregion -->

<!-- #region id="6a1298a4" -->
- Planification et optimisation du réseau routier dans les villes et entre les villes.
- Distribution optimale des colis par UPS.
- Gestion de l'inventaire d'une compagnie telle qu'Amazon.
- Fusions d'images, de bases de données et intégration du GPS à toutes les
étapes afin de fournir le maximum d'information aux usagers de Google Map.
- Planification du transport international.
<!-- #endregion -->

<!-- #region id="aa760a26" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/traffic-jam.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://commons.wikimedia.org/wiki/File:Traffic_jam_in_Haikou,_Hainan,_China_01.jpg?uselang=fr/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="39f4df2c" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/container-ship.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://qz.com/877926/alibaba-baba-and-maersk-partner-to-sell-container-ship-spaces-online//</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="d817b04c" -->
## Environnement
<!-- #endregion -->

<!-- #region id="a8266b0f" -->
- Prévisions météo à l'échelle de la planète du phénomène global d'El Niño.
- Prévisions du réchauffement climatique à l'échelle de la planète.
<!-- #endregion -->

<!-- #region id="64cd1490" -->
<div align="center">
    <img src= "../images/el-nino-rainfall.png"  width="600" />
    <div>
    <font size="1.5">Image Source: https://www.ecojesuit.com/10-things-about-el-nino-2014-downgraded-as-a-minor-event-but-response-needs-to-be-upgraded/</font>
    </div>
</div>
<p>&nbsp;</p>
<!-- #endregion -->

<!-- #region id="1c7efd2b" -->
<p>&nbsp;</p>
<div align="center">
    <img src= "../images/global-warming-prediction.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://commons.wikimedia.org/wiki/File:Global_Warming_Predictions_Map.jpg/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="9d6eb647" -->
## Robotique
<!-- #endregion -->

<!-- #region id="4f25c81e" -->
- Création d'androïdes aux mouvements de plus en plus naturels (Boston Dynamics, Engineered Arts, etc.).
- Sondes martiennes intelligentes se déplaçant sur le sol et dans les airs (NASA).
- Atterrissage de la sonde Huygens sur une plaine de méthane gelé de Titan, une lune de la planète Saturne (NASA).
- Atterrissage de la sonde Philae sur la comète 67P/Churyumov-Gerasimenko (ESA).
<!-- #endregion -->

<!-- #region id="e7ddcad5" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/curiosity-rover.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://www.universetoday.com/133274/watch-curiosity-rover-roll-across-mars-surface/</font>
    </div>
</div>
<p>&nbsp;</p>
<!-- #endregion -->

<!-- #region id="0ce7d198" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/huygens-landing.jpeg"  width="300" />
    <div>
    <font size="1.5">Image Source: https://nl.wikipedia.org/wiki/Huygens_(ruimtesonde)/</font>
    </div>
</div>
<p>&nbsp;</p>
<!-- #endregion -->

<!-- #region id="2f450342" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/philae-landing-on-comet.jpeg"  width="400" />
    <div>
    <font size="1.5">Image Source: https://en.wikipedia.org/wiki/Philae_(spacecraft)/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="1e533f31" -->
## Jeux vidéo, de stratégie et cinéma
<!-- #endregion -->

<!-- #region id="11f94aa6" -->
- *Deep Fakes* au cinéma.
- Animations réalistes reproduisant l'environnement physique et les mouvements naturels.
- Stratégies évolutives tenant compte des joueurs en ligne et des parties précédentes.
- Apprentissage des règles de jeux de stratégies par observations et interactions par essais et erreurs.
- Performances surhumaines dans les jeux de stratégie (Go, échecs, etc.).
<!-- #endregion -->

<!-- #region id="be8195c8" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/game-strategy.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://www.goethe.de/prj/zei/en/pdk/22100916.html/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="e340ceed" -->
## Communications
<!-- #endregion -->

<!-- #region id="5b874035" -->
- Reconnaissance de la parole.
- Traduction automatique (parole et textes).
- Traitement automatique du langage naturel (permet de comprendre le langage humain écrit ou parlé).
- Assistant vocal (Google, Alexa, Siri, etc.).
<!-- #endregion -->

<!-- #region id="273b29a0" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/personal-assistants.jpeg"  width="400" />
    <div>
    <font size="1.5">Image Source: https://techboomers.com/best-personal-virtual-assistant/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="0f1c46ea" -->
## Service aux usagers
<!-- #endregion -->

<!-- #region id="d35680a0" -->
- Agents conversationnels (*chatbots*).
- Saisie semi-automatique dans les moteurs de recherche.
- Assistants virtuels.
- Traduction automatique.
- Analyse des sentiments.
- Vérificateurs de l'orthographe (Antidote, Grammarly, etc.).
- Classification et filtrage des courriels.
- Systèmes de recommandation (Amazon, eBay, Netflix, Reverb, etc.).
<!-- #endregion -->

<!-- #region id="87d37ae5" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/books-on-machine-learning.png"  width="600" />
    <div>
    <font size="1.5">Image Source: https://www.r-craft.org/r-news/a-quick-introduction-to-machine-learning//</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="1b0d8045" -->
## Art
<!-- #endregion -->

<!-- #region id="9f224967" -->
- Prédiction et exécution du premier mouvement de la dixième symphonie (inachevée) de Beethoven
en se basant ses premières esquisses de partition et sur ses symphonies précédentes.
- *Deep Dreams*: un générateur d'images hallucinogènes montrant notre faculté à voir des formes là où il n'y en a pas.
- Morphose de peintures célèbres en variant le point de vue.
- Transfert du style artistique d'un artiste (p. ex. Van Gogh) sur une image quelconque.
<!-- #endregion -->

<!-- #region id="093b00de" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/surreal-paintings.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://www.digitalartwork.org/image-gallery/surreal-paintings/</font>
    </div>
</div>
<p>&nbsp;</p>
<!-- #endregion -->

<!-- #region id="3eee6627" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/deep-fakes.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://media.wired.com/photos/5ce837fc3cd5de8fe355e337/master/w_2400,c_limit/Deep-Fake-1905.08233-13.jpg/</font>
    </div>
</div>
<p>&nbsp;</p>
<!-- #endregion -->

<!-- #region id="e901b4c9" -->
<p>&nbsp;</p>
<div align="center">
    <img src="../images/artistic-style-transfer.jpeg"  width="500" />
    <div>
    <font size="1.5">Image Source: https://sefiks.com/2018/07/20/artistic-style-transfer-with-deep-learning/</font>
    </div>
</div>
<!-- #endregion -->

<!-- #region id="eac57c7b" -->
Un dernier exemple montrant la colorisation d'un vieux film en noir et blanc. Voyez cette [bataille de boules de neige]( https://youtu.be/AjToVdbPxbw) tournée à Lyon en 1896. Vos vieilles photos et vidéos de mauvaise qualité que vous avez quand même gardées seront probablement récupérables bientôt!
<!-- #endregion -->
