In [2]:
# Permet de tout executer au lancement du notebook + conserver le notebook actif pendant 2h
from IPython.display import Javascript
from masquer import *
Javascript("""
function repeter(){
IPython.notebook.kernel.execute("a=1");
}
// execute a = 1 en python toutes les 8 minutes pendant 2h
let timerId = setInterval(() => repeter(), 4800);
setTimeout(() => { clearInterval(timerId); alert('fin de cession'); }, 7200000);

// Supprimer la taille limite pour la sortie d'une cellule
IPython.OutputArea.prototype._should_scroll = function(lines) {
    return false;
};
IPython.notebook.kernel.execute("url = '" + window.location + "'");

// Exécuter toutes les cellule du notebook
    require(
        ['base/js/namespace', 'jquery'], 
        function(jupyter, $) {
            
                
                jupyter.actions.call('jupyter-notebook:run-all-cells-below');
                jupyter.actions.call('jupyter-notebook:save-notebook');
                Jupyter.actions.call('jupyter-notebook:hide-header')

        }
    );""")

<IPython.core.display.Javascript object>

# <span style="color:red;"><center>Chapitre 4 : Algorithmique</center></span>

## Introduction

**Si on ne peut guère faire de l'informatique sans algorithmique, l'inverse n'est pas vrai.** D'ailleurs, le plus ancien algorithme (non trivial) connu est souvent attribué au mathématicien grec *Euclide*, il y a environ 2300 ans, bien longtemps avant l'idée même d'ordinateur. Nous y reviendrons un peu plus loin ... De plus, nous utilisons fréquemment des **algorithmes en dehors de l'informatique**, lorsque nous conduisons une voiture par exemple.

Le mot **algorithme** vient du nom d'un mathématicien perse du IXème siècle nommé *Muhammad Ibn Mūsā al-Khuwārizmī*. Le mot **algèbre**, quant à lui, est tiré du titre de son principal ouvrage qui, quelques siècles plus tard, influencera grandement tous les mathématiciens de l'europe médiévale. On le considère aujourd'hui souvent comme le "*père de l'algèbre*".
![muhammad-ibn-musa-al-khwarizmi.png](attachment:muhammad-ibn-musa-al-khwarizmi.png)

## A. Principes d'algorithmique

### I. Programme officiel
|Contenus | Capacités attendues|
|:-|:-:|
|Parcours séquentiel d’un tableau| Écrire un algorithme de recherche d’une occurrence sur des valeurs de type quelconque. Écrire un algorithme de recherche d’un extremum, de calcul d’une moyenne.|
|Tris par insertion, par sélection|Écrire un algorithme de tri. Décrire un invariant de boucle qui prouve la correction des tris par insertion, par sélection.|
|Algorithme des k plus proches voisins|Écrire un algorithme qui prédit la classe d’un élément en fonction de la classe majoritaire de ses k plus proches voisins.|
|Recherche dichotomique dans un tableau trié | Montrer la terminaison de la recherche dichotomique à l’aide d’un variant de boucle.|
|Algorithmes gloutons|Résoudre un problème grâce à un algorithme glouton.|

### II. Qu'est-ce qu'un algorithme ?

Un **algorithme** est comparable à un **protocole** pour les sciences expérimentales ou à une **recette de cuisine** pour la gastronomie. Si, comme pour un protocole ou une recette, il suffit d'un papier et d'un crayon pour écrire un algorithme, on peut par contre le mettre directement en oeuvre sur sa feuille, sans l'aide d'un ordinateur (à condition qu'il ne soit pas trop compliqué). Alors que bien sûr, cela n'aurait pas de sens pour un protocole ou une recette.

#### 1. Définition

Les définitions d'un algorithme sont nombreuses mais on peut par exemple retenir :

Un **algorithme** est une **suite finie d'opérations élémentaires** obéissant à une **enchaînement déterminé** et produisant en **sortie un résultat souhaité**, le plus souvent à partir des **données fournies en entrée**.

On peut le schématiser de la façon suivante :

![Algorithme.JPG](attachment:Algorithme.JPG)

**Remarque :** La traduction d'un même algorithme peut se faire dans différents langages de programmation : on parle **d'implémentation**. Mais sauf erreur de programmation, il donnera les mêmes résultats quelque soit le langage. Par contre, l'implémentation peut être plus ou moins aisée et son exécution plus ou moins efficace, selon le langage choisi. 

#### 2. La notion d'opération élémentaire

Par définition, une **opération élémentaire** est une opération **simple, compréhensible facilement par n'importe qui**. Mais en réalité, cette simplicité est assez **subjective**. Le problème est le même avec un protocole de sciences ou une recette de cuisine :

L'action de "peser" est le plus souvent considéré comme une opération élémentaire et par conséquent, on ne détaille en général pas l'utilisation de la balance (tarage, récipients utilisés, ...). Mais cela n'aura pourtant rien d'évident si c'est un enfant de 5 ans qui lit la recette. A l'opposé, "monter des oeufs en neige" pourra passer pour une opération élémentaire pour un cuisinier expérimenté mais laisser désemparé un débutant.

Pour revenir à l'algorithmique, là aussi **tout dépend du contexte**.

Si on veut décrire un algorithme permettant de trier une liste de valeurs, alors "trier la liste" n'est évidemment pas une opération élémentaire, sinon l'algorithme serait juste constitué de l'instruction "trier la liste" et donc sans intérêt.

Par contre, "trier une liste" pourrait très bien constituer une opération élémentaire dans un algorithme beaucoup plus complexe dont le tri ne serait qu'une étape parmis bien d'autres.

En ce qui nous concerne, nous étudierons des **algorithmes relativement simples** dans lesquels les **opérations élémentaires** seront essentiellement :
- les **opérations** (addition, soustraction, multiplication, division, concaténation, ...)
- les **affectations** (modification de la valeur d'une variable)
- les **modifications de variables de types construits** (ajout et suppression d'un élément, modification d'une valeur, ...)
- les **tests booléens** utilisés dans les structure conditionnelles (comparaison, égalité, présence)

En dehors du problème des boucles, cela revient, à peu de chose près, à **une opération élémentaire par ligne de code**.

#### 3. Multiplicité des algorithmes

En cuisine, il existe plusieurs recettes de gateaux au chocolat. Le choix de la recette peut dépendre du temps qu'on a à y consacrer, de son niveau en cuisine, du contexte dans lequel on cuisine (familial ou professionnel, quotidien ou évènement, ...) mais aussi des ustensiles dont on dispose et de l'argent que l'on peut y mettre.

Il en va de même pour un algorithme en informatique : **il existe plusieurs algorithmes capables de résoudre le même problème**. Parmi tous les algorithmes qui **donnent le résultat voulu** (on veut un gateau au chocolat, pas une mousse de fruits,) **on essaiera de choisir celui qui est le plus adapté à la situation**.

Il n'y en a pas forcément un meilleur que tous les autres, qui n'aurait que des avantages et aucun inconvénient. Et puis on peut toujours se tromper ...


### III.  Le pseudo-langage

Un pseudo-langage sert à **écrire un algorithme sans l'implémenter dans un langage informatique** en particulier. Il permet de décrire les opérations élémentaires qui le constituent dans un **langage compréhensible par tous**.

Le pseudo-langage n'est **pas normalisé**, chacun peut le faire un peu à sa façon mais il y a quand même quelques conventions à suivre.

#### 1. Conventions pour écrire du pseudo-code

**La structure :**
- **une seule instruction** par ligne.
- Ajout d'une **indentation** à chaque fois qu'on commence un **nouveau bloc** (fonction ou structure conditionnelle).
- Essayer de faire **ressortir la structure** logique en mettant les instructions "Pour", "Si", "Tant que", "Fonction", ... en **gras ou majuscules**.

**Les variables :**
- Elles sont **déclarées au début du code** en indiquant leur **type** (int, float, bool, str, ...).
- Elles ont un **nom le plus explicite possible** qui ne **commence pas par un chiffre** et dont les parties sont séparées soit par "_", soit par des majuscules; on **évite les caractères accentués**.

**Les affectations :**
- On utilise le symbole $\leftarrow$, par exemple **$a \leftarrow 2$ signifie qu'on affecte la valeur $2$ à la variable $a$**.

**Les fonctions :**
- Elles dont déclarées en précisant leur **nom et leurs paramètres entre parenthèses**.

#### 2. Exemple du PGCD

**Définition :**

En arithmétique élémentaire, le *plus grand commun diviseur* ou **PGCD** de deux nombres entiers non nuls est le **plus grand entier qui les divise simultanément**.

La **méthode la plus naturelle**, mais aussi la plus longue (on parle de méthode naïve), pour trouver le PGCD de a et b est de chercher tous les diviseurs de a et tous ceux de b puis de les comparer afin de trouver le plus grand diviseur qui soit commun aux deux.

Cherchons pas exemple le PGCD de 385 et 210.  
Les diviseurs de 385 sont (385, 77, 55, **35**, 11, 7, 5, 1) et ceux de 210 sont (210, 105, 70, 42, **35**, 30, 21, 15, 14, 10, 7, 6, 5, 3, 2, 1).  
Leur PGCD est donc égal à 35.

Cela correspond au pseudo-code suivant (on suppose que a > b pour simplifier, sinon il faut échanger a et b au début de la fonction) :

**Fonction** PGCD_naif (a,b)
> *list* : diviseurs_de_a, diviseurs_de_b  
>i $\leftarrow$ a  
>**Tant que** i > 0 **faire**
>>**Si** a *mod* i = 0 **alors**  
>>// mod=modulo=reste de la division entière
>>>*Append* i à diviseurs_de_a    
>>>// on cherche tous les diviseurs de a par ordre décroissant
>>
>>i $\leftarrow$ i-1  

>i $\leftarrow$ b
>
>**Tant que** i > 0 **faire**
>>**Si** b *mod* i = 0 **alors**
>>>*Append* i à diviseurs_de_b     
>>>// on cherche tous les diviseurs de b par ordre décroissant
>>
>>i $\leftarrow$ i-1
>
>**Pour** div *dans* diviseurs_de_b **faire**  
>// on cherche si les diviseurs de b (en commencant par b) sont aussi des diviseurs de a 
>>**Si** div *dans* diviseurs_de_a **alors**     
>>>*Retourner* div

**Exercice d'application :** Ecrire cet algorithme en Python et le tester.

In [None]:
def PGCD_naif (a,b) :
    ...

Cette méthode est assez **simple à comprendre** et **pas très compliquée à écrire** (bien qu'un peu longue).

Par contre, elle n'est **pas très efficace dès que les nombres a et b sont grands** car il faut d'abord chercher tous les diviseurs de chacun puis les comparer un par un pour trouver le plus grand qu'ils aient en commum. En particulier, si les **deux nombres sont premiers entre eux**, 1 est leur seul diviseur commun et il va donc falloir parcourir les listes en entier avant de pouvoir conclure. C'est ce qu'on appelle le **pire cas**.

Heureusement, il existe d'autres méthodes, c'est-à-dire **d'autres algorithmes**, bien **plus efficaces**.

#### 3. Recherche du PGCD par soustraction

Dans cet algorithme, on commence par soustraire le plus grand des deux nombres (disons a) par le plus petit (b donc). Puis on soustrait ce résultat au plus petit des deux premiers nombres ou l'inverse si le résultat est négatif. Puis on recommence jusqu'à arriver à zéro. Les deux derniers chiffres (dont la soustraction vaut zéro) sont le PGCD.

Avec le même exemple que précédemment, cela donne :  
385 - 210 = 175  
210 - 175 = 35  
175 - 35 = 140  
140 - 35 = 105  
105 - 35 = 70  
70 - 35 = 35  
35 - 35 = 0  
PGCD (385, 210) = 35

Soit, en pseudo-code :  
 **Fonction** PGCD_soustraction (a,b)
> u $\leftarrow$ a  
> v $\leftarrow$ b  
> **Tant que** u $\ne$ v **faire**  
>> **Si** u > v **alors**
>>> u $\leftarrow$ u - v
>>
>> **Sinon**  
>>> v $\leftarrow$ v - u
>
> **Retourner** u  

Cet algorithme est **très simple à écrire** mais il n'est **pas évident de comprendre pourquoi il fonctionne**.

Il n'y a pas de longue liste à parcourir mais on voit que le nombre de tours de boucles peut très vite augmenter, en particulier dans le **pire cas où a et b sont très différents** (essayer a = 385 et b = 2 par exemple). Il n'est donc **pas non plus très efficace**.

**Exercice d'application :** Ecrire cet algorithme en Python et le tester.

In [None]:
def PGCD_soustraction (a,b) :
    ...

#### 4 Recherche du PGCD par décomposition en produit de facteurs premiers

Dans cet algorithme, on commence par écrire a et b comme un **produit de nombres premiers**. Le PGCD est alors égal au **produit des facteurs communs aux deux décompositions**.

Avec le même exemple que précédemment, cela donne :  
385 = **5** × **7** × 11  
210 = 2 × 3 × **5** × **7**  
PGCD (385, 210) = 7 × 5 = **35**

Commençons par écrire en pseudo-code une fonction qui renvoit la décomposition en produit de facteurs premiers :  

**Fonction** facteurs_premiers (n)
> *//n doit être > 1*  
> *list* : facteurs  
> *bool* : premier  
> premier $\leftarrow$ Faux  
> temp $\leftarrow$ n  
> **Tant que** premier = Faux **faire**
>> i $\leftarrow$ 2  
>> **Tant que** (temp *mod* i) $\ne$ 0 **faire**  
>>> i $\leftarrow$ i + 1  
>>*// on cherche le premier entier >= 2 qui divise temp*
>>
>> *Append* i *à* facteurs  
>> *// on a trouvé un diviseur, on l'ajoute à la liste des facteurs*
>>
>> **Si** i = temp **alors**
>>> premier = Vrai  
>> *// premier devient vrai si on a trouvé aucun diviseur en dehors de temp lui-même*
>>
>> **Sinon**
>>> temp $\leftarrow$ temp DIV i  
>> *// on remplace temp par le résultat de la division entière (DIV) de temp par i et on recommence*
>
> **Retourner** facteurs

Voici à présent la fonction pour le PGCD :

**Fonction** PGCD_premiers (a,b)  
> *list* : facteurs_communs  
> *int* : result  
> facteurs_de_a $\leftarrow$ facteurs_premiers(a)  
> facteurs_de_b $\leftarrow$ facteurs_premiers(b)  
> *// dans facteurs_de_a et facteurs_de_b, les facteurs premiers sont rangés par ordre croissant en partant de 2*  
> i $\leftarrow$ 0  
> *// cette première boucle parcourt les facteurs de a*  
> **Pour** fac *dans* facteurs_de_a **faire**
>> *// cette deuxième boucle parcourt les facteurs de b*  
>> **Tant que** (i < *longueur*(facteurs_de_b)) **faire**  
>>> **Si** fac < facteurs_de_b\[i\] **alors**  
>>>> **BREAK**  
>>>> *//on passe au facteur suivant de a mais on reste sur le même facteur de b*  
>>>
>>> **Si** fac = facteurs_de_b\[i\] **alors**  
>>>> *Append* fac *à* facteurs_communs  
>>>> i $\leftarrow$ i + 1  
>>>> **BREAK**  
>>>> *//on a trouvé un facteur commun, on passe au facteur de a et de b suivants*
>>>
>>> **Si** fac > facteurs_de_b\[i\] **alors**  
>>>> i $\leftarrow$ i + 1  
>>>> *// on passe au facteur de b suivant sans changer de facteur de a*
>
> result $\leftarrow$ 0  
> *// le PGCD est le produit de tous les facteurs communs*  
> **Pour** fac *dans* facteurs_communs **faire**  
>> result=result × fac  
>
> **Retourner** result  

Cet algorithme est **bien plus compliqué à écrire** mais son **principe est assez simple à comprendre et à démontrer**.

Son **efficacité diminue aussi quand les nombres augmentent** mais par contre, il est **assez régulier** dans le sens où son exécution de dépend pas tellement d'éventuels pires cas.

De plus, on peut **facilement l'améliorer** en ne testant la divisibilité que par les nombres dans la recherche de facteurs premiers (ça ne sert à rien d'essayer de diviser par 4 si on a déjà essayé de diviser 2 fois par 2).

Enfin, il présente l'avantage de trouver au passage la **décomposition en facteurs premiers de a et b**, ce qui peut s'avérer très utile dans d'autres applications.

**Exercice d'application :** Ecrire ces 2 fonctions en Python et les tester.

In [13]:
def facteurs_premiers(n):
    ...
    
def PGCD_premiers (a,b) :
    ...

#### 5. Recherche du PGCD par division

Cet algorithme est celui **d'Euclide**. On commence par effectuer la division entière du plus grand (toujours a) par le plus petit (encore b). Puis on effectue la division entière du plus petit des deux premiers nombres (le diviseur précédent) par le reste de cette première division. On recommence jusqu'à ce que le reste soit égal à zéro. Le PGCD est alors égal au dernier diviseur obtenu.

Avec le même exemple que précédemment, cela donne :  
385 / **210** = 1 reste *175*  
210 / **175** = 1 reste *35*  
175 / **35** = 5 reste *0*  
PGCD (385, 210) = **35**

Soit en pseudo-code (toujours pour a > b) :

**Fonction** PGCD_euclide (a,b)
> *int* : reste  
> u $\leftarrow$ a  
> v $\leftarrow$ b  
> reste $\leftarrow$ b  
> **Tant que** reste $\ne$ 0 **faire**  
>> reste $\leftarrow$ u *mod* v  
>> **Si** reste = 0 **alors**
>>> **Retourner** v
>>
>> **Sinon**  
>>> u $\leftarrow$ v  
>>> v $\leftarrow$ reste

Ce dernier algorithme est **simple à écrire et plutôt efficace quelques soient les cas**, même si, forcément, son **efficacité diminue aussi avec les grands nombres**.

La démonstration mathématique de son **principe n'est pas trop compliquée** si on sait que pgcd(a, b) = pgcd(b, r) où r est le reste de la division entière de a par b (lemme d'Euclide).

Il peut aussi se programmer de manière **récursive** mais vous verrez ça l'année prochaine. ;)

A noter enfin que c'est en réalité une amélioration de l'algorithme par soustraction vu au 3, qui est d'ailleurs parfois considéré comme la version originale de l'algorithme d'Euclide.

**Exercice d'application :** Ecrire cet algorithme en Python et le tester.

In [12]:
def PGCD_euclide (a,b) :
    ...

### IV. Qu'est-ce qu'un bon algorithme ?

Un bon algorithme doit :
- se terminer **sans rester coincé dans une boucle infinie** : c'est la **terminaison**.
- donner le **bon résultat** : c'est la **correction**.
- être efficace, c'est-à-dire s'exécuter dans un **temps raisonnable sans prendre trop de place en mémoire** : c'est la **complexité**.

#### 1. Ce que font les "mauvais" algorithmes

**La boucle infinie :**
Quand un algorithme entre dans une boucle infinie, il peut ne jamais terminer sans qu'il ne se passe rien d'autre de spécial. Mais il peut aussi arriver que les grandeurs calculées "explosent", c'est-à-dire augmentent indéfiniment ...
D'une certaine manière, c'est ce qu'il s'est passé lorsque le prix d'un **livre sur les mouches, vendu sur Amazon en 2011, a atteint la somme record de 23,7 millions de $**. L'histoire est racontée [ici](http://www.michaeleisen.org/blog/?p=358).

**L'erreur dans le résultat :**
En 1999, la **sonde Mars Climate Orbiter**, envoyée par la NASA **se crash à cause d'un bête problème de conversion** entre les unités américaines (pied, pouce) et le système métrique. Voir [ici](https://www.letemps.ch/societe/coup-pouce-chuter-sonde-mars-orbiter).

**Mauvaise gestion de la place en mémoire :**
En 1996, le **premier vol d'essai d'Ariane V se solde par une explosion** un peu plus de 30 secondes après le décollage. Cette explosion est due à un **dépassement d'entier** (valeur trop grande par rapport à ce qui était prévu) dans le programme du calculateur de vol. Voir [ici](https://fr.wikipedia.org/wiki/Vol_501_d%27Ariane_5).

Pour plus d'histoires sur les "bug" célèbres de l'informatique :
- [un site fourni mais un peu ancien](http://tisserant.org/cours/qualite-logiciel/qualite_logiciel.html)
- [un site plus récent mais en anglais](https://www.wired.com/2005/11/historys-worst-software-bugs/)


#### 2. Prouver la terminaison


#### 3. Prouver la correction


#### 4. Calcul de complexité


Dans la suite de ce chapitre, nous allons mettre en oeuvre ces notions d'algorithmie dans le cas des algorithmes suivants :
- algorithmes de **tri** par insertion et par sélection,
- algorithme des **k plus proches voisins**,
- algorithme de recherche **dichotomique**,
- algorithmes **gloutons**.