<img src="Images/Logo.png" alt="Logo NSI" style="float:right">

<h1 style="text-align:center">Chapitre 21 : Programmation dynamique</h1>

Alice pose le problème suivant à Basile.  
Elle dessine sur une feuille de papier une petite grille 2 x 3

<div style="text-align: center">
   <img src="Images/dyn1.png" alt="grille">
</div>

<!---

      +-----+-----+-----+
      |     |     |     |
      |     |     |     |
      +-----+-----+-----+
      |     |     |     |
      |     |     |     |
      +-----+-----+-----+
-->

et demande à Basile combien de chemins mènent du coin supérieur gauche au coin inférieur droit, en se déplaçant uniquement le long de traits horizontaux vers la droite et le long de traits verticaux vers le bas.  
Basile entame une énumération exhaustive mais perd rapidement le compte des chemins qu'il a ou non déjà construits.  
Basile a alors l'idée de noter, à côté de chaque intersection, le nombre total de chemins qui mènent au coin inférieur droit.  
Il commence naturellement par la fin et procède vers le haut et vers la gauche.

<div style="text-align: center">
   <img src="Images/dyn2.png" alt="grille">
</div>

<!---
    
      +-----+-----+-----+
      |     |     |     |
      |     |    2|    1|
      +-----+-----+-----+
      |     |     |     |
      |     |    1|    1|
      +-----+-----+-----+
-->

Ainsi, Basile n'a pas besoin de recompter à chaque fois le nombre de chemins pour les intersections qu'il a déjà traitées et il ne se perd plus dans ses calculs.  
Il parvient rapidement à ses fins, avec la grille ainsi complétée :

<div style="text-align: center">
   <img src="Images/dyn3.png" alt="grille">
</div>

<!---
 
    10     6     3     1
      +-----+-----+-----+
      |     |     |     |
     4|    3|    2|    1|
      +-----+-----+-----+
      |     |     |     |
     1|    1|    1|    1|
      +-----+-----+-----+
-->

qu'il montre fièrement à Alice en lui indiquant que la réponse est 10.  
Alice remarque alors que chaque nombre est la somme du nombre situé à droite et du nombre situé en-dessous, ce que Basile confirme en expliquant qu'un chemin partira soit vers la droite, soit vers le bas.  
Tout excités, Alice et Basile mettent à profit cette idée pour calculer en quelques instants qu'il y a 184756 chemins sur une grille 10 x 10. Alice et Basile viennent d'inventer la **programmation dynamique**.

D'une manière générale, la programmation dynamique est une technique consistant à faire en sorte de ne pas calculer plusieurs fois la même chose, en stockant des résultats intermédiaires dans une structure de données.  
Dans l'exemple ci-dessus, un tableau à deux dimensions permettrait de stocker les nombres de chemins déjà calculés. 

On illustre la programmation dynamique sur deux exemples non triviaux, à savoir le rendu de monnaie et l'alignement de séquences. 

## Rendu de monnaie
Considérons le problème du rendu de monnaie.  
On suppose un système monétaire utilisant des pièces, avec un certain nombre de pièces de différentes sortes, chacune ayant une valeur entière différente.  
Par exemple, on peut imaginer un système avec trois sortes de pièces, avec les valeurs 1, 2 et 5.  
On se pose alors la question, pour un système donné, du nombre minimal de pièces qui est nécessaire pour réaliser une somme donnée.  
Ainsi, il faut au minimum 3 pièces pour réaliser la somme 12 avec le système ci-dessus.  
Mais il n'en faudrait que 2 dans un système qui proposerait des pièces de valeurs 1, 6 et 10.  

En première, on a vu qu'un algorithme glouton, qui favorise toujours la pièce la plus grande possible, répond au problème du rendu de monnaie sous certaines conditions.  
C'est le cas notamment pour un système monétaire comme les euros, c'est-à-dire (1, 2, 5, 10, 20, 50, 100, 200).  
Un tel système est appelé un **système monétaire canonique**.

Dans le cas général, cependant, l'algorithme glouton ne donne pas toujours la réponse optimale.  
Ainsi, pour faire la somme 12 avec le système (1, 6, 10), l'algorithme glouton donne la réponse 3, correspondant à 10 + 1 + 1, au lieu de 2.  

Dans cette section, on étudie un autre algorithme de rendu de monnaie qui donne toujours la solution optimale, quel que soit le système monétaire.  
On cherche à l'écrire sous la forme d'une fonction :

```python
def rendu_monnaie(pieces: list, s: int) -> int
```

où `pieces` est la liste des valeurs des pièces, telle que `[1, 2, 5]` par exemple, et `s` la somme que l'on souhaite obtenir.  
La fonction doit renvoyer le nombre minimal de pièces pour obtenir `s`.  
On suppose que la liste `pieces` contient toujours la valeur 1.  
Ainsi, toute somme peut être obtenue, dans le pire des cas, comme $1 + 1 + ... + 1$.

L'algorithme que nous proposons n'est pas vraiment subtil : il va considérer toutes les façons possibles de parvenir à la somme `s`.  
Pour cela, il procède récursivement :
* Le cas de base est la somme `s = 0`, pour laquelle il ne faut aucune pièce.  
On renvoie donc `0`. 
* Lorsque `s > 0`, on considère chaque valeur `p` dans la liste `pieces` et on calcule récursivement le nombre minimal de pièces pour faire la somme `s - p`.  
À chacune des valeurs obtenues on ajoute `1` (la pièce de valeur `p`) et on prend le minimum de toutes ces réponses. 

Le programme suivant contient le code Python d'une fonction récursive `rendu_monnaie` qui réalise cet algorithme :

In [None]:
def rendu_monnaie(pieces: list, s: int) -> int:
    """Renvoie le nombre minimal de pièces pour faire
       la somme s avec le système pieces"""
    if s == 0:
        return 0
    r = s   # s = 1 + 1 + ... + 1 dans le pire des cas
    for p in pieces:
        if p <= s:
            r = min(r, 1 + rendu_monnaie(pieces, s - p))
    return r

Le programme fonctionne correctement mais il est assez peu performant.  
Ainsi, si on essaye de calculer `rendu_monnaie([1, 2], 100)`, le programme ne termine tout simplement pas.  
Essayons de comprendre ce qui se passe, en comptant le nombre d'appels à la fonction `rendu_monnaie`.  
* Lorsqu'on l'appelle avec 100 comme argument, elle se rappelle deux fois récursivement, une fois avec 99 comme argument et une fois avec 98 comme argument. 
* Puis l'appel sur 99 va provoquer deux appels récursifs, sur 98 et 97 respectivement. 
* On constate qu'on va donc faire deux fois un appel avec 98 comme argument, ce qui provoquerait au total trois appels avec 97 comme argument. 
* Et ainsi de suite, d'une façon rapidement dramatique.

Essayons d'être plus précis encore, en calculant pour chaque valeur de `s` le nombre exact d'appels à la fonction `rendu_monnaie`.  
* Pour `s = 0`, il n'y a qu'un seul appel, à savoir l'appel initial.  
* Pour `s = 1`, il y en a deux, à savoir l'appel initial et l'appel sur `s = 0`.  
* Dans le cas général, il faut compter l'appel initial et les nombres d'appel pour `s - 1` et `s - 2`, c'est-à-dire les deux nombres obtenus précédemment.  

Pour les premières valeurs de `s`, en partant de `0`, on obtient la suite suivante :
$$1,2,4,7,12,20,33,...$$
Si on ajoute un à ces valeurs, on reconnaît la célèbre suite de Fibonacci :
$$2,3,5,8,13,21,34,...$$
Dit autrement, le nombre d'appels à `rendu_monnaie` dans le calcul de `rendu_monnaie([1, 2], n)` est égal à $F_{n+3} - 1$ où $F_n$ désigne le $n$-ième terme de la suite de Fibonacci.  
Or, c'est là une suite qui croît exponentiellement rapidement.  
Ainsi, $F_{50} = 12586269025$, ce qui veut dire que le calcul de `rendu_monnaie([1, 2], 47)` demanderait plus de 12 milliards d'appels.  
Il n'est pas étonnant que le calcul de `rendu_monnaie([1, 2], 100)` ne semblait pas terminer, quand on sait que $F_{103}$ dépasse 1500 milliards de milliards.  

Bien évidemment, dans le cas précis du système `[1, 2]`, la réponse est tellement simple qu'on peut la calculer de tête.  
Mais cet exemple minimal montre à quel point notre solution récursive est rapidement trop coûteuse.  
Mieux encore, il nous a permis d'identifier la source du problème : on appelle la fonction `rendu_monnaie` de très nombreuses fois sur le même argument.  
Ainsi, pendant le calcul de `rendu_monnaie([1, 2], 35)`, qui prend quelques secondes, on appelle $1 346 273$ fois la fonction `rendu_monnaie` avec `s = 5`.


In [None]:
from time import perf_counter

debut = perf_counter()
rendu_monnaie([1, 2], 35)
print(f"Temps nécessaire : {perf_counter() - debut} secondes")

#### Visualisation de la pile d'appels

<div style="text-align: center">
<a href="https://www.recursionvisualizer.com/?function_definition=def%20rendu_monnaie%28pieces%3A%20list%2C%20s%3A%20int%29%20-%3E%20int%3A%0A%20%20%20%20%22%22%22Renvoie%20le%20nombre%20minimal%20de%20pi%C3%A8ces%20pour%20faire%0A%20%20%20%20%20%20%20la%20somme%20s%20avec%20le%20syst%C3%A8me%20pieces%22%22%22%0A%20%20%20%20if%20s%20%3D%3D%200%3A%0A%20%20%20%20%20%20%20%20return%200%0A%20%20%20%20r%20%3D%20s%20%20%20%23%20s%20%3D%201%20%2B%201%20%2B%20...%20%2B%201%20dans%20le%20pire%20des%20cas%0A%20%20%20%20for%20p%20in%20pieces%3A%0A%20%20%20%20%20%20%20%20if%20p%20%3C%3D%20s%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20r%20%3D%20min%28r%2C%201%20%2B%20rendu_monnaie%28pieces%2C%20s%20-%20p%29%29%0A%20%20%20%20return%20r&function_call=rendu_monnaie%28%5B1%2C%202%5D%2C%205%29">
   <img src="Images/recursivite-rendu-monnaie.png" alt="Pile d'appels">
</a>
</div>

C'est là qu'intervient l'idée de la **programmation dynamique** : faire en sorte de ne pas calculer plusieurs fois la même chose.  

La mise en œuvre de cette idée n'est pas si difficile que cela.  
On va utiliser un tableau dans lequel on va stocker successivement la réponse de la fonction `rendu_monnaie` pour toutes les valeurs de `0` jusqu'à `s`.   
Ainsi, on ne recalculera jamais deux fois la même réponse pour une certaine somme : on se contentera de lire sa valeur dans ce tableau.  

Notre nouvelle fonction `rendu_monnaie` commence donc par allouer un tableau, appelé `nb` pour *nombre de pièces*, dont les indices vont de `0` à `s` inclus.

```python
def rendu_monnaie(pieces: list, s: int) -> int:
```
```
    nb = [0] * (s + 1)
```
Ce tableau est ici initialisé avec `0`, ce qui est notamment la bonne valeur pour la somme `0`.  
Ainsi, la première case du tableau est correctement initialisée.  
Il s'agit maintenant de remplir ce tableau pour toutes les sommes de `1` à `s`.  
On le fait avec une boucle `for`.  
Pour chaque indice `n`, c'est-à-dire pour chaque somme `n`, on commence par initialiser `nb[n]` avec `n` car on sait que, dans le pire des cas, on peut faire la somme `n` avec `n` pièces, à savoir `n = 1 + 1 + ... + 1`.

```
    for n in range(1, s + 1):
        nb[n] = n
```

Il faut maintenant se poser la question de savoir si on peut faire mieux.  
Comme dans le programme récursif précédent, on considère successivement toutes les valeurs de la liste `pieces`.  
Pour chaque valeur `p`, on a une solution en `1 + nb[n - p]` pièces, à savoir une pièce de valeur `p` et la meilleure solution possible pour la somme `n - p`, déjà calculée.

```
        for p in pieces:
            if p <= n:
                nb[n] = min(nb[n], 1 + nb[n - p])
```

Avec cette boucle, on calcule donc le minimum de toutes les solutions possibles, ce qui donne bien la solution pour la somme `n`.  
Une fois sorti de ces deux boucles, on a calculé la solution pour toutes les sommes jusqu'à `s` inclus.  
Il n'y a donc plus qu'à renvoyer la valeur de `nb[s]`.

```
    return nb[s]
```
Le programme suivant contient l'intégralité du code.  
On constate qu'il a la même structure que le programme précédent, si ce n'est que l'appel récursif est maintenant remplacé par la consultation du tableau `nb`.

In [None]:
def rendu_monnaie(pieces: list, s: int) -> int:
    """Renvoie le nombre minimal de pièces pour faire
       la somme s avec le système pieces"""
    nb = [0] * (s + 1)
    for n in range(1, s + 1):
        nb[n] = n # n = 1 + 1 + ... + 1 dans le pire des cas
        for p in pieces:
            if p <= n:
                nb[n] = min(nb[n], 1 + nb[n - p])
    return nb[s]

### Efficacité
Notre version de `rendu_monnaie` qui utilise la programmation dynamique est bien plus efficace que la version récursive initiale.  
Ainsi, le calcul de `rendu_monnaie([1, 2], 47)`, qui demandait beaucoup de temps, est maintenant instantané. 

In [None]:
from time import perf_counter

debut = perf_counter()
rendu_monnaie([1, 2], 35)
print(f"Temps nécessaire : {perf_counter() - debut} secondes")

En effet, on a, maintenant, l'allocation d'un tableau de taille 48, une boucle qui parcourt 47 valeurs possibles pour la variable `n` et, pour chacune, une boucle interne qui parcourt deux valeurs possibles pour la variable `p`.  
Le nombre total d'opérations est donc de l'ordre de la centaine, ce qui est ridicule.  
D'une manière générale, le coût est maintenant proportionnel à :

$$len(pieces) \times s$$
en temps et à `s` en espace (pour le tableau `nb`).  

C'est potentiellement plus coûteux que l'algorithme glouton, mais cela fonctionne maintenant pour tous les systèmes monétaires.

### Construire une solution
Notre programme renvoie le nombre minimal de pièces pour obtenir la somme `s` mais il ne donne pas la solution pour autant, c'est-à-dire la liste des pièces à utiliser pour atteindre ce minimum.  
Il est cependant facile de le modifier pour construire une telle solution.  
Il suffit d'ajouter un second tableau qui contient, pour chaque somme entre `0` et `s`, une solution minimale pour cette somme.  
On remplit ce tableau exactement au même moment où on remplit le tableau `nb`. 

Le programme suivant contient une version modifié en suivant cette idée :

In [None]:
def rendu_monnaie_solution(pieces: list, s: int) -> list:
    """Renvoie une liste minimale de pièces pour faire
       la somme s avec le système pieces"""
    nb = [0] * (s + 1)
    sol = [[]] * (s + 1)
    for n in range(1, s + 1):
        nb[n] = n
        sol[n] = [1] * n
        for p in pieces:
            if p <= n and 1 + nb[n - p] < nb[n]:
                nb[n] = 1 + nb[n - p]
                sol[n] = sol[n - p].copy()
                sol[n].append(p)
    return sol[s]

Le second tableau s'appelle `sol`.  
Pour chaque indice `n`, l'élément `sol[n]` est un tableau d'entiers, de taille `nb[n]` , qui donne une solution pour la somme `n`.  
On initialise `sol` avec un tableau vide dans chaque case, ce qui est en particulier correct pour `n = O`.  
La structure du programme est la même qu'auparavant.  
Pour chaque somme `n`, de `1` jusqu'à `s`, on commence par stocker un tableau contenant `n` fois la valeur `1` 
dans `sol[n]` , ce qui correspond à la solution $1 + 1 + ... + 1$.  
Puis on examine toutes les pièces possibles et, lorsqu'une pièce `p` permet d'améliorer la solution, la valeur des deux tableaux est mise à jour.  
Pour mettre à jour la valeur de `sol[n]`, on commence par faire une copie du tableau `sol[n - p]`, avec la méthode `copy`, puis on y ajoute la valeur `p`, avec la méthode `append`.  

Pour une somme donnée, il n'y a pas nécessairement une solution unique.  
Ainsi, avec le système $[1, 3, 6, 7, 10]$, il y a deux solutions minimales pour faire la somme $13$, à savoir $3 + 10$ et $6 + 7$.  
Notre programme va renvoyer une seule de ces solutions.  
En l'occurrence, ici, il va renvoyer le tableau `[10, 3]` correspondant à la première solution.  
En effet, lorsque le programme parvient à `n = 13`, il considère les pièces par ordre croissant :  
* Pour `p = 1`, il détermine qu'on obtient une solution à trois pièces en considérant la solution déjà calculée $12 = 6 + 6$ à deux pièces.  
* Puis, pour `p = 3`, il détermine qu'on obtient de nouveau une meilleure solution, à deux pièces cette fois, en considérant la solution déjà calculée pour la somme $10$, à une seule pièce, ce qui nous fait une solution à deux pièces $3 + 10$.  
* Quand on considère ensuite `p = 6`, on obtient, de nouveau, une solution à deux pièces, qui n'est donc pas strictement meilleure et qui n'est donc pas considérée.  
* De même quand on considère `p = 7` et `p = 10`.  

On est donc resté sur la solution $13 = 3 + 10$, qui est celle renvoyée au final.  

On pourrait encore modifier le programme pour qu'il renvoie toutes les solutions pour faire la somme `s` en minimisant le nombre de pièces.  
Il suffirait pour cela que le tableau `sol` stocke, pour chaque somme, non pas une solution minimale mais toutes les solutions minimales.  
Mais il faut être alors conscient que le temps et l'espace consacrés au stockage de toutes les solutions vont dégrader les performances de notre programme.

## Alignement de séquences
Dans le contexte de la bio-informatique, un problème algorithmique essentiel est celui de l'alignement de séquences, typiquement pour comparer des séquences d'ADN.  
On peut le formaliser en ces termes :  

**Etant données deux chaînes de caractères, il s'agit de mettre en correspondance, *le plus possible*, les caractères de la première chaîne avec ceux de la seconde, en conservant l'ordre des caractères mais en s'autorisant à insérer des trous dans l'une ou l'autre chaîne.**  

Si on considère, par exemple, les chaînes `"GENOME"` et `"ENORME"` , on peut aligner leurs caractères de la façon suivante, où le caractère `-` est utilisé pour désigner un trou :

```
    GENO-ME
    -ENORME
```

Bien entendu, il existe de nombreuses autres façons d'aligner ces deux chaînes.  
En voici une :

```
    GE---NOME
    -ENOR--ME
```

La seule contrainte est que l'on doit utiliser tous les caractères de chaque chaîne, dans l'ordre, et que l'on n'aligne jamais deux trous (c'est-à-dire deux caractères `-`).  

Parmi tous les alignements possibles, on cherche celui qui donne le **score** maximal.  
Le score est ainsi calculé : 
* l'alignement de deux caractères identiques donne un point
* en revanche, l'alignement de deux caractères différents, ce qui inclut l'alignement avec le caractère `-`, enlève un point.  

Ainsi, le premier alignement proposé ci-dessus donne le score 3, car on a 5 caractères correctement alignés et deux mauvais alignements.  
Parmi tous les alignements possibles des chaînes `"GENOME"` et `"ENORME"` , c'est celui qui a le score maximal.  

À noter que les deux chaînes n'ont pas forcément la même longueur.  
Ainsi, l'alignement :

```
    ASTUCIEUX
    -STUDIEUX
```

a le score 5, ce qui est, là encore, maximal.

Comme pour le problème du rendu de monnaie de la section précédente, nous allons commencer par chercher une solution récursive à notre problème (mais cette fois sans écrire le code Python), puis en améliorer l'efficacité grâce à la programmation dynamique.  

Reprenons l'exemple des mots `"GENOME"` et `"ENORME"` et voyons ce qu'il en est de leur dernier caractère.  
Ici, il s'agit du caractère `E` dans les deux cas.  

* Il y a trois cas de figure :
    * soit ces deux `E` sont alignés, on marque un point et on doit aligner les mots `"GENOM"` et `"ENORM"`
    * soit le `E` final de `"GENOME"` est aligné avec `-`, on perd un point et on doit aligner le mot `"GENOM"` avec le mot `"ENORME"` 
    * soit enfin le `E` final de `"ENORME"` est aligné avec `-`, on perd un point et on doit aligner le mot `"GENOME"` avec le mot `"ENORM"`.  
    
Comme il n'y a pas d'autre cas possible, le score maximal sera le maximum des trois scores ainsi obtenus.  
Et comme on s'est ramené à des mots plus petits, plus précisément à une longueur totale des deux mots strictement
plus petite, on peut procéder récursivement.  
Ainsi, dans le premier cas on calcule le score maximal de l'alignement de `"GENOM"` et `"ENORM"`, dans le deuxième cas de `"GENOM"` et `"ENORME"` , et dans le troisième cas de `"GENOME"` et `"ENORM"`.  
À chaque fois, il y a, de nouveau, trois cas de figure, qui nous ramènent à des mots plus courts.  
Et ainsi de suite.  
* Le processus termine lorsque l'un des deux mots n'a plus de caractères.  
Quand, par exemple, on parvient au calcul du score de l'alignement du mot vide `""` et du mot `"GE"`, la réponse est $-2$ car il n'y a pas d'autre choix que d'aligner les deux caractères de `"GE"` avec des caractères `-`.

On pourrait ainsi écrire une fonction récursive `aligne` qui applique l'algorithme ci-dessus.  
Mais, exactement comme pour le rendu de monnaie, elle serait très inefficace car elle passerait son temps à recalculer la même chose.  
En effet, si l'on examine les trois cas ci-dessus, on voit que dans le deuxième cas, le calcul de l'alignement de `"GENOM"` et `"ENORME"` va nous ramener en particulier au calcul de l'alignement de `"GENOM"` et `"ENORM"`, déjà fait dans le premier cas.  
Et de même, dans le troisième cas, le calcul de l'alignement de `"GENOME"` et `"ENORM"` va nous ramener une troisième fois au calcul de l'alignement de `"GENOM"` et `"ENORM"`.  
Ce phénomène de duplication des calculs va se répéter à chaque étape, provoquant une explosion exponentielle des appels récursifs et donc du temps de calcul.  
Ainsi, le calcul du meilleur alignement de deux mots de 10 caractères chacun prend déjà quelques secondes
et celui de deux mots de 20 caractères chacun ne termine tout simplement pas en un temps raisonnable.

#### Visualisation de la pile d'appels

<div style="text-align: center">
<a href="https://www.recursionvisualizer.com/?function_definition=def%20aligne%28s1%3A%20str%2C%20s2%3A%20str%29%20-%3E%20int%3A%0A%20%20%20%20%22%22%22Le%20score%20du%20meilleur%20alignement%20de%20s1%20et%20s2%22%22%22%0A%20%20%20%20if%20len%28s1%29%20%3D%3D%200%3A%0A%20%20%20%20%20%20%20%20return%20-len%28s2%29%0A%20%20%20%20if%20len%28s2%29%20%3D%3D%200%3A%0A%20%20%20%20%20%20%20%20return%20-len%28s1%29%0A%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20return%20max%281%2Baligne%28s1%5B%3A-1%5D%2Cs2%5B%3A-1%5D%29%20if%20s1%5B-1%5D%3D%3Ds2%5B-1%5D%20else%20-len%28s1%29-len%28s2%29-1%2C%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20-1%2Baligne%28s1%5B%3A-1%5D%2Cs2%5B%3A%5D%29%2C%20-1%2Baligne%28s1%5B%3A%5D%2Cs2%5B%3A-1%5D%29%29&function_call=aligne%28%22CGT%22%2C%20%22CAT%22%29">
   <img src="Images/recursivite-alignement.png" alt="Pile d'appels">
</a>
</div>

Mais, comme pour le rendu de monnaie, on peut améliorer notre programme en évitant les calculs redondants grâce à la programmation dynamique.  
Dans le cas du rendu de monnaie, on a utilisé un tableau dans lequel on a stocké, pour chaque somme, la solution optimale.  
Ici, on va utiliser un tableau à deux dimensions dans lequel on va stocker, pour chaque paire de mots, le score maximal.  
Plus précisément, pour deux entiers $i$ et $j$, on va stocker dans la case $(i, j)$ de ce tableau le score maximal de l'alignement des $i$ premiers caractères du premier mot et des $j$ premiers caractères du second mot.

Notre fonction `aligne` commence par calculer la longueur de chacun des deux mots et par allouer un tableau `sc` de la bonne taille.

```python
def aligne(s1: str, s2: str) -> int:
    """Le score du meilleur alignement de s1 et s2"""
```
```
    n1, n2 = len(s1), len(s2)
    sc = [[0] * (n2 + 1) for _ in range(n1 + 1)]
```

Il y a plusieurs remarques importantes ici.  
* D'une part, le premier indice va de `0` à `n1` inclus et le second de `0` à `n2` inclus.  
C'est pourquoi on a écrit `n1 + 1` (resp. `n2 + 1`).  
Le tableau a donc la taille $(n1 + 1) \times (n2 + 1)$. 
* D'autre part, on a utilisé la construction par compréhension pour construire ce tableau à deux dimensions.  
Écrire simplement `[[0] * (n2 + 1)] * (n1 + 1)` aurait été incorrect. 
* Enfin, on a initialisé les cases de ce tableau avec la valeur `0`.  
En particulier, c'est la bonne valeur pour la case $(0,0)$ c'est-à-dire l'alignement de deux mots vides.

Il faut maintenant remplir toutes les autres cases de ce tableau, en mettant dans `sc[i][j]` le score de l'alignement maximal des mots `s1[O:i]` et `s2[0:j]`.  
On va le faire en progressant dans le sens des indices croissants.  
En effet, le calcul de `sc[i][j]` va utiliser les trois valeurs `sc[i - 1][j]`, `sc[i][j - 1]` et `sc[i - 1][j - 1]`. Il faut donc les avoir calculées auparavant.  
En particulier, on peut commencer par initialiser les valeurs `sc[0][j]`, c'est-à-dire la première ligne, et `sc[i][0]`, c'est-à-dire la première colonne.  
Dans les deux cas, il s'agit de l'alignement avec un mot vide, pour lequel la réponse est facile à calculer : il faut supprimer tous les caractères, ce qui produit un score égal à l'opposé de la longueur du mot considéré.

```
    for i in range(1, n1 + 1):
        sc[i][0] = -i
    for j in range(1, n2 + 1):
        sc[0][j] = -j
```

On peut maintenant attaquer le remplissage du reste du tableau, avec une double boucle pour parcourir toutes les cases restantes.

```
    for i in range(1, n1 + 1):
        for j in range(1, n2 + 1):
```

Pour chaque case `sc[i][j]`, il s'agit de calculer le score maximal pour aligner les mots `s1[0:i]` et `s2[0:j]`.  
Comme expliqué plus haut, il y a trois cas de figure, selon l'alignement du dernier caractère de chacun de ces deux mots.  
* On commence par les deux cas où l'un de ces deux caractères est aligné avec `-`.  
Le score est alors obtenu avec un point de pénalité et l'alignement maximal, déjà calculé, pour un mot raccourci d'un caractère, c'est-à-dire soit `sc[i - 1][j]`, soit `sc[i][j - 1]`.

```
            s = max(-1 + sc[i - 1][j], -1 + sc[i][j - 1])
```

* Il reste alors le cas où les deux derniers caractères sont alignés.  
    * Dans ce cas, on marque un point si les caractères coïncident et on perd un point sinon.  
    * Dans les deux cas, on utilise l'alignement maximal déjà calculé pour les deux mots raccourcis chacun d'un caractère, c'est-à-dire `sc[i - 1][j - 1]`.

```
            if s1[i - 1] == s2[j - 1]:
                sc[i][j] = max(s,  1 + sc[i - 1][j - 1])
            else:
                sc[i][j] = max(s, -1 + sc[i - 1][j - 1])
```

Une fois sorti de la double boucle, le tableau est correctement rempli.  
Il ne reste plus qu'à renvoyer la valeur située dans la toute dernière case, qui correspond au score d'alignement des deux mots complets.

```
    return sc[n1][n2]
```

Le programme suivant contient l'intégralité du code :

In [None]:
def aligne(s1: str, s2: str) -> int:
    """Le score du meilleur alignement de s1 et s2"""
    n1, n2 = len(s1), len(s2)
    sc = [[0] * (n2 + 1) for _ in range(n1 + 1)]
    # première ligne et première colonne
    for i in range(1, n1 + 1):
        sc[i][0] = -i
    for j in range(1, n2 + 1):
        sc[0][j] = -j
    # le reste
    for i in range(1, n1 + 1):
        for j in range(1, n2 + 1):
            s = max(-1 + sc[i - 1][j], -1 + sc[i][j - 1])
            if s1[i - 1] == s2[j - 1]:
                sc[i][j] = max(s, 1 + sc[i - 1][j - 1])
            else:
                sc[i][j] = max(s, -1 + sc[i - 1][j - 1])
    return sc[n1][n2]

Il est utile de visualiser et de bien comprendre le tableau `sc` que ce programme construit.  
Si on reprend l'exemple des mots `"GENOME"` et `"ENORME"`, le tableau obtenu au final est celui-ci :

|   |       |    |    |    |    |    |    |    |
|---|-------|----|----|----|----|----|----|----|
|   |       |    | **E**  | **N**  | **O**  | **R**  | **M**  | **E**  |
|   | i \ j | 0  | 1  | 2  | 3  | 4  | 5  | 6  |
|   | 0     | 0  | -1 | -2 | -3 | -4 | -5 | -6 |
| **G** | 1     | -1 | -1 | -2 | -3 | -4 | -5 | -6 |
| **E** | 2     | -2 | 0  | -1 | -2 | -3 | -4 | -4 |
| **N** | 3     | -3 | -1 | 1  | 0  | -1 | -2 | -3 |
| **O** | 4     | -4 | -2 | 0  | 2  | 1  | 0  | -1 |
| **M** | 5     | -5 | -3 | -1 | 1  | 1  | 2  | 1  |
| **E** | 6     | -6 | -4 | -2 | 0  | 0  | 1  | 3  |

On peut examiner par exemple comment a été calculé le résultat final, c'est-à-dire `sc[6][6]`.  
Puisque les caractères `s1[5]` et `s2[5]` coïncident, on a :

    sc[6][6] = max(1 + sc[5][5], -1 + sc[5][6], -1 + sc[6][5])
             = max(1 + 2, -1 + 1, -1 + 1)
             = 3
    
Si prend un autre cas de figure où les caractères ne coïncident pas, comme par exemple le cas de `sc[4][5]`, on a :

    sc[4][5] = max(-1 + sc[3][4], -1 + sc[3][5], -1 + sc[4][4])
             = max(-1 + -1, -1 + -2, -1 + 1)
             = 0
Une autre façon de lire ce tableau est la suivante : 
* quand on monte, c'est qu'on aligne le caractère correspondant à la ligne avec `-`
* quand on va à gauche, c'est qu'on aligne le caractère correspondant à la colonne avec `-`
* enfin, quand on va en diagonale vers le haut et la gauche, c'est qu'on aligne les deux caractères correspondant à la ligne et à la colonne.  

En particulier, le score maximal, obtenu au final, correspond à un certain chemin de la case en bas à droite jusqu'à la case en haut à gauche qui, à chaque étape, choisit entre aller vers le haut, aller vers la gauche ou aller en diagonale vers le haut et la gauche.  
Comme pour le rendu de monnaie, il est possible de modifier le programme pour qu'il renvoie la solution, c'est-à-dire l'alignement réalisant le score maximal.

### Efficacité
L'efficacité de ce programme est facile à évaluer.  
* Si les deux mots `s1` et `s2` ont une longueur respective $N$ et $M$, on a alloué un tableau de taille $N \times M$. 
* On l'a ensuite rempli avec quelques calculs élémentaires pour chaque case, ce qui prend un temps proportionnel à $N \times M$.  

En particulier, le calcul de l'alignement de deux mots de 20 caractères chacun, qui n'aurait jamais terminé en un temps raisonnable avec une simple fonction récursive, termine, maintenant, instantanément, avec quelques centaines d'opérations élémentaires seulement.

### Mémoïsation
La programmation dynamique n'est pas la seule façon d'éviter les calculs redondants.  
Une autre technique consiste à utiliser un *dictionnaire*, dans lequel on stocke les calculs déjà effectués.  
Plus précisément, pour effectuer le calcul de $f(a)$, on commence par regarder dans le dictionnaire, indexé par $a$, si la valeur de $f(a)$ est déjà connue. Le cas échéant, on la renvoie.  
Sinon, on calcule la valeur $v$ de $f(a)$, on remplit le dictionnaire avec $a \mapsto v$, puis on renvoie $v$.  
Ainsi, si on cherche plus tard à recalculer $f$ pour la même valeur $a$, alors le calcul sera immédiat. 

Voici par exemple le programme `rendu_monnaie` réécrit avec cette idée :

In [None]:
memo = {0: 0}
def rendu_monnaie(pieces: list, s: int) -> int:
    if s in memo:
        return memo[s]
    r = s
    for p in pieces:
        if p <= s:
            r = min(r, 1 + rendu_monnaie(pieces, s - p))
        memo[s] = r
    return r

Il a toujours la structure récursive du programme mais il est maintenant aussi efficace que le programme, en version programmation dynamique (modulo les limites de la récursion de Python).

#### Visualisation de la pile d'appels

<div style="text-align: center">
<a href="https://www.recursionvisualizer.com/?function_definition=memo%20%3D%20%7B0%3A%200%7D%0Adef%20rendu_monnaie%28pieces%3A%20list%2C%20s%3A%20int%29%20-%3E%20int%3A%0A%20%20%20%20if%20s%20in%20memo%3A%0A%20%20%20%20%20%20%20%20return%20memo%5Bs%5D%0A%20%20%20%20r%20%3D%20s%0A%20%20%20%20for%20p%20in%20pieces%3A%0A%20%20%20%20%20%20%20%20if%20p%20%3C%3D%20s%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20r%20%3D%20min%28r%2C%201%20%2B%20rendu_monnaie%28pieces%2C%20s%20-%20p%29%29%0A%20%20%20%20%20%20%20%20memo%5Bs%5D%20%3D%20r%0A%20%20%20%20return%20r&function_call=rendu_monnaie%28%5B1%2C%202%5D%2C%205%29">
   <img src="Images/recursivite-rendu-monnaie-memo.png" alt="Pile d'appels">
</a>
</div>

La programmation dynamique et la mémoisation sont deux techniques différentes pour atteindre le même objectif, à savoir améliorer la complexité en évitant de calculer deux fois la même chose.  
Dans l'immense majorité des cas, elles sont interchangeables. Il existe cependant quelques cas de figure où la programmation dynamique permet un contrôle plus fin de la mémoire utilisée (en *oubliant* des valeurs précédemment calculées dont on sait qu'elles ne seront plus utiles).  
À l'inverse, la mémoïsation est bien plus simple à mettre en œuvre. 

### Lien avec la technique *diviser pour régner*
La programmation dynamique n'est pas sans rapport avec la technique *diviser pour régner*.  
En effet, il n'est pas rare de commencer par concevoir une décomposition récursive d'un problème, comme dans le chapitre précédent, pour se rendre compte ensuite que certains appels récursifs vont être effectués plusieurs fois avec les mêmes arguments.  
On peut alors employer la programmation dynamique ou la mémoisation pour y remédier.

## Exercices
### Exercice 1
Expliciter (à la main) tous les appels récursifs à la fonction `rendu_monnaie` du programme :

```python
def rendu_monnaie(pieces: list, s: int) -> int:
    """Renvoie le nombre minimal de pièces pour faire
       la somme s avec le système pieces"""
    if s == 0:
        return 0
    r = s   # s = 1 + 1 + ... + 1 dans le pire des cas
    for p in pieces:
        if p <= s:
            r = min(r, 1 + rendu_monnaie(pieces, s - p))
    return r
```
quand on lance `rendu_monnaie([1, 2], 3)`.  
Identifier les calculs redondants.

### Exercice 2
Quel est le tableau construit par le programme : 

```python
def rendu_monnaie(pieces: list, s: int) -> int:
    """Renvoie le nombre minimal de pièces pour faire
       la somme s avec le système pieces"""
    nb = [0] * (s + 1)
    for n in range(1, s + 1):
        nb[n] = n # n = 1 + 1 + ... + 1 dans le pire des cas
        for p in pieces:
            if p <= n:
                nb[n] = min(nb[n], 1 + nb[n - p])
    return nb[s]
```
quand on calcule `rendu_monnaie([1, 6, 10], 12)`?  
Le calculer à la main.

### Exercice 3
La suite de Fibonacci est la suite d'entiers $(F_n)$ définie par $F_0 = 0$, $F_1 = 1$ et, pour tout entier $n$ à partir de 2, $F_n = F_{n-1} + F_{n-2}$.  

Écrire une fonction `fibonacci(n)` qui calcule la valeur de $F_n$ en utilisant la programmation dynamique.

### Exercice 4
La suite de Fibonacci est la suite d'entiers $(F_n)$ définie par $F_0 = 0$, $F_1 = 1$ et, pour tout entier $n$ à partir de 2, $F_n = F_{n-1} + F_{n-2}$.  

Écrire une fonction `fibonacci(n)` qui calcule la valeur de $F_n$ en utilisant la mémoïsation.

### Exercice 5
Calculer à la main le tableau des scores d'alignement pour les deux mots `"CHAT"` et `"CAT"`.

### Exercice 6
Quel est le score maximal de l'alignement des mots `AAAAAAAAAA` et `BBBBBBBBBB` (10 caractères chacun)?  
Quelle est la forme du tableau calculé par le programme :

```python
def aligne(s1: str, s2: str) -> int:
    """Le score du meilleur alignement de s1 et s2"""
    n1, n2 = len(s1), len(s2)
    sc = [[0] * (n2 + 1) for _ in range(n1 + 1)]
    # première ligne et première colonne
    for i in range(1, n1 + 1):
        sc[i][0] = -i
    for j in range(1, n2 + 1):
        sc[0][j] = -j
    # le reste
    for i in range(1, n1 + 1):
        for j in range(1, n2 + 1):
            s = max(-1 + sc[i - 1][j], -1 + sc[i][j - 1])
            if s1[i - 1] == s2[j - 1]:
                sc[i][j] = max(s,  1 + sc[i - 1][j - 1])
            else:
                sc[i][j] = max(s, -1 + sc[i - 1][j - 1])
    return sc[n1][n2]
```
sur ces deux mots?

### Exercice 7
Écrire une fonction `affiche(s1, s2, sc)` qui affiche la table des scores calculée par le programme :

```python
def aligne(s1: str, s2: str) -> int:
    """Le score du meilleur alignement de s1 et s2"""
    n1, n2 = len(s1), len(s2)
    sc = [[0] * (n2 + 1) for _ in range(n1 + 1)]
    # première ligne et première colonne
    for i in range(1, n1 + 1):
        sc[i][0] = -i
    for j in range(1, n2 + 1):
        sc[0][j] = -j
    # le reste
    for i in range(1, n1 + 1):
        for j in range(1, n2 + 1):
            s = max(-1 + sc[i - 1][j], -1 + sc[i][j - 1])
            if s1[i - 1] == s2[j - 1]:
                sc[i][j] = max(s, 1 + sc[i - 1][j - 1])
            else:
                sc[i][j] = max(s, -1 + sc[i - 1][j - 1])
    return sc[n1][n2]
```

sous la forme suivante :

          E  N  O  R  M  E
       0 -1 -2 -3 -4 -5 -6
    G -1 -1 -2 -3 -4 -5 -6
    E -2  0 -1 -2 -3 -4 -4
    ...
    
Pour obtenir un tel alignement, on pourra utiliser la commande `print(f"{n:>3}", end="")` qui affiche la valeur `n` sur exactement trois caractères, alignés à droite, qu'il s'agisse d'un entier ou d'un caractère.

### Exercice 8
Modifier le programme : 

```python
def aligne(s1: str, s2: str) -> int:
    """Le score du meilleur alignement de s1 et s2"""
    n1, n2 = len(s1), len(s2)
    sc = [[0] * (n2 + 1) for _ in range(n1 + 1)]
    # première ligne et première colonne
    for i in range(1, n1 + 1):
        sc[i][0] = -i
    for j in range(1, n2 + 1):
        sc[0][j] = -j
    # le reste
    for i in range(1, n1 + 1):
        for j in range(1, n2 + 1):
            s = max(-1 + sc[i - 1][j], -1 + sc[i][j - 1])
            if s1[i - 1] == s2[j - 1]:
                sc[i][j] = max(s, 1 + sc[i - 1][j - 1])
            else:
                sc[i][j] = max(s, -1 + sc[i - 1][j - 1])
    return sc[n1][n2]
```

pour qu'il renvoie également la solution donnant le meilleur score, sous la forme d'un couple de chaînes de caractères de même longueur contenant d'éventuels caractères `-`.  
Ainsi, sur les deux chaînées `"GENOME"` et `"ENORME"` , le programme doit renvoyer `(3, ("GENO-ME", "-ENORME"))`. 

### Exercice 9
Dans le problème de l'alignement de séquences d'ADN, on utilise en pratique un calcul des scores plus subtil, qui dépend des caractères qui sont alignés (pour tenir compte du nombre de nucléotides identiques ou similaires qui sont mis en correspondance).  
Pour cela, on se donne une **matrice de similarités**.  
Par exemple, pour des chaînes formées uniquement des caractères `A`, `G`, `C` et `T`, on peut se donner la matrice suivante:

|     | `A` | `G` | `C` | `T` |
|-----|-----|-----|-----|-----|
| `A` | 10  | -1  | -3  | -4  |
| `G` | -1  | 7   | -5  | -3  |
| `C` | -3  | -5  | 9   | 0   |
| `T` | -4  | -3  | 0   | 8   |

Indiquer comment représenter une telle matrice en Python (dans une variable globale `sim`).  
Par ailleurs, on se donne aussi une variable globale `gap` pour le score d'un alignement avec le caractère `-` (par exemple `gap = -5`).

Modifier le programme :

```python
def aligne(s1: str, s2: str) -> int:
    """Le score du meilleur alignement de s1 et s2"""
    n1, n2 = len(s1), len(s2)
    sc = [[0] * (n2 + 1) for _ in range(n1 + 1)]
    # première ligne et première colonne
    for i in range(1, n1 + 1):
        sc[i][0] = -i
    for j in range(1, n2 + 1):
        sc[0][j] = -j
    # le reste
    for i in range(1, n1 + 1):
        for j in range(1, n2 + 1):
            s = max(-1 + sc[i - 1][j], -1 + sc[i][j - 1])
            if s1[i - 1] == s2[j - 1]:
                sc[i][j] = max(s, 1 + sc[i - 1][j - 1])
            else:
                sc[i][j] = max(s, -1 + sc[i - 1][j - 1])
    return sc[n1][n2]
```

pour qu'il utilise ces deux variables dans le calcul du score.

### Exercice 10
Écrire une fonction `chemins(n, m)` qui calcule le nombre de chemins, sur une grille $n \times m$, qui mènent du coin supérieur gauche au coin inférieur droit, en se déplaçant uniquement le long des traits horizontaux
vers la droite et le long des traits verticaux vers le bas.  
Vérifier les valeurs trouvées en introduction à ce chapitre.

## Travaux pratiques
* [Moindres carrés, par segments](Travaux_Pratiques/TP_Moindres_carrés-par_segments.ipynb)

## Liens :
* Document accompagnement Eduscol : [Programmation dynamique](https://cache.media.eduscol.education.fr/file/NSI/63/7/RA20_NSI_G_T_progdyn_1298637.pdf)
* Interstices : [Alignement optimal et comparaison de séquences génomiques et protéiques](https://interstices.info/alignement-optimal-et-comparaison-de-sequences-genomiques-et-proteiques/)
* Brèves de Maths : [Richard Bellman et la programmation dynamique](http://www.breves-de-maths.fr/richard-bellman-et-la-programmation-dynamique/)
* Data Structure Visualizations : [Dynamic Programming (Making Change)](https://www.cs.usfca.edu/~galles/visualization/DPChange.html)
* Data Structure Visualizations : [Dynamic Programming (Longest Common Subsequence)](https://www.cs.usfca.edu/~galles/visualization/DPLCS.html)
* Data Structure Visualizations : [Dynamic Programming (Fibonacci)](https://www.cs.usfca.edu/~galles/visualization/DPFib.html)
* Wandida, APFL : Introduction à l'Informatique - Conception des Algorithmes
    * [Approche descendante](https://youtu.be/7k1so3KM4S4)
    * [Diviser pour régner](https://youtu.be/c1salakVOq0)
    * [Récursivité : principes](https://youtu.be/c1salakVOq0)
    * [Récursivité : terminaison](https://youtu.be/ttqcGZj1NnE)
    * [Récursivité : déroulement](https://youtu.be/6Ms0EHuM_9k)
    * [Programmation dynamique](https://youtu.be/9P7CZhaPXsc)
    * [Plus court chemin](https://youtu.be/FRw1l3JQkww)