In [None]:
from rcviz import viz # fonctionnalité permettant de visualiser des arbres d'appels récursifs

<h1 class="alert alert-success">Programmation dynamique et mémoïsation</h1>

Avant de découvrir l'approche de programmation dynamique pour résoudre un problème, nous allons voir la technique de mémoïsation qui n'est pas à proprement parler de la programmation dynamique, même si on les trouve assez souvent associés.

<h2 class="alert alert-info">1. La suite de Fibonacci :</h2>

Cette suite mathématique  célèbre est définie par récurrence selon le schéma suivant :

$u_0  = 1$

$u_1  = 1$

$u_n = u_{n-1} + u_{n-2}$

<h3 class="alert alert-warning">Algorithme récursif naïf</h3>

On peut évidemment traduire très simplement une suite définie par récurrence en  mathématique avec une fonction récursive.

In [None]:
@viz # décorateur permettant plus tard de visualiser l'arbre des appels récursifs
def fibo_rec(n):
    """ Renvoie le n_ème terme de la suite de Fibonacci """
    assert isinstance(n, int) and n >= 0, "n est un entier positif"
    if n <= 1: # condition d'arrêt
        return 1
    else:
        # COMPLETER LA LIGNE SUIVANTE :
        # return ...

In [None]:
for i in range(10):
    print(i, fibo_rec(i))

**Problème** : on *re-calcule beaucoup de choses* ! **Très lourd en mémoire et la pile de récursion risque vite d'exploser**.

**Exercice papier** : réaliser à la main tous les calculs par l'appel de ```fibo_rec(5)```.

Comment de fois avez-vous dû calculer fibo_rec(0) et fibo_rec(1) ?

In [None]:
fibo_rec(5)

In [None]:
# exploitation du module de visualisation 
# permet de contrôler votre travail précédent
fibo_rec.callgraph()

<h3 class="alert alert-warning">Approche récursive avec mémoïsation (bottom-down)</h3>

L'idée est de **stocker dans un tableau annexe toutes les valeurs déjà calculées** une fois pour ne pas recommencer !

**On conserve l'approche descendante de la récursivité** : la solution globale fait appel au fur et à mesure au solutions des sous-problèmes (en vérifiant si une valeur n'a pas déjà été mémorisée avant de se lancer dans le calcul récursif).

In [None]:
def fibo_memo(n):
    print(memoire) # pour visualiser l'évolution des calculs déjà connus
    if memoire[n] is None:  # si la valeur n'a pas déjà été calculée, on le fait ci-dessous :
        memoire[n] = fibo_memo(n-1) + fibo_memo(n-2)
    return memoire[n]
    
# on 'prépare' la mémoire et on appelle la fonction récursive avec memoïsation
memoire = [None for _ in range(10)] 
memoire[0], memoire[1] = 1, 1 # cas particuliers connus dès le début

fibo(9), memoire

In [None]:
@viz
def fibo_memo(n):
    if memoire[n] is None:  # si la valeur n'a pas déjà été calculée, on le fait ci-dessous :
        memoire[n] = fibo_memo(n-1) + fibo_memo(n-2)
    return memoire[n]

Exécuter la cellule suivante et comparer la rapidité d'exécution par rapport à la fonction `fibo_rec` du début de TP.

In [None]:
for n in range(2, 10):
    memoire = [None for _ in range(n+1)] 
    memoire[0], memoire[1] = 1, 1
    print(n, fibo_memo(n))

**Exercice papier** : réaliser à la main tous les calculs par l'appel de ```fibo_memo(5)```.

Comment de fois avez-vous dû calculer fibo(0), fibo(1), fibo(2), fibo(3) et fibo(4) ?

In [None]:
memoire = [None for _ in range(6)] 
memoire[0], memoire[1] = 1, 1
fibo_memo(5)

In [None]:
fibo_memo.callgraph()

<h3 class="alert alert-warning">Approche par la programmation dynamique</h3>

L'**approche ascendante de la programmation dynamique** consiste à construire **de façon itérative** les **solutions des sous-problèmes** pour atteindre la solution globale qui combine ces sous-problèmes.

Pour calculer fibo(5), on calcule donc d'abord fibo(0), puis fibo(1), puis fibo(2), etc, jusqu'à fibo(5). Chaque calcul intermédiaire est stocké dans un tableau "mémoire".

In [None]:
def fibo_dyn(n):
    """ Renvoie le n_ème terme de la suite de Fibonacci """
    assert isinstance(n, int) and n >= 0, "n est un entier positif"
    if n <= 1: # cas particulier
        return 1
    else:      # on 'prépare' la mémoire (tableau f) avant d'entrer dans le coeur itératif du calcul
        f = [None for _ in range(n+1)] 
        f[0], f[1] = 1, 1 # 2 cas de base
        for i in range(2, n+1):
            # COMPLETER LA LIGNE SUIVANTE :
            # f[i] = ...
    return f[n]

In [None]:
for i in range(10):
    print(i, fibo_dyn(i))

**Exercice papier** : réaliser à la main tous les calculs par l'appel de ```fibo_dyn(5)```.

Écrire l'état de la mémoire (le tableau f) à chaque itération.

<h3 class="alert alert-warning">Simplification possible (gain de mémoire)</h3>

Dans certains cas, comme celui du calcul du n_ème terme de la suite de Fibonacci, on peut alléger le programme **si seule la solution finale du problème nous intéresse**. Dans le programme précédent, on a en fait calculé **tous les termes** de la suite jusqu'au n_ème. 

Observer la fonction suivante qui conserve un caractère itératif, sans utiliser plus de mémoire que nécessaire (il suffit de toujours garder seulement les 2 derniers termes de la suite).

In [None]:
def fibo_iter(n):
    """ Renvoie le n_ème terme de la suite de Fibonacci """
    assert isinstance(n, int) and n >= 0, "n est un entier positif"
    if n <= 1: # cas particulier
        return 1
    else:     
        a, b = 1, 1 # a est le terme de rang (n-1) et b le terme de rang (n)
        for i in range(2, n+1):
            a, b = b, a + b # utilisation astucieuse de l'échange de variables
    return b

In [None]:
for i in range(10):
    print(i, fibo_iter(i))

<h2 class="alert alert-info">2. La pyramide des nombres :</h2>

(*Extrait de Wikipedia https://fr.wikipedia.org/wiki/Programmation_dynamique#Pyramide_de_nombres*)

         3
        7 4
       2 4 6
      9 5 9 3

Dans une pyramide de nombres, on cherche, en partant du sommet de la pyramide, et en se dirigeant vers le bas à chaque étape (vers le fils droit ou le fils gauche), à maximiser le total des nombres traversés. Vous pouvez vérifier que dans l'exemple ci-dessus, le maximum possible est 23 (3+7+4+9).

Un algorithme naïf, sur l'exemple, consiste à examiner les 8 chemins possibles, et choisir celui qui a le plus grand total. En général, quand la pyramide a $n$ niveaux, il y a $2^{n-1}$ chemins et $2^{n}-2$ calculs à effectuer. Donc l'algorithme naïf est en temps exponentiel en $n$.

Le paradigme de la programmation dynamique permet d'obtenir un algorithme efficace en définissant des sous-problèmes.

Pour toute position $x$ dans la pyramide, notons $v ( x )$ le nombre écrit à cette position et $c ( x )$  le total des nombres traversés dans un chemin maximal issu de $x$. **Les sous-problèmes consistent à calculer les valeurs de $c ( x )$ pour tout $x$. Le problème complet consiste à calculer $c ( x )$ lorsque $x$ est le sommet de la pyramide**.

Voyons maintenant la manière de déterminer $c ( x )$ :

- $c ( x ) = v ( x )$ pour toute position $x$ situé au rez-de chaussée de la pyramide
- $c ( x ) = v ( x ) + max ( c ( g ( x ) ) , c ( d ( x ) ) )$ pour toute autre position $x $, où $g ( x )$ et $d ( x )$ sont le "fils gauche" et le "fils droit" sous la position $x $.

Si on cherche à calculer directement par la définition récursive, on évalue plusieurs fois la même valeur; dans l'exemple ci-dessus, la valeur 4 du 1er étage est calculée deux fois en venant de la ligne supérieure (une fois depuis le 7, une fois depuis le 4). Le paradigme de la programmation dynamique consiste à calculer les valeurs $c ( x )$  à l'aide d'un algorithme itératif ascendant en stockant les valeurs déjà calculées dans un tableau.

Le nombre de calculs est seulement $n ( n − 1 ) / 2$.

In [None]:
# Implémentation possible de la pyramide : chaque étage est un tableau et la pyramide est un tableau d'étages.
# On écrit la base de la pyramide (rez-de-chaussée = étage 0) à l'indice 0.
pyramide = [[9, 5, 9, 3], [2, 4, 6], [7, 4], [3]]

<h3 class="alert alert-warning">Approche dynamique</h3>

La "mémoire" est un tableau avec la même structure que la pyramide.
Elle est initialisée avec les valeurs de la pyramide $v(x)$, puis prendra les valeurs $c(x)$ au fur et à mesure en remontant la pyramide.

A chaque étape (en partant du 1er étage de la pyramide et en montant dans les étages jusqu'au sommet), et pour chaque nombre de l'étage, on conserve le maximum des 2 chemins possibles vers son fils gauche ou son fils droit.

In [None]:
def pyramide_dyn(pyramide):
    """ Approche en programmation dynamique """
    taille = len(pyramide)
    memoire = [[valeur for valeur in etage] for etage in pyramide] # initialisation de la mémoire
    for etage in range(1, taille):
        for rang in range(taille-etage):
            # COMPLETER LA LIGNE SUIVANTE :
            # memoire[etage][rang] = ...
    return memoire[-1][0] # sommet de la pyramide

In [None]:
pyramide_dyn(pyramide)

<h3 class="alert alert-warning">Récursif sans mémoire</h3>

On propose ci-dessous un algorithme récursif de résolution.

Le maximum depuis un sommet quelconque est la valeur de ce sommet augmenté du maximum entre les 2 chemins partant vers son fils droit ou son fils gauche.

In [None]:
def pyramide_rec(pyramide, etage, rang):
    """ Approche récursive sans mémoïsation """
    if etage == 0:
        return pyramide[0][rang]
    else:
        return pyramide[etage][rang] + max(pyramide_rec(pyramide, etage-1, rang), pyramide_rec(pyramide, etage-1, rang+1))

In [None]:
pyramide_rec(pyramide, len(pyramide)-1, 0)

**Exercice papier** : réaliser à la main tous les calculs par l'appel de ```pyramide_rec(pyramide, 3, 0)```.
Certains calculs sont-ils réalisés plusieurs fois ?

<h3 class="alert alert-warning">Approche avec mémoïsation</h3>

Pour ne pas recalculer plusieurs fois des chemins déjà calculés, on utilise la technique de mémoïsation.

In [None]:
def pyramide_memo(pyramide):
    """ Approche avec mémoïsation """
    def calcul(etage, rang):
        if etage == 0:                # à la base de la pyramide, on connait les maximum :
            return pyramide[0][rang]  # ce sont les nombres eux-mêmes
        else:
            a, b = memoire[etage-1][rang], memoire[etage-1][rang+1]
            if a is None and b is None: # on ne connait aucun des fils gauche ou droit
                memoire[etage][rang] = pyramide[etage][rang] + max(calcul(etage-1, rang), calcul(etage-1, rang+1))
            elif b is None:             # on connait déjà le fils gauche
                memoire[etage][rang] = pyramide[etage][rang] + max(a, calcul(etage-1, rang+1))
            else:                       # on connait déjà le fils droit
                memoire[etage][rang] = pyramide[etage][rang] + max(calcul(etage-1, rang), b)
            return memoire[etage][rang]

    taille = len(pyramide)
    memoire = [[None for valeur in etage] for etage in pyramide] # initialisation de la mémoire 
    return calcul(taille-1, 0)

In [None]:
pyramide_memo(pyramide)

<h3 class="alert alert-warning">Tests : avec création de pyramides aléatoires</h3>

In [None]:
from random import randint

In [None]:
taille = 7
pyramide = [[randint(1, 9) for j in range(taille-i)] for i in range(taille)]
pyramide

In [None]:
print(pyramide_dyn(pyramide), pyramide_memo(pyramide), pyramide_rec(pyramide, len(pyramide)-1, 0))

In [None]:
taille = 20
pyramide = [[randint(1, 9) for j in range(taille-i)] for i in range(taille)]

In [None]:
pyramide_dyn(pyramide)

In [None]:
pyramide_memo(pyramide)

In [None]:
# notez la lenteur de cet algorithme !
pyramide_rec(pyramide, len(pyramide)-1, 0)

<h2 class="alert alert-info">3. Rendu de monnaie en programmation dynamique </h2>

Le problème du rendu de monnaire consiste à **rendre une certaine somme d'argent** avec un jeu de pièces défini en rendant le **minimum de pièces possibles**. C'est bien un **problème d'optimisation**, et il peut être résolu par la programmation dynamique.

En 1ère, on a exploité un **algorithme glouton** permettant de répondre à cette problématique. 

*Rappel* : un algorithme glouton consiste à essayer d'optimiser un problème global en s'appuyant sur un critère local d'optimisation. Malheureusement ce type d'algorithme n'assure pas de trouver la solution optimale au problème complet (c'est quand même parfois le cas).

Par exemple, dans le cas du "rendu de monnaie", l'algorithme glouton peut donner la solution optimale au problème complet si le jeu de pièces est bien choisi au départ. Mais ce n'est pas forcément le cas...

**L'approche dynamique consiste ici à optimiser le rendu d'une somme plus petite  que celle attendue (on part de 0), et d'augmenter la valeur de cette somme intermédiaire jusqu'à atteindre la somme finale attendue.**

On utilise un tableau pour la "mémoire" dont les indices correspondent aux sommes à rendre (de 0 jusqu'à la somme attendue) et dont les valeurs sont le nombre minimum de pièces à rendre pour chaque 'somme-indice'. Cette mémoire sera initialisée avec des None pour signifier qu'on ne sait pas au début comment rendre chacune des sommes intermédiaires.

*Exemple d'état de la mémoire* : 

    [0, 1, 1, 2, 2, 1, 2, None]
    
Cela signifie :

|somme| nombre de pièces|
|--------|--------|
|    0    |    0    |
|    1    |    1    |
|    2    |    1    |
|    3    |    2    |
|    4    |    2    |
|    5    |    1    |
|    6    |    2    |
|    7    |    None    |

La relation entre un problème plus complexe et un problème plus simple peut se schématiser ainsi :
    
    nb_de_pieces[somme] = 1 + minimum(nb_de_pieces[somme - valeur_pièce] parmi toutes les pièces)
    
(*Remarque* : il faut tout de même s'assurer que la valeur de la pièce est inférieure à la somme à rendre).

On peut ainsi remplir la mémoire de proche en proche en parcourant chacune des sommes intermédiaires (de 0 jusqu'à la somme finale à rendre).


In [None]:
pieces = [1, 2, 5, 10, 50, 100] # liste des pièces disponibles

In [None]:
def rendu(somme, pieces):
    """ Trouve le nombre de pièces minimum à rendre pour la somme donnée 
    Entrées :
    - somme : entier (la somme à rendre)
    - pieces : liste d'entiers (liste des pièces disponibles)
    Sortie :
    - entier (nb minium de pièces à rendre)
    """
    assert isinstance(somme, int) and somme >= 0, "La somme à rendre est un entier positif"
    
    # CREATION DE LA MEMOIRE (tableau de None pour des indices de 0 à somme [inclus]).
    # COMPLETER LA LIGNE SUIVANTE :
    # memoire = ...
    
    for montant in range(1, somme+1):
        # COMPLETER LA LIGNE SUIVANTE :
        # memoire[montant] =  ...
    return memoire[somme]

In [None]:
# tests :
sommes_test = (0, 1, 2, 3, 4, 5, 6, 12, 13, 48, 49, 50)
resultats_attendus = (0, 1, 1, 2, 2, 1, 2, 2, 3, 7, 7, 1)
for i, somme in enumerate(sommes_test):
    assert rendu(somme, pieces) == resultats_attendus[i]

<h3 class="alert alert-warning">Rendu de monnaie en enregistrant la liste des pièces à rendre</h3>

**Défi** : Reprendre l'algorithme précédent en ajoutant une possibilité de lister les pièces à rendre (pas seulement leur nombre).

*Exemple* : ```rendu2(48)``` vaut ```(7, [1, 2, 5, 10, 10, 10, 10])```

cela signifie qu'on peut rendre 48€ avec 7 pièces : 1€, 2€, 5€, et 4 pièces de 10€.

In [None]:
def rendu2(somme, pieces):
    """ Trouve le nombre de pièces minimum à rendre pour la somme donnée """
    assert isinstance(somme, int) and somme >= 0, "La somme à rendre est un entier positif"
    
    memoire = [(None, []) for montant in range(somme+1)]
    memoire[0] = (0, [])

    # A VOUS DE JOUER :
    #   ...
    #   ...
    
    

In [None]:
# TESTS :15
for somme in sommes_test:
    print(somme, rendu2(somme, pieces))