# Programmation dynamique

## Probl√®me du rendu de monnaie

### Introduction et strat√©gie gloutonne.

On dispose de $n$ pi√®ces (ou billets) de valeurs $v_1$, $v_2$, ... $v_n$ (entiers strictement positifs) et d'une certain montant $s$ (entier aussi). Nous souhaitons utiliser ces pi√®ces pour *rendre la monnaie* sur le montant $s$ euros.

*Exemple:* pour trois pi√®ces de valeurs $v_1=1$, $v_2=3$ et $v_3=4$ (euros) et pour une somme $s=10$ euros, on peut faire un *rendu de monnaie* avec:
- deux pi√®ces de $4$ et deux de $1$ ce qui ¬´co√ªte¬ª quatre pi√®ces,
- trois pi√®ces de $3$ et une de $1$ pour le m√™me ¬´co√ªt¬ª,
- une pi√®ce de $4$ et deux de $3$, pour un co√ªt de trois,
- ...

**Le probl√®me du rendu de monnaie**: On voudrait trouver un rendu de monnaie qui consomme *le moins de pi√®ces possibles*.

*Retour sur l'exemple*: Parmi les rendus trouv√©s, le plus *√©conome* en pi√®ces en utilise **3** (une pi√®ce de 4‚Ç¨ et deux de 3‚Ç¨); il n'y en a pas de ¬´meilleur¬ª dans ce cas.

**Formalisation**: Ainsi, on cherche $n$ entiers positifs ou nuls:
- $x_1$ qui repr√©sente le nombre de fois qu'on utilise la pi√®ce n¬∞1 de valeur $v_1$,
- $x_2$ le nombre de pi√®ces de valeur $v_2$,
- etc.
- $x_n$: nombre de pi√®ces de valeur $v_n$.

de telle fa√ßon que si on prend la pi√®ce n¬∞1 ¬´$x_1$ fois¬ª, puis la n¬∞2 ¬´$x_2$ fois¬ª et ainsi de suite, la valeur de toutes ces pi√®ces soit $s$:

$$ R({\bf x})=x_1v_1+x_2v_2+\cdots +x_nv_n=\sum_{i} x_iv_{i}=s\quad (*)$$

Le nombre total de pi√®ces utilis√©es par un tel ¬´rendu de monnaie¬ª est alors:

$$T({\bf x})=x_1+x_2+\cdots+x_n=\sum_{i}x_i$$

**Finalement**, on cherche ${\bf x}=<x_1,x_2,\dots,x_n>$ (entiers $\geqslant 0$) qui v√©rifie $R({\bf x})=s$ (c'est un rendu pour le montant $s$) et pour lequel $T({\bf x})$ est *le plus petit possible* (le nombre de pi√®ces utilis√©es est minimal).

*Retour sur l'exemple*: Le premier rendu correspond √† $x_1=2$, $x_2=0$ et $x_3=2$ de somme $T({\bf x})=2+0+2=4$, le second √† $x_1=1$, $x_2=3$, $x_3=0$ de somme $T({\bf x})=1+3=4$ etc.

**Remarque**: Nous supposerons que l'une des pi√®ces a pour valeur $1$ de fa√ßon √† √™tre s√ªr qu'*il y a au moins un rendu possible*, √† savoir: *prendre cette pi√®ce ¬´$s$ fois¬ª*.

Une premi√®re approche du probl√®me - celle qui est la plus utilis√©e en pratique - serait d'adopter une **strat√©gie ¬´gloutonne¬ª**: 

> prendre la pi√®ce *de plus grande valeur* autant de fois que possible puis celle de plus grande valeur parmi celles qui restent et ainsi de suite jusqu'√† avoir rendu la somme demand√©e.

*Exemple*: Pour rendre 10‚Ç¨, on commence par la pi√®ce de plus grande valeur 4‚Ç¨ et on peut en prendre **2** apr√®s quoi le *reste √† rendre* est 2‚Ç¨. Ensuite, on consid√®re la pi√®ce de 3‚Ç¨, mais sa valeur est trop grande. On finit avec la pi√®ce de 1‚Ç¨ qu'on utilise **2** fois pour achever le rendu. Avec cette strat√©gie, on obtient la r√©ponse $x_1=2, x_2=0, x_3=2$ avec $v_1=4$, $v_2=3$ et $v_3=1$.

#### Exercice 1

Ecrire une fonction `rendu_glouton(v, s)` o√π `v` est un tableau **tri√©** contenant les valeurs des pi√®ces dans l'ordre *d√©croissant* et `s` la somme √† rendre. Elle renvoie un tableau de m√™me taille que `v` qui donne le nombre de pi√®ces du rendu ¬´$\bf x$¬ª trouv√© pour chaque valeur.

Par exemple `rendu_glouton([4,3,1], 10)` renvoie `[2,0,2]`.

In [None]:
def rendu_glouton(v, s):
    n = len(v)
    x = [0] * n # le ¬´rendu¬ª √† calculer
    # ...
    return x

rendu_glouton([4,3,1], 10)

In [None]:
def rendu_glouton(v, s):
    n = len(v)
    xs = [0] * n # repr√©sente le ¬´rendu¬ª √† calculer
    for i in range(n):
        while v[i] <= s: # tant qu'il est possible d'utiliser la pi√®ce n¬∞i
            xs[i] += 1
            s -= v[i]    # reste √† rendre
    return xs

rendu_glouton([4,3,1], 10)

_________

#### Exercice 2 - probl√®me du sac √† dos.

Un autre probl√®me classique est celui du ¬´sac √† dos¬ª. 
- Imaginez $n$ **bacs** contenant chacun de la ¬´ *poudre* ¬ª d'une certaine *mati√®re*:
    - Le premier bac contient $p_1$ kg de poudre de la 1√®re mati√®re pour une valeur (totale) de $v_1$ euros,
    - le second contient $p_2$ kg pour une valeur de $v_2$ euros,
    - et ainsi de suite ...
- Enfin, vous disposez d'un **sac** avec lequel vous pouvez transporter au maximum $c$ kilos.

Le probl√®me est de remplir le **sac** de fa√ßon √† emporter un contenu *ayant la plus grande valeur possible*.

1. R√©soudre le probl√®me √† la main pour un sac de contenance 50kg et trois bacs:

                 | bac 1 | bac 2 | bac 3 |
       valeur ‚Ç¨  |   60  |  100  |  120  |
       poids kg  |   10  |   20  |   30  |
      
   *Aide*: Souvenez-vous qu'on peut prendre tout ou partie du contenu d'un bac. Au fait, quelle mati√®re semble avoir le plus de ¬´valeur¬ª (√† ne pas confondre avec la valeur du bac)? 

On observe que la valeur *par kg* des mati√®res est $60/10=6$ ‚Ç¨/kg (bac 1), $100/20=5$ ‚Ç¨/kg (bac 2) et $120/30=4$ ‚Ç¨/kg (bac 3). 

Intuitivement, on va commencer par prendre le plus possible de la mati√®re qui *a le plus de valeur par kilo* soit la totalit√© des 10kg du bac 1.

Il nous reste 40kg de capacit√©, donc on prend toute la mati√®re du bac 2 soit 20 kg de plus.

Comme il nous reste 20kg de capacit√©, on prend 20kg de la troisi√®me mati√®re.

La valeur de notre ¬´butin¬ª est donc $60+100+\overbrace{120/30}^5\times 20=260$ ‚Ç¨ et il est clair qu'on ne peut pas faire mieux ici.

2. Pour ¬´r√©soudre¬ª le probl√®me pr√©c√©dent, vous avez probablement suivi une strat√©gie ¬´gloutonne¬ª: *prendre le plus possible de la mati√®re de plus grande valeur au kg*... 

   √âcrire une fonction `sac_a_dos_glouton(v, p, c)` o√π `v` et `p` sont des tableaux de m√™me taille contenant respectivement la *valeur* et le *poids* de la mati√®re contenu *dans chaque bac* et o√π `c` repr√©sente la capacit√© du sac. 
   
   On suppose que les tableaux `v` et `p` ont √©t√© ordonn√©s de fa√ßon que les quotients `v[i]/p[i]` - qui repr√©sentent les valeurs *par kg* de chaque mati√®re - *d√©croissent quand l'index $i$ augmente*.
   
   La fonction renvoie une solution sous la forme d'un tableau de m√™me taille que `v` ou `p` et qui contient les masses des mati√®res qu'on a mis dans le sac.

In [None]:
def sac_a_dos_glouton(v, p, c):
    n = len(v)
    x = [0] * n # solution √† calculer
    i = 0       # n¬∞ du bac qui contient la mati√®re ayant le plus de valeur
    # tant qu'il reste de la place dans le sac et des bacs √† consid√©rer
    while c > 0 and i < n:
        # prendre le plus possible de la mati√®re courante: 
        #     elle a le plus de valeur parmi celles qui restent
        x[i] = p[i] if p[i] <= c else c # on vide le bac si possible sinon le sac est plein
        c -= x[i] # mettre √† jour la capacit√© du sac
        i += 1 # passer au bac suivant
    return x

sac_a_dos_glouton([60, 100, 120], [10, 20, 30], 50)

3. Am√©liorer la fonction pr√©c√©dente de fa√ßon √† ce qu'elle renvoie en plus ¬´la valeur du chargement¬ª.

In [None]:
def sac_a_dos_glouton(v, p, c):
    n = len(v)
    x = [0] * n
    V = 0
    i = 0
    while c > 0 and i < n:
        x[i] = p[i] if p[i] <= c else c
        V += v[i] if p[i] <= c else v[i]/p[i] * c
        c -= x[i]
        i += 1
    return x, round(V, 2)

sac_a_dos_glouton([60, 100, 120], [10, 20, 30], 50)

__________

### Introduction √† la ¬´programmation dynamique¬ª

Il est important d'observer que la *strat√©gie gloutonne* employ√©e pour r√©soudre le probl√®me du rendu de monnaie n'y parvient que de **mani√®re approch√©e** (Par contre on peut sentir qu'elle trouve une solution optimale pour le sac √† dos avec des mati√®res en poudre).

En effet, pour l'exemple donn√© au d√©but -  trois pi√®ces de valeurs $v_1=4$, $v_2=3$ et $v_3=1$ et une somme $s=10$‚Ç¨ - la solution trouv√©e par notre strat√©gie gloutonne est: **deux** pi√®ces de $4$‚Ç¨ et **deux** de $1$‚Ç¨ pour un co√ªt de **4** pi√®ces. 

Or, on voit qu'on peut faire mieux: **une** de $4$‚Ç¨ et **deux** de $3$‚Ç¨ pour un co√ªt de **3** pi√®ces.

Nous allons utiliser la **programmation dynamique** pour r√©soudre exactement ce probl√®me. Dans les grandes lignes, cette m√©thode consiste √†:

1. trouver un algorithme *r√©cursif* (souvent inefficace) pour le probl√®me consid√©r√©, puis
2. *transformer* cet algorithme r√©cursif en un algorithme **it√©ratif** qui **m√©morise** les solutions des ¬´sous-probl√®mes¬ª dans un **tableau** (√† une ou plusieurs dimensions) pour **√©viter de les recalculer**. 

Avant d'appliquer cette m√©thode pour r√©soudre exactement le probl√®me du rendu de monnaie, il est bon de se familiariser avec les techniques permettant de r√©aliser la 2√®me √©tape ci-dessus: *transformer un algorithme r√©cursif en un algorithme it√©ratif* (quand c'est possible!)

#### Suite de Fibonacci encore!

La suite de Fibonacci peut se d√©finir comme suit:

$$\text{Fib}(n)=\left\{\begin{array}{lr}
0&\text{si }n=0\cr
1&\text{si }n=1\cr
\text{Fib}(n-2)+\text{Fib}(n-1)&\text{si } n\geqslant 2
\end{array}\right.$$

Sa programmation r√©cursive est ¬´simple¬ª mais l'algorithme obtenu est inefficace:

In [None]:
def fibo(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    return fibo(n-2) + fibo(n-1)

fibo(35) # prend du temps!

On peut montrer que sa complexit√© est *exponentielle*. Le probl√®me est que l'algorithme passe son temps √† **recalculer les m√™mes ¬´sous-probl√®mes¬ª**.

Par exemple, `fibo(4)` appelle `fibo(2)` et `fib(3)`, puis
- `fibo(2)` appelle `fibo(0)` et `fibo(1)` et lorsque cela se termine, c'est au tour de
- `fibo(3)` qui appelle `fibo(1)` et **`fibo(2)`**; comme le premier appel termine tout de suite, c'est au tour de:
    - `fibo(2)` qui appelle `fibo(0)` et `fibo(1)`.

L'important est de comprendre que le ¬´sous-probl√®me¬ª `fibo(2)` est re-calcul√© comme s'il n'avait jamais √©t√© r√©solu! √âvidemment, la chose empire avec des valeurs de d√©part plus grandes.

#### Exercice 3

Combien de fois `fibo(5)` va-t-il r√©soudre le sous-probl√®me `fibo(2)`? R√©sout-elle plusieurs fois un autre probl√®me et si oui lequel? *Conseil*: dessiner l'arbre des appels.

                _______5_________
               /                 \
           ____3___          ____4____
          /        \        /         \
          1      __2__    __2__     __3__
                /     \  /     \   /     \
                0     1  0     1   1    _2_ 
                                       /   \
                                       0   1
                                       
`fibo(2)` va donc √™tre recalcul√© **3** fois et `fibo(3)` **2** fois. 

________

L'id√©e de la **programmation dynamique** est de r√©soudre les ¬´sous-probl√®mes¬ª de fa√ßon *ascendantes* \[ *bottom up* \] - r√©soudre les probl√®mes de plus petite taille en premier - en **m√©morisant** les r√©sultats interm√©diaires dans un **tableau**.

Pour la suite de Fibonacci, les sous-probl√®mes sont `fibo(0)`, `fibo(1)`, ..., `fibo(n)`. Nous allons donc utiliser un tableau de taille `n+1` pour m√©moriser leurs solutions:

In [None]:
def fibo_dyn(n):
    tab = [0, 1] + [None] * (n-1) # pour m√©moriser les r√©sultats au fur et √† mesure
    for i in range(2, n+1):
        tab[i] = tab[i-2] + tab[i-1]
    return tab[n]

fibo_dyn(35)

C'est exactement ce que l'on fait quand on compl√®te la suite de Fibonacci √† la main.

La *complexit√© en temps* de cet algorithme est clairement $O(n)$ mais il faut noter qu'il **consomme de la m√©moire**. Plus pr√©cis√©ment, cet algorithme n√©cessite un tableau dont la taille d√©pend de celle de l'entr√©e $n$. Par exemple, le calcul de `fibo(1OOO)` oblige √† r√©server un tableau de taille 1000. On dit que sa **complexit√© m√©moire** est $O(n)$.

*Remarque*: Bien s√ªr, comme on n'a besoin que des deux valeurs qui pr√©c√®dent celle qu'on est en train de calculer, on peut se passer du tableau moyennant deux variables pour retenir les valeurs utiles:

In [None]:
def fibo_classique(n):
    a, b = 0, 1
    for _ in range(n-1):
        a, b = b, a + b
    return b

# note: reste un petit d√©faut; fibo(0) renvoie 1 alors qu'il devrait renvoyer 0
fibo_classique(35)

La complexit√© en temps est inchang√© mais la *complexit√© m√©moire* est √† pr√©sent $O(1)$ ce qui est une am√©lioration significative.

#### Exercice 4

On dispose d'une liste de nombres entiers strictement positifs $v=<v_1=1, v_2, \dots, v_n>$ et on consid√®re la quantit√© $T(m)$, o√π $m$ est un entier, d√©finie *r√©cursivement* comme suit: 
- $T(0)=0$,
- si $m\geqslant 1$, $T(m)$ est le **minimum** des nombres:

$$T(m-v_1)+1~\text{si }v_1\leqslant m,\qquad T(m-v_2)+1~\text{si }v_2\leqslant m,\qquad \dots\quad T(m-v_n)+1~\text{si }v_n\leqslant m$$

**Note**: si la condition n'est pas respect√©e, la quantit√© correspondante est √©limin√©e de la liste. Remarquez que cette liste est non vide puisque $v_1=1$...

On √©crit souvent ces conditions comme cela:

$$T(m)=\left\{\begin{array}{lr}
0&\text{si }m=0\cr
1+\min_{1\leqslant i\leqslant n}\{T(m-v_i): m-v_i\geqslant 0\}& \text{si }m\geqslant 1\end{array}\right.$$

*Note*: le symbole ¬´:¬ª dans l'√©criture du min se lit ¬´√† condition que¬ª ou ¬´tel que¬ª.

1. Calculer $T(0), T(1),\dots, T(10)$ si $v=<1,3>$

    T(0) = 0
    T(1) = 1 + min{T(0)}=1
    T(2) = 1 + min{T(1)}=2
    T(3) = 1 + min{T(0), T(2)}=1
    ...
    n    | 0| 1| 2| 3| 4| 5| 6| 7| 8| 9|10
    --------------------------------------
    T(n) | 0| 1| 2| 1| 2| 3| 2| 3| 4| 3| 4
  
Observer que lorsqu'on √©crit la liste des valeurs, la prochaine s'obtient en ajoutant 1 au minimum des valeurs situ√©es √† 1 ou 3 positions avant celle qu'on veut calculer.
    
       n-3   n-1 n
    ..| a| ?| b| c| .. avec c = 1 + min(a,b)

2. √âcrire un algorithme *r√©cursif* `T(v,n)` qui calcule $T(n)$ pour la liste `v` de valeurs fournie en argument. On suppose que `v[0]=1` (de fa√ßon a √™tre s√ªr que l'ensemble des valeurs sur lequel on calcule le $\min$ est non vide).

   *Note*: Pour calculer un *minimum* en ¬´toute circonstance¬ª, on peut utiliser cette fa√ßon de faire:
   ```python
   mini = float("inf") # correspond √† +‚àû: toute valeur finie x v√©rifie x < +‚àû
   for v in valeurs:
       if v < mini:
           mini = v
   # mini contient alors le min de ¬´valeurs¬ª si cette liste est non vide.  
   ```

In [None]:
def T(v, n):
    if n == 0:
        return 0
    # calcul du min des T(n-v)
    mini = float("inf")
    for val in v:
        if val <= n:
            t = T(v, n-val)
            if t < mini:
                mini = t
    return 1 + mini
            
for i in range(11):
    print(T([1,3], i), end=" ")

3. Donner une *version it√©rative* de ce calcul `T_iter(v, n)` en utilisant un tableau de taille $n+1$ pour m√©moriser les valeurs au fur et √† mesure. Inspirez-vous de la fa√ßon de proc√©der de la premi√®re question.

In [None]:
def T_iter(v, n):
    tab = [0] * (n+1)
    for m in range(1, n+1): # m sert d'index dans tab
        # calcul du min des T(m-v)
        mini = float("inf")
        for val in v:
            if val <= m:
                t = tab[m-val]
                if t < mini:
                    mini = t
        tab[m] = 1 + mini
    return tab[n]

for i in range(40):
    print(T_iter([1,3], i), end=" ")

#### Note - exploitation de l'√©criture en compr√©hension

L'√©criture en compr√©hension permet une r√©√©criture quasiment directe de la relation de r√©currence. Voyez par vous-m√™me:

In [None]:
def T(v, n):
    if n == 0:
        return 0
    return 1 + min([q(v, n-val) for val in v if val <= n])

# Note compl√©mentaire: l'√©criture min([q(v, n-val) for val in v if val <= n]) peut en fait
# se simplifier en min(q(v, n-val) for val in v if val <= n)
            
for i in range(40):
    print(T([1,3], i), end=" ")

On peut aussi am√©liorer significativement la lisibilit√© de la version it√©rative:

In [None]:
def T_iter(v, n):
    tab = [0] * (n+1)
    for m in range(1, n+1):
        tab[m] = 1 + min(tab[m-val] for val in v if val <= i)
    return tab[n]

for i in range(40):
    print(T_iter([1,3], i), end=" ")

N√©anmoins, on peut avoir besoin de ¬´d√©rouler¬ª le min comme nous le verrons plus tard, donc il est utile de conna√Ætre les deux m√©thodes.

____________

#### Exercice 5

Voici un d√©finition r√©cursive d'une certaine quantit√© $Q$ (dont la signification ne sera pas pr√©cis√©e) et qui d√©pend de deux entiers positifs ou nuls $n$ et $m$:

$$Q(n, m)=\left\{\begin{array}{l}
1\qquad\text{si }m=0\cr
0\qquad\text{sinon si } n=0\cr
Q(n-1, m-1)+Q(n-1, m)\qquad\text{sinon}
\end{array}\right.$$

1. Calculer $Q(3, 2)$ √† la main.

$Q(3,2)=Q(2,1)+Q(2,2)$

Puis $Q(2,1)=Q(1,0)+Q(1,1)=1+(Q(0,0)+Q(0,1))=1+(1+0)=2$

et $Q(2,2)=Q(1,1)+Q(1,2)=1+(Q(0,1)+Q(0,2))=1+(0+0)=1$

Donc $Q(3,2)=2+1={\bf 3}$

2. Donner une impl√©mentation r√©cursive `Q_rec` permettant de calculer cette quantit√©.

In [None]:
def Q_rec(n, m):
    if n == 0 and m >= 1:
        return 0
    elif m == 0:
        return 1
    return Q_rec(n-1,m-1)+Q_rec(n-1,m)

Q_rec(30, 15)

3. Le tableau qui suit contient $Q(i,j)$ √† l'intersection de la ligne $i$ et de la colonne $j$. Il permet de calculer la valeur de la case tout en bas √† droite *en compl√©tant progressivement le tableau ligne par ligne √† l'aide la r√©currence donn√©e*.

   Compl√©ter le pour trouver $Q(n,m)$ avec $n=6$ et $m=4$ soit $Q(6, 4)$.

                             j
                             
                   | 0 | 1 | 2 | 3 | 4
                 ----------------------
                 0 | 1 | 0 | 0 |   |  
                 ----------------------
                 1 | 1 |   |   |   |   
                 ----------------------
                 2 |   |   |   |   |   
           i     ----------------------
                 3 |   |   |   |   |  
                 ----------------------
                 4 |   |   |   |   |                
                 ----------------------
                 5 |   |   |   |   |   
                 ----------------------
                 6 |   |   |   |   |   

Observez que pour calculer la valeur d'une case on a besoin de ses cases ¬´nord¬ª et ¬´nord-ouest¬ª

                j-1    j
     i-1   .. |  a  |  b  | ..
             ---------------
       i   .. |     | a+b | ..

                           j
                             
                   | 0 | 1 | 2 | 3 | 4
                 ----------------------
                 0 | 1 | 0 | 0 | 0 | 0
                 ----------------------
                 1 | 1 | 1 | 0 | 0 | 0 
                 ----------------------
                 2 | 1 | 2 | 1 | 0 | 0 
           i     ----------------------
                 3 | 1 | 3 | 3 | 1 | 0
                 ----------------------
                 4 | 1 | 4 | 6 | 4 | 1              
                 ----------------------
                 5 | 1 | 5 | 10| 10| 5 
                 ----------------------
                 6 | 1 | 6 | 15| 20| 15
            
Reconnaissez-vous cette matrice (pour ceux qui font la sp√© maths...)?

4. Pour transformer l'algorithme r√©cursif naturel permettant de calculer $Q(n,m)$ en un algorithme it√©ratif, on peut s'inspirer de la fa√ßon dont on calcule le tableau pr√©c√©dent √† la main: c'est l'approche de la programmation dynamique.

   √âcrire une version *it√©rative* `Q_dyn(n,m)` de cet algorithme. Pour cela, initialiser une matrice avec une ¬´liste de listes¬ª qui mod√©lise le tableau pr√©c√©dent; Vous pouvez alors pr√©-remplir la premi√®re ligne et la premi√®re colonne avec le cas de base de la r√©currence pr√©c√©dente.

In [None]:
def Q_dyn(n, m):
    # initialisation du tableau
    tab = [[0] * (m+1) for _ in range(n+1)]
    for i in range(n+1):
        tab[i][0] = 1
    
    # remplissage ligne par ligne
    for i in range(1, n+1):
        for j in range(1, m+1):
            tab[i][j] = tab[i-1][j-1] + tab[i-1][j]
    # finalement
    return tab[n][m]
    
Q_dyn(6, 4)

5. Quelle est sa complexit√© en temps? en m√©moire?

La boucle imbriqu√©e domine le co√ªt en temps qui est $O(nm)$. Le tableau contient $nm$ cases et le co√ªt m√©moire est donc aussi $O(nm)$. 

6. En observant que pour calculer un √©l√©ment du tableau, on n'utilise que certains √©l√©ments de la *ligne pr√©c√©dente*, am√©liorer la consommation m√©moire de cet algorithme en utilisant seulement deux tableaux de taille $m+1$ chacun.

In [None]:
def Q_iter(n, m):
    tab1 = [1] + [0] * m
    tab2 = [1] + [None] * m
    
    for _ in range(1, n+1):
        for j in range(1, m+1):
            tab2[j] = tab1[j-1] + tab1[j]
        tab1, tab2 = tab2, tab1
        
    return tab1[m]

print(Q_iter(6, 4))

# Note compl√©mentaire: On peut encore un peu √©conomiser la m√©moire 
# en n'utilisant qu'un seul tableau et en calculant les valeurs de la ¬´droite vers la gauche¬ª

def Q_iter_bis(n, m):
    tab = [1] + [0] * m
    
    for _ in range(1, n+1): # on pourrait faire une it√©ration de moins...
        for j in reversed(range(1, m+1)):
            tab[j] = tab[j-1] + tab[j]
        
    return tab[m]

print(Q_iter_bis(6, 4))

# Apr√®s cette optimisation, le co√ªt m√©moire est donc O(m).

________

### R√©solution exacte du rendu de monnaie

Supposons disposer d'une *solution optimale* ${\bf x}$ pour le montant $s$ (entier) au probl√®me du rendu de monnaie.

Si on √©limine une pi√®ce de valeur $v$ intervenant dans cette solution optimale ${\bf x}$ au moins une fois, la somme des pi√®ces *restantes* a pour valeur $s-v$ donc est un *rendu de monnaie pour le montant* $s-v$.

**La remarque cruciale est la suivante**: *le rendu de monnaie obtenu en supprimant une pi√®ce de valeur $v$ d'un rendu **optimal** est lui-m√™me **optimal** pour le montant $s-v$*.

En effet, s'il n'√©tait pas optimal, on pourrait trouver un rendu pour $s-v$ utilisant *moins de pi√®ces que celui-ci* et en y ajoutant la pi√®ce pr√©c√©demment supprim√©e, on obtiendrait un rendu pour $s$ qui utiliserait moins de pi√®ces que le rendu ${\bf x}$. Mais, nous avons suppos√© que le rendu ${\bf x}$ √©tait **optimal** pour $s$, donc on a une **contradiction**.

> On en d√©duit qu'une solution **optimale** ${\bf x}$ pour un montant $s$ s'obtient en choisissant la solution qui utilise le moins de pi√®ces **parmi** *les solutions optimales des probl√®mes de rendu pour un montant $s-v$ o√π $v$ est la valeur d'une des pi√®ces dont nous disposons*.

Ainsi, si $T(s)$ d√©signe le nombre de pi√®ces d'un rendu *optimal* pour le montant $s$ alors:

$$T(s)=1+\min_{i}\{T(s-v_i): s-v_i\geqslant 0\}\quad \text{si }s\geqslant 1$$

Et, √©videmment, $T(0)=0$ puisque, pour un montant nul, il n'y a rien √† rendre!

Il n'est pas difficile d'en d√©duire un algorithme r√©cursif pour calculer $T(s)$ (voir exercice 4):

In [None]:
def rendu_monnaie_rec(v, s):
    if s == 0:
        return 0
    return 1 + min(rendu_monnaie_rec(v, s-val) for val in v if val <= s)

rendu_monnaie_rec([1,2,5,10,20,50,100,200], 30)

Malheureusement, il n'est *pas efficace* car il calcule de nombreuses fois la m√™me chose.

#### Exercice 6

1. Dessiner l'arbre des appels r√©cursifs si `p = [1, 2, 3]` et `s = 4`.

                         __________ 4 ___________
                        /           |            \
                   ___ 3____     __ 2             1 
                  /    |    \   /   |             |
              __ 2     1    0   1   0             0
             /   |     |        |
             1   0     0        0
             |
             0
       
On observe que l'algorithme r√©cursif va calculer deux fois le sous-probl√®me T(2) (rendu pour 2 euros) et la situation empire avec une somme √† rendre plus grande. En fait, on peut montrer que le nombre d'appels r√©cursifs est ¬´exponentielle¬ª par rapport au rendu s: il est de l'ordre de $2^s$ et donc si $s=30$ il va y avoir environ $2^{30}\approx 1000^3$ soit 1 milliard d'appels!!!)

2. Modifier `rendu_monnaie_rec(v, s, prof=0)`, o√π `prof` repr√©sente la profondeur de l'appel, de fa√ßon √† afficher cet arbre ¬´ligne √† ligne¬ª, en indentant la ligne en fonction de la profondeur de l'appel (un peu comme le fait la commande `lstree` pour un r√©pertoire).

In [None]:
def rendu_monnaie_rec(v, s, prof=0):
    # √† adapter
    if s == 0:
        return 0
    return 1 + min(rendu_monnaie_rec(v, s-val) for val in v if val <= s)

rendu_monnaie_rec([1,2,3], 4)

In [None]:
def rendu_monnaie_rec(v, s, prof=0):
    print("  " * prof + str(s))
    if s == 0:
        return 0
    return 1 + min(rendu_monnaie_rec(v, s-val, prof+1) for val in v if val <= s)

rendu_monnaie_rec([1,2,3], 4)

_________

Pour √©viter de **recalculer plusieurs fois la m√™me chose**, nous pouvons m√©moriser les solutions ¬´partielles¬ª $T(0), T(1), \dots, T(s)$, du probl√®me de rendu comme d√©j√† expliqu√©. Rappelons le encore une fois:

La **programmation dynamique** consiste √† transformer une version *r√©cursive* d'un algorithme en une version *it√©rative* en m√©morisant les solutions partielles dans un tableau  du ¬´bas vers le haut¬ª \[ *bottom up* \] c'est-√†-dire en commen√ßant par les sous-probl√®mes ¬´les plus petits¬ª.

In [None]:
def rendu_monnaie_simple(v, s):
    n = len(v)
    # nombre total de pi√®ces utilis√©es pour chaque somme √† rendre: i=0, 1, ..., s
    T = [0]*(s+1) 
    for m in range(1, s+1):
        # m repr√©sente le montant √† rendre
        T[m] = 1 + min(T[m-val] for val in v if val <= i)
    return T[s]

rendu_monnaie_simple([1,2,5,10,20,50,100,200], 437)

#### Exercice 7

Quelle est la complexit√© temporelle de cet algorithme? Quelle est sa complexit√© spatiale (en m√©moire)?

L'algorithme a une complexit√© temporelle $O(ns)$ o√π $n$ repr√©sente le nombre (de pi√®ces) de valeurs diff√©rentes. En effet, `min` ¬´cache¬ª une boucle $O(n)$ et comme on a deux boucles imbriqu√©es... Sa consommation m√©moire est proportionnelle √† la somme √† rendre soit $O(s)$.

_________

### Trouver un rendu optimal

Observez que notre algorithme ne ne nous dit pas *quelles pi√®ces sont utilis√©es dans un rendu optimal*, il nous dit juste combien il en faudra au minimum.

Il est heureusement possible de l'adapter pour qu'il r√©ponde √† cette question. L'id√©e est de **m√©moriser le choix de la pi√®ce effectu√©** pour passer d'un sous-rendu optimal au rendu optimal ¬´courant¬ª: Quelle pi√®ce $i$ est choisie lorsqu'on calcule $T(s)=1+\min_{i}\{T(s-v_i): s-v_i\geqslant 0\}$? Observez qu'elle entre n√©cessairement dans la composition du rendu de monnaie trouv√© par l'algorithme.

*Exemple*: Pour $v_1=1, v_2=3, v_3=4$ et $s=6$, et si on modifie notre algorithme pour qu'il m√©morise la pi√®ce ajout√©e pour obtenir un rendu optimal pour $1\leqslant m\leqslant s$ √† partir d'un sous-rendu optimal, on obtient:

    m | 1| 2| 3| 4| 5| 6 --> montant √† rendre
    i | 1| 1| 2| 3| 1| 2 --> n¬∞ de  la pi√®ce choisie lors du min
    


D'apr√®s ce tableau, pour rendre $m=6$‚Ç¨, on utilise la **pi√®ce n¬∞2** qui vaut 3‚Ç¨: le reste √† rendre est donc $m=6-3=3$‚Ç¨.

En utilisant √† nouveau ce tableau avec le nouveau montant $m=3$‚Ç¨, on utilise **√† nouveau la pi√®ce n¬∞$i=2$** et le reste √† rendre est $m=3-3=0$‚Ç¨.

On en conclut que pour 6‚Ç¨, la solution de notre algorithme est d'utiliser deux pi√®ces de $3$‚Ç¨, c'est-√†-dire: $$x_1=0, x_2=2, x_3=0$$

#### Exercice 8

1. Pr√©ciser le rendu pour 10‚Ç¨ d'apr√®s le tableau ¬´`p`¬ª ci-dessous (avec les m√™mes pi√®ces que dans l'exemple pr√©c√©dent)

        m --> | 1| 2| 3| 4| 5| 6| 7| 8| 9| 10| --> montant √† rendre
        i --> | 1| 1| 2| 3| 1| 2| 2| 3| 1|  2| --> n¬∞ de  la pi√®ce choisie lors du min

On utilise la pi√®ce n¬∞$i=2$ (reste √† rendre $m=10-3=7$‚Ç¨), puis encore la pi√®ce n¬∞$i=2$ (reste √† rendre $m=7-3=4$‚Ç¨) puis la pi√®ce n¬∞$i=3$ (reste √† rendre $m=4-4=0$). Finalement: $$x_1=0, x_2=2, x_3=1$$.

2. √âcrire la fonction `rendu(v,p)` o√π `v` est un tableau contenant la valeur des pi√®ces du rendu et `p` un tableau qui fait correspondre au montant √† rendre $m$ le *num√©ro* de la pi√®ce choisie `p[m]` (comme expliqu√© plus t√¥t).

   Elle renvoie un tableau de m√™me taille que `v` qui donne pour chaque pi√®ce $i$ son nombre d'utilisation dans le rendu pour le montant correspondant √† la longueur de $p$.
   
   *Par exemple*, `rendu([1,3,4],[0,0,1,2,0,1,1,2,0,1])` renvoie `[0,2,1]` qui correspond au rendu pour 10‚Ç¨ de la premi√®re question. Le tableau `p` a √©t√© adapt√© pour tenir compte de la num√©rotation √† partir de 0.

In [None]:
def rendu(v, p):
    x = [0] * len(v)
    m = len(p)
    while m > 0:
        i = p[m-1]
        x[i] += 1
        m -= v[i]
    return x

rendu([1,3,4],[0,0,1,2,0,1,1,2,0,1])

_________

Pour m√©moriser le num√©ro de la pi√®ce choisie lors des rendus pour $m$ euros o√π $1\leqslant m\leqslant s$, nous allons avoir besoin de ¬´d√©rouler¬ª l'algorithme du min.

Voici ce que cela donne en pseudo-code:

<pre>
<strong>rendu_monnaie</strong>(v, s):
    initialiser un tableau <em>T</em> de longueur s+1 avec des z√©ros
    initialiser un tableau <em>p</em> de longueur s (peu importe les valeurs qu'il contient)
    <strong>Pour</strong> m de 1 √† s:
        T[m] ü†Ñ +‚àû
        <strong>Pour</strong> i de 1 √† n:
             m' = m - v[i]
             <strong>Si</strong> m' > 0 <strong>et</strong> 1 + T[m'] < T[m]:
                  T[m] ü†Ñ 1 + T[m']
                  p[m-1] ü†Ñ i    # m√©moriser le choix de la pi√®ce!          
    
    ... calculer x √† partir de p ...
    renvoyer T[s], x
<pre>

Dans la boucle interne (du min), $i$ repr√©sente un num√©ro de la pi√®ce. On m√©morise ce num√©ro lorsque le min est mis √† jour. Lorsque *cette* boucle se termine, le $i$ m√©moris√© correspond au n¬∞ de la pi√®ce choisie pour passer d'un sous-probl√®me √† celui de montant $m$.

#### Exercice 9

R√©soudre compl√®tement le probl√®me du rendu de monnaie en vous inspirant de l'algorithme en pseudo-code et en compl√©tant sa partie manquante.

Pour cela, √©crire une fonction `rendu_monnaie(v, s)` qui renvoie le nombre minimal de pi√®ces pour un rendu sur un montant `s` ainsi qu'un rendu optimal particulier. On suppose toujours que la liste des valeurs des pi√®ces `v` contient 1. 

In [None]:
def rendu_monnaie(v, s):
    """Renvoie le nombre minimal de pi√®ces ainsi que leur distribution
    dans le probl√®me de rendu de monnaie pour un montant s et un jeu
    de pi√®ces dont les valeurs sont donn√©es dans le tableau v.
    On suppose que l'une des pi√®ces a pour valeur 1."""
    assert 1 in v, "L'une des pi√®ces doit valoir 1‚Ç¨."
    
    # initialisations des tableaux
    T = [0] * (s+1)  # nombres de pi√®ces utilis√©es pour chaque montant interm√©diaire
    p = [0] * s      # pi√®ces effectivement ajout√©e, pour obtenir le rendu (pour chaque
                      # montant interm√©diaire), √† celles d'un ¬´sous-rendu¬ª optimal.
    
    # pour chaque montant interm√©diaire
    for m in range(1, s + 1):
        # calculer et m√©moriser le nombre de pi√®ces utilis√©es pour ce montant
        T[m] = float("inf")
        # pour chaque pi√®ce
        for i, val in enumerate(v):
            if val <= m and 1 + T[m-val] < T[m]:
                # actualiser la solution en ajoutant cette pi√®ce 
                # √† celles du sous-probl√®me consid√©r√©
                T[m] = 1 + T[m-val]
                # m√©moriser la pi√®ce utilis√©e
                p[m-1] = i
    
    # calcul de la r√©partition des pi√®ces utilis√©es
    x = [0] * len(v) # quantit√©s pour chaque pi√®ce
    m = s
    while m > 0:
        i = p[m-1]
        x[i] += 1
        m -= v[i]
    # renvoyer le nombre de pi√®ces utilis√©es et leur r√©partition.
    return T[s], x

rendu_monnaie([1,3,4], 10)