# TP 2 : Problème du sac à dos

<center><img src=https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Knapsack.svg/486px-Knapsack.svg.png width=250></center>

On rappelle le problème du sac à dos :
- **Entrée** : une capacité $c$ et des objets de poids $w_1, ..., w_n$ et valeurs $v_1$, ..., $v_n$.
- **Sortie** : la valeur maximum que l'on peut mettre dans un sac de capacité $c$.  

$c$ est le poids total maximum que l'on peut peut mettre dans le sac 

L'objectif du TP est de comparer l'algorithme de programmation dynamique vu en cours à des algorithmes gloutons.

### Algorithmes gloutons

Un algorithme glouton consiste à ajouter des objets un par un au sac, en choisissant à chaque étape l'objet qui a l'air le plus intéressant, si son poids n'excède pas la capacité restante du sac.  
Suivant l'ordre dans lequel on choisit les objets, on obtient des algorithmes gloutons différents.

````{admonition} Question
 Écrire une fonction `glouton(c, w, v)` qui renvoie la valeur totale des objets choisis par l'algorithme glouton, en considérant les objets dans l'ordre donné par `w` et `v` (on regarde d'abord l'objet de poids `w[0]` et valeur `v[0]`, puis l'objet de poids `w[1]` et valeur `v[1]`...).
Tester avec l'exemple ci-dessous. Le résultat est-il optimal ?
````

In [1]:
def glouton(c, w, v):
    value = 0
    weight = 0
    for object in range(len(w)):
        if weight + w[object] <= c:
            weight += w[object]
            value += v[object]
    return value

In [2]:
glouton(10, [5, 3, 6], [4, 4, 6])

8

### Tri des objets

````{admonition} Question
 Écrire une fonction `combine(L1, L2)` qui renvoie la liste des couples `(L1[i], L2[i])`. On suppose que `L1` et `L2` ont la même longueur.
````

In [3]:
def combine(L1, L2):
    L_combined = []
    for i in range(len(L1)):
        L_combined.append((L1[i], L2[i]))
    return L_combined

In [4]:
combine([1, 2, 3], [4, 5, 6])

[(1, 4), (2, 5), (3, 6)]

````{admonition} Question
 Écrire une fonction `split(L)` telle que si `L` est une liste de couples, `split(L)` renvoie deux listes `L1` et `L2` où `L1` contient les premiers éléments des couples de `L` et `L2` les seconds éléments des couples de `L`.
````

In [5]:
def split(L):
    L1, L2 = [], []
    for i in range(len(L)):
        L1.append(L[i][0])
        L2.append(L[i][1])
    return L1, L2

In [6]:
split([(1, 4), (2, 5), (3, 6)])

([1, 2, 3], [4, 5, 6])

Si `L` est une liste, `L.sort()` trie `L` par ordre croissant (`L.sort(reverse=True)` pour trier par ordre décroissant). Si `L` contient des couples, la liste est triée suivant le premier élément de chaque couple (ordre lexicographique).  
Exemple :

In [7]:
L = [(1, 4), (7, 5), (3, 6)]
L.sort()
L # trié suivant le 1er élément de chaque couple

[(1, 4), (3, 6), (7, 5)]

````{admonition} Question
 Écrire une fonction `tri_poids(w, v)` qui renvoie les listes `w2` et `v2` obtenues à partir de `w` et `v` en triant les poids par ordre croissant. On utilisera `L.sort`, `combine` et `split`.
````

In [8]:
def tri_poids(w, v):
    w_v_unsorted = combine(w,v)
    w_v_unsorted.sort()
    return split(w_v_unsorted)

In [9]:
tri_poids([5, 3, 6], [42, 0, 2])

([3, 5, 6], [0, 42, 2])

### Stratégies gloutonnes

````{admonition} Question
 En déduire une fonction `glouton_poids(c, w, v)` qui renvoie la valeur totale des objets choisis par l'algorithme glouton, en considérant les objets dans l'ordre de poids croissant. On pourra réutiliser `glouton`.  
Est-ce que cet algorithme est toujours optimal ?
````

In [10]:
def glouton_poids(c, w, v):
    w_sorted, v_sorted = tri_poids(w, v)
    return glouton(c, w_sorted, v_sorted)

In [11]:
glouton_poids(10, [5, 3, 6], [4, 4, 10])

8

````{admonition} Question
 Écrire de même des fonctions `tri_valeur(w, v)` et `glouton_valeur(c, w, v)` qui renvoie la valeur totale des objets choisis par l'algorithme glouton, en considérant les objets dans l'ordre de valeur décroissante (en utilisant `L.sort(reverse=True)`). Est-ce que cet algorithme est toujours optimal ?
````

In [12]:
def tri_valeur(w, v):
    w_v_unsorted = combine(w,v)
    w_v_unsorted.sort(reverse=True)
    return split(w_v_unsorted)

def glouton_valeur(c, w, v):
    w_sorted, v_sorted = tri_valeur(w, v)
    return glouton(c, w_sorted, v_sorted)

In [13]:
glouton_valeur(10, [5, 4, 7], [4, 4, 6])

6

````{admonition} Question
 De même, écrire une fonction `glouton_ratio(c, w, v)` qui renvoie la valeur totale des objets choisis par l'algorithme glouton, en considérant les objets dans l'ordre de ratio valeur/poids décroissant. On pourra utiliser deux fois `combine`.
````

In [14]:
def glouton_ratio(c, w, v):
    w_v_ratio = [(v[i] / w[i], i) for i in range(len(w))]
    w_v_ratio.sort(reverse=True)
    value, weight = 0, 0
    for i in range(len(w_v_ratio)):
        _, object = w_v_ratio[i]
        if weight + w[object] <= c:
            weight += w[object]
            value += v[object]
    return value

In [15]:
glouton_ratio(10, [5, 4, 7], [4, 4, 6])

8

## Programmation dynamique

On rappelle le problème du sac à dos :
- **Entrée** : une capacité $c$ et des objets de poids $w_1, ..., w_n$ et valeurs $v_1$, ..., $v_n$.
- **Sortie** : la valeur maximum que l'on peut mettre dans un sac de capacité $c$.

Soit $dp[i][j]$ la valeur maximum que l'on peut mettre dans un sac de capacité $i$, en ne considérant que les $j$ premiers objets. On suppose que les poids sont strictement positifs.

````{admonition} Question
 Que vaut $dp[i][0]$ ?
````

$dp[i][0] = 0$

````{admonition} Question
 Exprimer $dp[i][j]$ en fonction de $dp[i][j-1]$ dans le cas où $w_j > i$.
````

$dp[i][j] = dp[i][j - 1]$

````{admonition} Question
 Supposons $w_j \leq i$. Donner une formule de récurrence sur $dp[i][j]$, en distinguant le cas où l'objet $j$ est choisi et le cas où il ne l'est pas.
````

$dp[i][j] = \max{(dp[i][j - 1], v_j + dp[i - w_j][j - 1])}$

````{admonition} Question
 En déduire une fonction `prog_dyn(c, w, v)` qui renvoie la valeur maximum que l'on peut mettre dans un sac de capacité $c$, en ne considérant que les $j$ premiers objets, en remplissant une matrice `dp` de taille $(c+1) \times (n+1)$.
````

In [16]:
def prog_dyn(c, w, v):
    dp = [[0]*(len(w) + 1) for _ in range(c + 1)]
    for i in range(c + 1):
        for j in range(1, len(w) + 1):
            if w[j - 1] > i:
                dp[i][j] = dp[i][j - 1]
            else:
                dp[i][j] = max(dp[i][j - 1], v[j - 1] + dp[i - w[j - 1]][j - 1])
    return dp[c][len(w)]

In [17]:
prog_dyn(10, [5, 4, 7], [4, 4, 6])

8

## Comparaison

````{admonition} Question
 Écrire une fonction `genere_instance()` qui renvoie un triplet $(c, w, v)$, où $c$ est un entier aléatoire entre 1 et 1000 et $w$, $v$ sont des listes de 100 entiers aléatoires entre 1 et 100.  
On importera `random` pour utiliser `random.randint(a, b)` qui génère un entier aléatoire entre $a$ et $b$ inclus.
````

In [18]:
from random import randint
from time import time_ns as time

def generate_instance():
    w, v  = [randint(1, 100) for _ in range(100)], [randint(1, 100) for _ in range(100)]
    c = randint(1, 1000)
    return c, w, v

````{admonition} Question
 Afficher, pour chaque stratégie gloutonne (ordre de poids, ordre de valeur, ordre de ratio), l'erreur commise par rapport à la solution optimale, en moyennant sur 100 instances générées par `genere_instance()`.  
Quelle stratégie gloutonne est la plus efficace ?
````

In [19]:
def comparaison_value(method, tries):
    error = 0
    for _ in range(tries):
        c, w, v = generate_instance()
        optimal_solution = prog_dyn(c, w, v)
        method_solution = method(c, w, v)
        error += optimal_solution - method_solution
    average_error = error / tries
    print(f"L'erreur de la strategie {method.__name__} par rapport à la solution optimale (moyenne sur {tries} essai(s)) est : {average_error}")
    return average_error

tries = 10
for method in [glouton, glouton_poids, glouton_valeur, glouton_ratio]:
    error = comparaison_value(method, tries)
        

L'erreur de la strategie glouton par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 1180.9
L'erreur de la strategie glouton_poids par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 298.9
L'erreur de la strategie glouton_valeur par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 898.6
L'erreur de la strategie glouton_ratio par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 5.3


````{admonition} Question
 Comparer le temps total d'exécution de la stratégie gloutonne par ratio et de la programmation dynamique, sur 100 instances générées par `genere_instance()`. On pourra importer `time` et utiliser `time.time()` pour obtenir le temps actuel en secondes.
````

In [24]:
def comparaison_time(method, tries):
    sum_time = 0
    for _ in range(tries):
        c, w, v = generate_instance()
        time_method = time()
        method(c, w, v)
        time_method = time() - time_method
        sum_time += time_method
    average_time = sum_time / tries
    print(f"Le temps d'execution de la strategie {method.__name__} par rapport à la solution optimale (moyenne sur {tries} essai(s)) est : {average_time:.2} ns")
    return average_time

tries = 10
for method in [glouton, glouton_poids, glouton_valeur, glouton_ratio, prog_dyn]:
    error = comparaison_time(method, tries)

Le temps d'execution de la strategie glouton par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 6.2e+03 ns
Le temps d'execution de la strategie glouton_poids par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 4.2e+04 ns
Le temps d'execution de la strategie glouton_valeur par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 4e+04 ns
Le temps d'execution de la strategie glouton_ratio par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 3.9e+04 ns
Le temps d'execution de la strategie prog_dyn par rapport à la solution optimale (moyenne sur 10 essai(s)) est : 8.7e+06 ns


## Obtenir la liste des objets choisis

````{admonition} Question
 Réécrire la fonction `prog_dyn(c, w, v)` pour qu'elle renvoie la liste des objets choisis. Pour cela, on peut construire la matrice `dp` et remarquer que :  
- si $dp[i][j] = dp[i][j-1]$, alors l'objet $j$ n'est pas choisi ;
- si $dp[i][j] = dp[i - w_j][j - 1] + v_j$, alors l'objet $j$ est choisi.  
On peut donc construire la liste des objets choisis en remontant la matrice `dp` à partir de la case $(c, n)$.
````

In [21]:
def prog_dyn_obj(c, w, v):
    dp = [[0]*(len(w) + 1) for _ in range(c + 1)]
    for i in range(c + 1):
        for j in range(1, len(w) + 1):
            if w[j - 1] > i:
                dp[i][j] = dp[i][j - 1]
            else:
                dp[i][j] = max(dp[i][j - 1], v[j - 1] + dp[i - w[j - 1]][j - 1])
    objects_taken = []
    current_value = c
    for j in reversed(range(len(w) + 1)):
        if not (dp[current_value][j] == dp[current_value][j - 1]):
            current_value -= w[j - 1]
            objects_taken.append(j - 1)
    return objects_taken

In [25]:
prog_dyn_obj(10, [5, 4, 7], [4, 4, 6]) 
# la solution optimale consiste à choisir les objets 1 et 0

[1, 0]